Stanford 大学 Jurafsky 和 Manning 团队发布新论文,提出用“Tversky 投射层”替代神经网络中传统的 Linear 层。研究指出,现有深度学习基于几何相似度的对称性假设不符合人类认知的“不对称性”。该团队将心理学中的 Tversky 相似度转化为可微算子,实现了即插即用的替换方案。实验显示,新层能直接模拟 XOR 等非线性函数,并在 GPT-2 测试中将参数量减少了 34.8%,同时将困惑度降低了 7.8%。这一突破为设计具有心理学可解释性的神经网络提供了全新范式。
原文链接:Linux.do

IT资源栈
评论前必须登录!
立即登录 注册