葡萄牙政府投资550万欧元打造了AMÁLIA大模型,旨在捍卫欧洲葡萄牙语在AI时代的地位。该项目由顶尖高校联合研发,基于EuroLLM架构,虽在部分基准测试中表现出色,但遭到了业界的深度审视。批评指出,该项目自称“全开源”却未公开模型权重、数据及训练日志,且训练数据中明确的本土内容占比极低(约5.5%)。文章探讨了在构建特定语种或国家大模型时,如何平衡数据稀缺、文化深度与真正的开源透明度,为全球小语种AI发展提供了深刻反思。
原文链接:Hacker News
葡萄牙政府投资550万欧元打造了AMÁLIA大模型,旨在捍卫欧洲葡萄牙语在AI时代的地位。该项目由顶尖高校联合研发,基于EuroLLM架构,虽在部分基准测试中表现出色,但遭到了业界的深度审视。批评指出,该项目自称“全开源”却未公开模型权重、数据及训练日志,且训练数据中明确的本土内容占比极低(约5.5%)。文章探讨了在构建特定语种或国家大模型时,如何平衡数据稀缺、文化深度与真正的开源透明度,为全球小语种AI发展提供了深刻反思。
原文链接:Hacker News
评论前必须登录!
立即登录 注册