蚂蚁健康开源医疗大模型:百亿参数高效推理

蚂蚁健康等团队近日开源医疗语言模型AntAngelMed,采用基于Ling-flash-2.0的MoE架构,总参数100B,激活参数仅6.1B,在H20芯片上推理速度超200 tokens/s,支持128K上下文。模型通过三阶段训练——医疗语料持续预训练、高质量指令精调和GRPO强化学习,具备强大医学知识、复杂诊疗推理能力及安全伦理对齐。适用于临床复杂病例分析和日常健康问答,资源已发布至HuggingFace、ModelScope和GitHub平台,并提供FP8量化版本优化资源使用。

原文链接:Linux.do

抢沙发

评论前必须登录!

立即登录   注册