以AI制AI:ElevenLabs语音代理实现大规模口试

纽约大学商学院教授发现学生利用LLM完成作业的能力与实际理解能力存在巨大差距,创新使用ElevenLabs语音AI代理进行口试评估。该系统通过Claude、Gemini、ChatGPT组成’评议会’评分,成本仅15美元完成36名学生评估。AI评分比人类更严格,最短考试学生获最高分,系统还揭示了教学薄弱环节。尽管学生反映压力较大,但70%认可其能真实评估理解水平,为后LLM时代教育评估提供新思路。

原文链接:Hacker News

相关阅读

  • 暂无文章

抢沙发

评论前必须登录!

立即登录   注册