纽约大学商学院教授发现学生利用LLM完成作业的能力与实际理解能力存在巨大差距,创新使用ElevenLabs语音AI代理进行口试评估。该系统通过Claude、Gemini、ChatGPT组成’评议会’评分,成本仅15美元完成36名学生评估。AI评分比人类更严格,最短考试学生获最高分,系统还揭示了教学薄弱环节。尽管学生反映压力较大,但70%认可其能真实评估理解水平,为后LLM时代教育评估提供新思路。
原文链接:Hacker News
纽约大学商学院教授发现学生利用LLM完成作业的能力与实际理解能力存在巨大差距,创新使用ElevenLabs语音AI代理进行口试评估。该系统通过Claude、Gemini、ChatGPT组成’评议会’评分,成本仅15美元完成36名学生评估。AI评分比人类更严格,最短考试学生获最高分,系统还揭示了教学薄弱环节。尽管学生反映压力较大,但70%认可其能真实评估理解水平,为后LLM时代教育评估提供新思路。
原文链接:Hacker News
评论前必须登录!
立即登录 注册