针对现有手机 GUI Agent(如 AutoGLM)依赖小模型导致的逻辑短板,开发者提出了一种创新的混合架构。该方案利用 Claude Code/Codex 作为高层“大脑”负责任务拆解、异常处理与决策,而让手机端的 GUI 小模型专注于底层屏幕识别与控件操作。这种“云端大模型 + 端侧小模型”的协同模式,成功实现了跨应用的长程规划与复杂流程编排。项目已在 GitHub 开源,并展示了微信舆情监控、购物比价等实用场景,为解决端侧 AI 算力与智能度的矛盾提供了极具参考价值的路径。
原文链接:Linux.do

IT资源栈
评论前必须登录!
立即登录 注册