Grok 惊艳的网页截图功能引发热议,GPT 与 Claude 为何尚未跟进?

近日,有开发者在社区热议 Grok 独特的网页交互功能。与 ChatGPT 和 Gemini 仅提取文本摘要不同,Grok 展示了直接抓取第三方网页并在输出中嵌入可视化“快照”的能力。这种“所见即所得”的信息整合方式,不仅大幅提升了用户获取信息的效率,也引发了关于 AI Agent 如何更高效、准确地处理网络信息的讨论。目前看来,这一特性在 Claude、Gemini 等主流竞品中尚未完全实现,其背后可能涉及多模态渲染引擎与实时浏览器集成的技术壁垒。

原文链接:Linux.do

抢沙发

评论前必须登录!

立即登录   注册