开发者发布开源小红书 AI Agent Skill,支持智能体读取笔记与用户数据

近日,一位开发者在 V2EX 社区分享了一款名为“小红书 Skill”的开源工具,旨在通过安全认证机制让 AI Agent(如 Claude)能够访问小红书平台数据。该项目基于 sig 认证工具构建,这是一个旨在帮助 AI 智能体安全提取并管理 Cookie 和 Token 的中间件。
由于小红书官方并未提供完善的开源 CLI 或 SDK,作者选择了社区内较为成熟的 Python 爬虫方案 Spider_XHS 作为底层核心。该方案利用 PyExecJS 运行官方的 JavaScript 逻辑来处理签名验证,从而绕过反爬机制。在此基础上,作者将其封装为 sig 的 Skill 模块,实现了对小红书数据读取功能的 AI Agent 化调用。
目前,该工具仅支持“读”操作,具体功能包括根据关键词搜索笔记、查看笔记详情、读取评论区、浏览用户资料及历史笔记,以及获取首页推荐流等。出于风控考虑及开发精力限制,涉及交互的“写”操作(如发布笔记、点赞、关注等)暂时未实现。作者特别提醒,由于频繁请求会触发平台风控(如 API_ERROR 461),使用者需注意控制调用频率。技术实现上,用户通过 npm 安装 sig 框架后,配置 Python 环境,并在首次使用时通过浏览器扫码登录,即可通过命令行接口将数据传递给 AI 智能体处理。

事件分析

从技术视角审视,该项目展示了 AI Agent 生态中解决“数据孤岛”问题的一种典型模式。在缺乏官方 API 支持的情况下,开发者通过将现有的逆向工程成果(爬虫)与标准化的认证管理框架(sig)结合,有效地为 LLM 赋予了访问封闭互联网服务的能力。
这种“Connectors”或“Skills”层的开发,正在成为 AI 应用层的关键竞争点。它不仅是简单的接口封装,更涉及会话保持、签名算法对抗以及风控策略规避等复杂工程挑战。此类开源项目的涌现,标志着开发者社区正在积极弥补通用大模型在垂直场景数据获取上的短板。
然而,依赖非官方接口也带来了显著的不稳定性风险。平台一旦更新反爬策略(如 JS 混淆或设备指纹检测),此类 Skill 可能迅速失效。长期来看,这可能会促使市场倒逼互联网平台开放更安全的 MCP 协议支持,或者推动 Agent 开发向拥有数据主权的私有化部署方向迁移。

💡 核心观点:非官方 API 的生态繁荣反映了通用 AI 智能体对高质量垂直数据的迫切需求,在平台未开放前,此类中间层工具将是填补数据鸿沟的必经之路。

原文链接:V2EX 分享发现

相关阅读

  • 暂无文章

抢沙发

评论前必须登录!

立即登录   注册