一个开源项目发布了专注于链接级别元数据提取和聚合的数据库,包含页面标题、描述、发布日期、缩略图等丰富信息。该数据库旨在提供可重用、可检查的元数据集,适用于RSS分析、新闻研究、链接腐烂分析等实验。资源在GitHub上公开获取,包括2025年版本及往年数据,为AI、数据科学和前沿技术研究提供关键数据基础,助力大规模分析创新。
原文链接:Hacker News
一个开源项目发布了专注于链接级别元数据提取和聚合的数据库,包含页面标题、描述、发布日期、缩略图等丰富信息。该数据库旨在提供可重用、可检查的元数据集,适用于RSS分析、新闻研究、链接腐烂分析等实验。资源在GitHub上公开获取,包括2025年版本及往年数据,为AI、数据科学和前沿技术研究提供关键数据基础,助力大规模分析创新。
原文链接:Hacker News
评论前必须登录!
立即登录 注册