2025社区审核实战:AI生成导致涉政梗图激增,传统云防御面临失效风险

这篇来自热门小众社区的2025年内容安全年报揭示了AI技术对内容审核的严峻挑战。该社区每月处理35亿次HTTPS请求,采用阿里云OSS与自研小模型进行双重审核。数据显示,全年仅发生29次文字预警,但图片违规删除量高达38万次。最引人注目的是,下半年出现了大量初审通过但被复审拦截的违规图片,且100%涉及政治隐喻。报告指出,生成式AI的普及让用户能轻易批量生产此类新型违规内容,导致即便在活跃度不高的社区,此类内容的刻意传播也日益频繁,暴露了现有云审核技术在对抗AI生成隐喻时的滞后性。

原文链接:V2EX 分享发现

抢沙发

评论前必须登录!

立即登录   注册