东莞市2025年工业AI应用创新挑战“百景大赛”

赛题公示

15.国内内容版权侵权智能监控与报告

国内内容版权侵权智能监控与报告

一、项目背景

对于国内的内容创作者、媒体机构和品牌而言，其创作的文字、图片、视频等数字内容极易被盗用和侵权。人工巡查效率低下且难以覆盖全网。通过自动化爬取国内主要内容平台和社交媒体，结合大模型进行内容比对和相似度分析，可以实现对自身版权的实时监控，并快速定位侵权行为，为维权提供证据。

二、项目需求

开发一个AI驱动的版权侵权监控系统，能够自动爬取国内主要内容平台（如微信公众号、知乎、微博、Bilibili、抖音、今日头条等）上发布的文字、图片或视频信息。利用大模型对用户输入的原创内容进行智能比对，识别高度相似或直接盗用的内容，并生成详细的侵权报告。

三、输入数据

• 企业/创作者的原创内容（文本、图片URL、视频URL或描述）

• 关注的国内主要内容平台URL列表

• 内容发布时间范围（可选）

四、交付要求

• Web应用或插件

• 功能：

a. 多平台内容数据自动化抓取与索引

b. 大模型驱动的文本相似度检测、图片/视频特征比对（基于描述或元数据）

c. 生成：1）潜在侵权内容列表（含侵权链接、部分内容摘要、相似度评分）；2）侵权类型（如文字抄袭、图片盗用）分析；3）建议的维权路径（如平台投诉入口、证据收集）。

五、评测要求

• 控制并发，谨慎引起服务器超载，符合平台法律规定

• 侵权内容识别的合理性：能够有效发现明显的抄袭或盗用行为

• 报告生成时间：单次任务运行时间：≤1小时