开源资讯
每一个新动态都是尊龙凯时 - 人生就是搏!向前迈进的新脚步

尊龙凯时人生就是搏!精准识别AI生成内容:|包卜nba录像|让AI“识破”AI

2025-08-29

  本报讯(中青报·中青网记者 胡春艳 通讯员 高雨桐)近日ღ★✿★,OpenAI发布新一代人工智能模型GPT-5ღ★✿★,再次引发全球关注ღ★✿★。随着DeepSeekღ★✿★、ChatGPTღ★✿★、通义千问ღ★✿★、豆包等AIGC国产大模型逐渐变成人们学习包卜nba录像ღ★✿★、工作中的“生产力工具”ღ★✿★,其伴生问题也日益凸显ღ★✿★:AI经常会“一本正经地胡说八道”ღ★✿★,生成看似合理的虚假信息ღ★✿★,即“AI幻觉”ღ★✿★;依赖AI工具代写作业甚至毕业论文ღ★✿★,冲击着学术诚信和规范ღ★✿★;论文AI率检测系统有待完善ღ★✿★,论文被误判的问题时有发生……如何精准识别AI生成内容尊龙凯时人生就是搏!ღ★✿★,成为亟待解决的热点问题ღ★✿★。

  近日尊龙凯时人生就是搏!ღ★✿★,南开大学计算机学院媒体计算实验室取得最新研究成果ღ★✿★,不仅从评估的角度揭示了现有AI检测方法的性能不足ღ★✿★,还创新性地提出了“直接差异学习”优化策略ღ★✿★,教会AI用“火眼金睛”辨别人机不同ღ★✿★,实现AI检测性能的突破ღ★✿★。相关成果论文已被计算机多媒体领域国际顶级会议ACM MM2025接收ღ★✿★。

  多项研究表明ღ★✿★,现有检测方法在应对复杂的现实场景时常显不足ღ★✿★。此前曾有媒体报道ღ★✿★,《荷塘月色》《流浪地球》等作品被某常用论文AI率检测系统检出高AI率包卜nba录像ღ★✿★。

  为何现有的AI检测工具会“误判”?论文第一作者ღ★✿★、南开大学计算机学院计算机科学卓越班2023级本科生付嘉晨解释ღ★✿★:“如果把AI文本检测比作一场考试ღ★✿★,检测器的训练数据等同于日常练习题ღ★✿★,现有检测方法是机械刷题ღ★✿★、死记硬背答题的固定套路ღ★✿★,难以学会答题逻辑ღ★✿★,一旦遇到全新难题ღ★✿★,准确率就会显著下降ღ★✿★。”

  “要想实现通用检测ღ★✿★,理论上需收集所有大模型的数据进行训练ღ★✿★,但在大模型迭代飞速的今天几乎不可能ღ★✿★。”付嘉晨说ღ★✿★,让检测器真正学会举一反三ღ★✿★,即提升检测器的泛化性能ღ★✿★,是提升AI文本检测性能的关键ღ★✿★。

  为此ღ★✿★,研究团队另辟蹊径ღ★✿★,通过直接优化模型预测的文本条件概率差异与人为设定的目标值之间的差距ღ★✿★,帮助模型学习AI文本检测的内在知识ღ★✿★,可以精准捕捉人机文本间的深层语义差异包卜nba录像ღ★✿★,从而大幅提升检测器的泛化能力与鲁棒性ღ★✿★。

  “我们的检测器如同有了‘火眼金睛’ღ★✿★,即便只‘学习’过DeepSeek-R1的文本ღ★✿★,也能精准识别像GPT-5这样最新大模型生成的内容ღ★✿★。”付嘉晨说ღ★✿★。

  团队还提出了一个全面的测试基准数据集MIRAGEღ★✿★,使用13种主流的商用大模型(如豆包ღ★✿★、DeepSeek尊龙凯时人生就是搏!ღ★✿★、Kimi等)以及4种先进的开源大模型(如Qwen等)ღ★✿★,从AI生成ღ★✿★、润色ღ★✿★、重写三个角度构造了接近10万条人类-AI文本对ღ★✿★。

  “MIRAGE是目前唯一聚焦于对商用大语言模型检测的基准数据集尊龙凯时人生就是搏!ღ★✿★。直观地说ღ★✿★,之前的基准数据集是由少而且能力简单的大模型命题出卷尊龙凯时人生就是搏!ღ★✿★,而MIRAGE是17个能力强大的大模型联合命题ღ★✿★,形成一套高难度又有代表性的检测试卷包卜nba录像ღ★✿★。”论文通讯作者ღ★✿★、南开大学计算机学院副教授郭春乐说ღ★✿★。

  MIRAGE的测试结果显示ღ★✿★,现有检测器的准确率从在简单数据集上的90%骤降至约60%ღ★✿★;而使用团队的检测器仍保持85%以上的准确率ღ★✿★。与斯坦福大学提出的DetectGPT相比ღ★✿★,性能相对提升71.62%ღ★✿★;与马里兰大学ღ★✿★、卡内基梅隆大学等共同提出的Binoculars方法相比ღ★✿★,性能相对提升68.03%ღ★✿★。

  “AIGC发展日新月异ღ★✿★,我们将持续迭代升级评估基准和技术ღ★✿★,致力于实现更快ღ★✿★、更准ღ★✿★、更低成本的AI生成文本检测ღ★✿★,以AI之力ღ★✿★,让每一篇成果更出彩ღ★✿★。”研究团队负责人包卜nba录像ღ★✿★、南开大学计算机学院教授李重仪说ღ★✿★。人工智能AI人工应用ღ★✿★!尊龙凯时官方网站ღ★✿★。自动化前景ღ★✿★,尊龙凯时appღ★✿★。AI解决方案ღ★✿★。尊龙凯时人生ღ★✿★。