GPT o1-preview 生成的内容能否被检测出来?

OpenAI 2024年9月发布的GPT o1-preview虽推理能力更强,但Originality.ai对其生成文本的检测准确率仍达91.66%–94.47%,远超GPTZero的56.88%;其三大检测模型正持续优化,目标准确率将突破99%。

发布于2024年9月21日 08:21
编辑零重力瓦力
评论0
阅读31

GPT o1-preview 生成的内容能否被检测出来?

作者:Jonathan Gillham (Originality.ai 创始人、CEO)
原文链接:https://originality.ai/blog/is-gpt-o1-content-detectable

2024 年 9 月, OpenAI 发布了新一代 AI 模型 GPT o1-preview。本文简要研究了 Originality.ai 在检测 GPT-o1 生成文本方面的准确性。

OpenAI 推出了一系列新的AI模型,这些模型在响应前会花更多时间思考 GPT o1-preview。根据 OpenAI 的描述,该模型可以推理复杂任务,并在科学、编程和数学等领域解决比以前模型更难的问题。

由于新模型经过推理轨迹训练,可以在回答前进行深入思考,因此在某些领域表现更佳。为了维护网上文本内容的真实性和完整性,我们也需要更强大的 AI 内容检测器。

本研究简要分析了 1000 个GPT o1-preview 生成的文本样本,以测试 Originality.ai 的 AI 检测器是否能检测出 GPT o1-preview。

简要总结 GPT o1-preview 生成的 AI 内容可被检测吗?

  • GPT o1 生成的文本可被高度准确地检测出来
  • Originality.ai 的 3 个模型检测准确率分别为:3.0.0 Turbo: 93.47%、1.0.0 Lite: 91.66%、2.0.1 Standard: 94.47%
  • 相比之下,GPTZero 在检测 "改写人类文本" 样本时表现欠佳,而 Originality.ai 仍展现出强大的 AI 检测能力
  • 检测准确率将很快提升至 99% 以上

数据集

我们准备了 1000 个 GPT o1-preview 生成的文本样本来评估其可检测性。生成方法包括:

  1. 重写提示:第一种方法是向模型提供自定义提示和参考文章(可能是由语言模型生成的),让它重写内容(450个样本)。
  2. 重写人工文本:第二种方法是生成内容,目的是探究 AI 重写人工文本是否能绕过 AI 检测。这部分样本来自一个开源数据集(325个样本)。
  3. 从零开始写文章:第三种方法是基于从虚构到非虚构的各种主题(如历史、医学、心理健康、内容营销、社交媒体、文学、机器人、未来等)从头开始生成的文章(225个样本)。

评估

为评估有效性,我们使用了我们发布的开源AI检测有效性工具

Originality.ai有三个用于AI文本检测的模型:3.0.0 Turbo、2.0.1 Standard,和1.0.0 Lite。

  • 3.0.0 Turbo:如果你对 AI 的容忍度为零!该模型旨在识别任何对 AI 使用,即使是轻度使用。
  • 2.0.1 Standard:一个平衡的模型,如果你可以接受轻微使用 AI (如AI编辑),这是一个很好的选择。
  • 1.0.0 Lite:如果你允许轻度 AI 编辑 (如Grammarly的拼写或语法建议)。

这几款开源测试工具为每个测试返回多种指标,每个指标报告该检测结果的不同方面,包括:

  • 敏感度(真正率 True Positive Rate):正确识别 AI 的比例
  • 特异度(真负率 True Negative Rate):正确识别人类文本的比例
  • 准确率:预测正确的总体比例
  • F1值:特异度和精确度的调和平均数

评估结果

使用 1.0.0 Lite 模型在仅含 AI 数据集上的混淆矩阵
使用 1.0.0 Lite 模型在仅含 AI 数据集上的混淆矩阵

使用 2.0.1 Standard 模型在仅含 AI 数据集上的混淆矩阵
使用 2.0.1 Standard 模型在仅含 AI 数据集上的混淆矩阵

使用 3.0.0 Turbo 模型在仅含 AI 数据集上的混淆矩阵
使用 3.0.0 Turbo 模型在仅含 AI 数据集上的混淆矩阵

Originality.ai 的三个模型在检测 GPT o1-preview 内容方面表现出色:

  • 1.0.0 Lite: 真正率 91.66%
  • 2.0.1 Standard: 真正率 94.47%
  • 3.0.0 Turbo: 真正率 93.47%

使用 GPTZero 模型在仅含 AI 数据集上的混淆矩阵

使用 GPTZero 模型在仅含 AI 数据集上的混淆矩阵

相比之下,GPTZero的表现较差:真正率仅为 56.88%

四个模型结果对比

工具 F1 准确率 TPR
Originality Turbo 97% 93% 93%
Originality Standard (2.0.1) 97% 94% 94%
Originality Lite 96% 92% 92%
GPTZero 73% 57% 57%

最终思考

总的来说,Originality.ai 继续展示出杰出的识别 AI 生成内容的能力,包括最新发布的AI模型,如OpenAI的 o1-preview、GPT-4o 和 GPT-4o-mini。

Originality.ai 的每个 AI 检测模型都能以很高的准确率检测 GPT-o1,从3.0.0 Turbo 的 93.47 % 到 2.0.1 Standard 的 94.47 %,以及 1.0.0 Lite 的 91.66 %。我们的机器学习工程师正在继续提高准确率至 99 % 以上,这与 OpenAI 发布的大多数新模型一样。

相关文章

一段代码让网站出海,这个 AI 翻译工具把多语言 SEO 玩明白了
AI 产品工具
2026年6月1日
0 条评论
小创

一段代码让网站出海,这个 AI 翻译工具把多语言 SEO 玩明白了

跨境电商网站常因语言壁垒导致高跳出率。Weglot 是一款 AI 翻译工具,仅需几分钟即可通过添加脚本实现网站多语言本地化,且保持原有排版。该工具支持可视化编辑、术语表锁定及团队协作,便于后续维护。同时,它能自动优化 hreflang 标签、独立 URL 及元数据,解决多语言 SEO 难题。借助母语内容布局小语种市场,企业可以低成本获取流量红利,有效提升海外转化率。

阅读全文
SCOPE 给 AI 绘画装上了 “语义追踪器”,复杂提示词终于不用反复抽卡了
AI 产品工具
2026年6月1日
0 条评论
零重力瓦力

SCOPE 给 AI 绘画装上了 “语义追踪器”,复杂提示词终于不用反复抽卡了

中科大团队发布 SCOPE 框架,通过结构化语义规格解决 AI 绘画中复杂提示词语义丢失问题。该系统将提示词拆解为实体、约束及未知项,构建包含分解、合成、生成、验证的四步循环,并辅以检索、推理和修复技能,实现生成过程全程可追溯与精准修复。团队还推出 Gen-Arena 评测基准及 EGIP 指标。实验显示 SCOPE 在多项基准中表现优异,为多元素控制场景提供了工程化解决方案,代码已开源。

#AI 绘画
阅读全文
Stable Audio 3.0 发布:开源音频生成从 11 秒走到 6 分钟
AI 产品工具
2026年5月28日
0 条评论
零重力瓦力

Stable Audio 3.0 发布:开源音频生成从 11 秒走到 6 分钟

Stability AI 发布开源音频模型 Stable Audio 3.0,最长可生成 6 分 20 秒立体声音频。该模型采用 SAME 架构实现 4096 倍压缩,支持变量长度生成与局部编辑,Small 版本可在移动端离线运行。训练数据均获授权,规避版权风险。提供四个变体及 LoRA 微调文档,社区许可允许商用。此次升级标志着开源音频生成从短音效迈向完整歌曲创作,为开发者提供了本地化、合规的高质量音频生成方案。

#开源模型#AI 音乐
阅读全文
互动讨论

评论区

围绕《GPT o1-preview 生成的内容能否被检测出来?》展开交流,未登录用户可浏览评论,登录后可参与讨论。

评论数
0
登录后参与评论
支持发表观点与回复一级评论,互动后将同步到消息中心。
登录后评论
暂无评论,欢迎成为第一个参与讨论的人。