OpenAI的文本分类器悄悄停用:它们也分不清AI生成的内容了

141次阅读

机器之能报道

编辑:梓文

OpenAI 停用 AI 分类器。

今年 1 月 31 日 OpenAI 发布的 AI 分类器已于 7 月 20 日悄悄停用。

OpenAI 没有发布宣布该消息的新公告,而是在曾经发布 AI 分类器的网页上加入了一段它不可再用的文字。

图源:https://openai.com/blog/new-ai-classifier-for-indicating-ai-written-text

OpenAI 表示,AI 分类器停止使用是因为它的准确率太低。他们将致力于研究更加有效识别文本来源的技术,并承诺开发、部署判断音频或视频内容是否是 AIGC 的机制。

再也无「盾」抵「长矛」

有网友调侃,OpenAI 不仅致力于识别 AI 内容,还致力于让 AI 内容更像人类。这两件矛盾的事情,原本就是很难达到平衡的。不过 OpenAI 的终于在数据面前卸下了最后的「倔强」,它的「盾」,终究是被破了。

其实,在 AI 分类器刚发布时,OpenAI 就已经说明了它的不可靠性。

最初,AI 分类器在英语文本「挑战集」的评估中,分类器正确地将 26% 的 AI 编写的文本识别为「可能是人工智能编写的」,而 9% 的情况下将人工编写的文本错误标记为 AI 编写的文本。AI 分类器的可靠性通常随着输入文本长度的增加而提高。与之前发布的分类器相比,这款分类器在处理来自最新人工智能系统的文本时可靠性明显提高。

并且该 AI 分类器的局限性极大,OpenAI 不将其定义为主要的决策工具,而是一种确定来源的补充方法。因为:

1. 分类器在短文本(低于 1000 个字符)上非常不可靠,甚至更长的文本有时也会被分类器错误标记。

2. 有时,人类编写的文本会被分类器错误地标记为 AI 编写。

3. 建议仅对英文文本使用分类器。它在其他语言中的表现明显更差,并且在代码上不可靠。

4. 无法可靠地识别非常可预测的文本。例如,无法预测前 1,000 个质数的列表是由 AI 还是人类编写的,因为正确答案总是相同的。

5. AI 编写的文本可以通过编辑来躲避分类器。分类器可以根据成功的攻击进行更新和重新训练,但不清楚检测是否具有长期优势。

6. 众所周知,基于神经网络的分类器在训练数据之外的校准能力很差。对于与训练集中的文本有很大差异的输入,分类器有时会非常自信地做出错误预测。

以上这些信息说明,OpenAI 的 AI 分类器这个「盾」其实本就不够坚固。现在它因为准确率的进一步降低,已经在辨别文本类 AIGC 上发挥不了作用而被停用。

这意味 AI 输出的文本内容已经与人类已经十分相似,分辨难度也从「高级」变为了「地狱级」。

同样,当 AI 生成的音频和音频也与人类产出难以区分时,我们又该如何应对?

如何识别 AI 内容成为难题

毕业季刚刚过去,毕业生终于卸下了毕业论文的重担,准备奔赴社会。但与往年不同的是,今年许多毕业论文的「第二作者」其实是 GPT。

今年 3 月,上海市教育委员会副主任倪闽景曾谈到 GPT 对于教育的影响,他说道:「ChatGPT 把教育逼到了墙角」。

这是什么原因导致的?

OpenAI 创建的 GPT 成为强大的工具。它不仅可以帮助人们快速了解某一方面知识、提供相应的行动思路,还能生成逻辑严密的长文,甚至能够不断对输出内容进行润色。这对于教育行业而言,可喜却又可忧。喜的是效率提高,学生能够站在 GTP 的「肩膀」上有更多成长,忧的是成长的只有 GPT,而非人类自己。

早在去年 12 月上旬,洛杉矶联合学区就暂停了对 ChatGPT 网站的访问,自此国外院校不断加入该行列,推进 ChatGPT 的禁用。国内虽未有严令禁止的条例,但是各高校也在论文写作上不同程度地限制了对 GPT 的使用。

不止校内,校外禁止 GPT 参与的行为也比比皆是。尤其是各种期刊。如 Nature 在去年 12 月发文表达了对 ChatGPT 沦为学生代写论文工具的担忧,继而在 1 月底下场,针对 ChatGPT 代写学研文章、列为作者等系列问题作出了规定,ChatGPT 和其他任何 LLM 工具都不可以成为论文作者。

但这些措施或许并未真正起效,因为 AIGC 的识别难度太高。

今年四月,iParadigms 研发出 Turnitin 检测 AI 写作系统已被墨尔本大学、新南威尔士大学等高校采用。

据 Turnitin 6 月发布的统计,在该系统发布的两个月内检测过的 6500 万篇论文中,有 210 万篇文章中 AI 写作内容达 80%,670 万篇论文中 AI 写作内容达 20%。这个数据说明 AI 写作几乎已经全面入侵了教育、学术领域。

那么这个可以检测 AI 内容的 Turnitin 是教育者们新的「救命稻草」吗?答案是否定的。

虽然 Turnitin 可以通过一定技术分析文本片段,并评判在文章内 AI 生成内容所占比例。但 Turnitin 官网也表示,其 AI 写作检测并不总是准确的。Turnitin 首席产品官提示,鉴于 AI 书写检测中的误报,教师要综合专业经验和对学生的了解进行判断。

至于 Turnitin 未来会不会与 OpenAI 的 AI 分类器殊途同归,就等待时间来验证吧。

在留言区留下你的想法吧。

参考链接:

https://decrypt.co/149826/openai-quietly-shutters-its-ai-detection-tool

https://baijiahao.baidu.com/s?id=1756709397637388684&wfr=spider&for=pc

Turnitin AI detection feature reviews more than 65 million papers | Turnitin (https://www.turnitin.com/press/turnitin-ai-detection-feature-reviews-more-than-65-million-papers?utm_source=twitter&utm_medium=organic&utm_campaign=communications)

© THE END

转载请联系本公众号获得授权

投稿或寻求报道:content@jiqizhixin.com

原标题:《OpenAI 的文本分类器悄悄停用:它们也分不清 AI 生成的内容了》

(本文来自澎湃新闻,更多原创资讯请下载“澎湃新闻”APP)

原文链接:https://m.thepaper.cn/kuaibao_detail.jsp?contid=23997902

正文完
 
不知道
版权声明:本站原创文章,由 不知道 2023-08-02发表,共计2615字。
转载说明:声明:本站内容均来自互联网,归原创作者所有,如有侵权必删除。 本站文章皆由CC-4.0协议发布,如无来源则为原创,转载请注明出处。