OpenAI官方推出AI生成内容识别器,但成功率只有26%,网友:还不如论文查重工具-当前观点
2023-02-02 12:00:22 来源:机器之心


(资料图片仅供参考)

机器之心报道 编辑:泽南、杜伟
识别 ChatGPT 生成的内容,OpenAI 亲自上阵了。
很多人也许已经忘记,ChatGPT 正式发布时间是去年 11 月底,到现在才刚刚两个月,但它掀起的热潮却已引发科技公司纷纷跟进,催生了独角兽创业公司,还让学术界修改了论文接收的要求。 在 ChatGPT 引发 AI 领域「是否要禁用」大讨论之后,OpenAI 的真假鉴别工具终于来了。 1 月 31 日,OpenAI 官宣了区分人类作品和 AI 生成文本的识别工具上线,该技术旨在识别自家的 ChatGPT、GPT-3 等模型生成的内容。然而分类器目前看起来准确性堪忧:OpenAI 在博客里指出 AI 识别 AI 高置信度正确率约为 26%。但该机构认为,当它与其他方法结合使用时,可以有助于防止 AI 文本生成器被滥用。 「我们提出分类器的目的是帮助减少人工智能生成的文本造成的混淆。然而它仍然有一些局限性,因此它应该被用作其他确定文本来源方法的补充,而不是作为主要的决策工具,」OpenAI 发言人通过电子邮件对媒体介绍道。「我们正通过这个初始分类器获取有关此类工具是否有用的反馈,并希望在未来分享改进的方法。」 最近科技领域随着围绕生成式 AI,尤其是文本生成 AI 的热情正在不断增长,但相对的是人们对于滥用的担忧,批评者呼吁这些工具的创造者应该采取措施减轻其潜在的有害影响。 面对海量的 AI 生成内容,一些行业立刻作出了限制,美国一些最大的学区已禁止在其网络和设备上使用 ChatGPT,担心会影响学生的学习和该工具生成的内容的准确性。包括 Stack Overflow 在内的网站也已禁止用户共享 ChatGPT 生成的内容,称人工智能会让用户在正常的讨论中被无用内容淹没。 这些情况突出了 AI 识别工具的必要性。虽然效果不尽如人意,但 OpenAI AI 文本分类器(OpenAI AI Text Classifier)在架构上实现了和 GPT 系列的对标。它和 ChatGPT 一样是一种语言模型,是根据来自网络的许多公开文本示例进行训练的。与 ChatGPT 不同的是,它经过微调可以预测一段文本由 AI 生成的可能性 —— 不仅来自 ChatGPT,也包括来自任何文本生成 AI 模型的内容。 具体来说,OpenAI 在来自五个不同组织(包括 OpenAI 自己)的 34 个文本生成系统的文本上训练了 AI 文本分类器。这些内容与维基百科中相似(但不完全相同)的人工文本、从 Reddit 上共享的链接中提取的网站以及为 OpenAI 文本生成系统收集的一组「人类演示」配对。 需要注意的是,OpenAI 文本分类器不适用于所有类型的文本。被检测的内容至少需要 1000 个字符,或大约 150 到 250 个单词。它没有论文检测平台那样的查重能力 —— 考虑到文本生成人工智能已被证明会照抄训练集里的「正确答案」,这是一个非常难受的限制。OpenAI 表示,由于其英语前向数据集,它更有可能在儿童或非英语语言书写的文本上出错。 在评估一段给定的文本是否由 AI 生成时,检测器不会正面回答是或否。根据其置信度,它会将文本标记为「非常不可能」由 AI 生成(小于 10% 的可能性)、「不太可能」由 AI 生成(在 10% 到 45% 之间的可能性)、「不清楚它是否是」AI 生成(45% 到 90% 的机会)、「可能」由 AI 生成(90% 到 98% 的机会)或「很有可能」由 AI 生成(超过 98% 的机会)。 看起来和图像识别的 AI 很像,除了准确程度。根据 OpenAI 的说法,分类器错误地将人类编写的文本标记为 AI 编写的文本的概率为 9%。 一番试用之后,效果的确不大行OpenAI 宣称其 AI 文本分类器的成功率约为 26%,一些网友上手试用之后,发现识别效果果然不行。 知名 ML 和 AI 研究人员 Sebastian Raschka 试用之后,给出了「It does not work」的评价。他使用其 2015 年初版的 Python ML 书籍作为输入文本,结果显示如下。 Randy Olson 的 foreword 部分被识别为 不清楚是否由 AI 生成(unclear)他自己的 preface 部分被识别为 可能由 AI 生成(possibly AI)第一章的段落部分被识别为 很可能由 AI 生成(likely AI)Sebastian Raschka 对此表示,这是一个有趣的例子,但自己已经为将来可能因离谱的论文识别结果而受到惩罚的学生感到难过了。 因此他提议,如果要部署这样的模型,请共享一个混淆矩阵。不然如果教育者采用这一模型进行评分,则可能会对现实世界造成伤害。此外还应该增加一些有关误报和漏报的透明度。 此外,Sebastian Raschka 输入了莎士比亚《麦克白》第一页的内容,OpenAI AI 文本分类器给出的结果竟然是很可能由 AI 生成。简直离谱! 还有人上传了 AI 写作工具 Easy-Peasy.AI 创作的内容,结果 OpenAI AI 文本分类器判定为由 AI 生成的可能性非常小。 最后,有人用上了反复翻译大法,把文本让 GPT3 重写一遍,也能骗过识别器。 总结一下的话就是正向识别不准,反向识别出错,也无法识破一些改论文的技巧。看来,起码在 AI 文本内容识别这一领域,OpenAI 还需努力。 参考内容:https://techcrunch.com/2023/01/31/openai-releases-tool-to-detect-ai-generated-text-including-from-chatgpt/https://openai.com/blog/chatgpt/

©THE END

转载请联系本公众号获得授权

投稿或寻求报道:content@jiqizhixin.com

OpenAI官方推出AI生成内容识别器,但成功率只有26%,网友:还不如论文查重工具-当前观点

2023-02-02

随行夹具_关于随行夹具的基本情况说明介绍 全球新资讯

2023-02-02

公私募机构热议全面注册制 精进投研能力 持续为投资者创造价值

2023-02-02

流感/口罩板块2月1日涨2.09%,汉王科技领涨,北向资金增持9.21亿元-天天快讯

2023-02-02

当前报道:手机APP教程篇:闲鱼买到假货怎么退款

2023-02-01

每日观察!长宁这两个家庭上榜上海“健康家风故事20佳”名单

2023-02-01

适合办公的笔记本电脑1000元左右_适合办公的笔记本

2023-02-01

义和团运动时间和经过_义和团运动时间_环球短讯

2023-02-01

快讯:安阳县(示范区)服务业规上企业节后开门红

2023-02-01

观焦点:中集集团布局电化学储能及二氧化碳储能、氢储能等多种储能技术

2023-02-01

环球热推荐:一月份制造业PMI等三大指数均升至扩张区间 我国经济景气水平明显回升

2023-02-01

环球热点!TheShy可以上场了!WBG官宣:Sofm正式转为LPL本土选手

2023-02-01

石英股份: 江苏太平洋石英股份有限公司关于第四期员工持股计划相关内容的更正公告

2023-01-31

2023 齐心聚力,扬帆启航 世界视讯

2023-01-31

南极电商2022年预亏2.4亿元至3.1亿元 股价跌3.51% 环球时讯

2023-01-31

天天热门:黔南州气象台发布大风蓝色预警信号【Ⅳ/一般】【2023-01-31】

2023-01-31

荣耀MagicOS与百度输入法成立“智慧人机交互”联合实验室

2023-01-31

温州市总工会升级技能竞赛智慧平台_观点

2023-01-31

全部有编!广州黄埔200+岗位等你来投,注意看报名时间|全球热资讯

2023-01-30

上机数控:2022年净利同比预增75%-93%

2023-01-30

我的语文老师300字日记_我的语文老师300字

2023-01-30

苏麻喇姑常年不洗澡,为什么康熙还那么宠爱她?原因让人十分意外 焦点短讯

2023-01-30

2023佛山南海元宵节传统民俗活动盘点(时间+地点)

2023-01-30

世卫更新应对辐射和核紧急情况关键药物清单,中方药物保供有何准备?

2023-01-30

GPT-3核心成员出走打造ChatGPT最强竞品!最新估值50亿美元|全球今日讯

2023-01-29

民生策略:钟摆的“一瞬”|全球热推荐

2023-01-29

厦门观音山元宵节活动(时间+地点+门票)|滚动

2023-01-29

集体用地建设房屋合同范本(优选11篇)

2023-01-29

哲科不停球凌空斩被扑,劳塔罗补射破门-全球今亮点

2023-01-29

天天微速讯:“春晚五大最烂节目”排名,你认可吗?

2023-01-28

干货 | 人脸识别技术的风险及应对方案

2023-01-28

贵州:春节假期60家重点监测旅游景区共接待游客299.21万人次

2023-01-28

《霍格沃兹 传承》主线需要40小时以上 全内容100小时-全球最新

2023-01-28

联合国:西方向乌提供多款主战坦克与和平背道而驰 天天热文

2023-01-27

十年建设,阿里巴巴杭州西溪全球总部2023年底前全面建成 全球短讯

2023-01-27

“真金白银”推进“两不停” 天天观速讯

2023-01-27

简直是哈登的最佳搭档!76人后场大闸真是太稳了?-全球微速讯

2023-01-26

北京“破五”63万人次去游园,超十分之一是奔这儿_焦点短讯

2023-01-26

环球新资讯:一战赚了 4550 亿,他可能是中国藏得最深的大老板了

2023-01-26

天天关注:古代书是指什么_就是普通的书本吗

2023-01-26

天生让男人疯狂的生肖女 最会撩异性的三个属相

2023-01-25

【新春走基层】我的岗位故事丨交警孙龙_天天观焦点

2023-01-25

天天速递!蚂蚁庄园今日课堂答题5月13日 蚂蚁庄园今日课堂答题最新答案

2023-01-25

热门看点:大余县气象台发布霜冻蓝色预警信号【IV级/一般】【2023-01-24】

2023-01-24

最美人梯!青岛英雄队长趴在冰冷刺骨海水中,连救8名游客

2023-01-24

坚守国门,护航“不打烊”|当前时讯

2023-01-24

当前速看:英媒:2023年全球经济乐观情绪上升

2023-01-23

当前焦点!这一电池巨头:2023年全年订单已排满!

2023-01-23

天天报道:你的新年愿望是什么?一起来听听他们的答案丨爱申活暖心春

2023-01-23

【同人文】蔷薇少女×守护甜心:逆行的时钟(2/5)

2023-01-22

*** 次数:9999999 已用完请联系开发者*** 打印cad图纸打出来是白纸

2023-01-22

当前关注:[明日方舟]除夕

2023-01-22

安州区气象台发布霜冻蓝色预警信号【IV级/一般】

2023-01-21

【碧蓝航线/爱宕】指挥官是姐姐的毛绒绒玩具_世界新消息

2023-01-21

全球快看点丨湘财股份(600095)1月20日主力资金净卖出2.89亿元

2023-01-21

快讯:澳网疯狂1日:连爆7大冷门!诞生3场让二追三大逆转,中国2人晋级

2023-01-20

镇平县:爱心助农暖人心 免费赠送传温情|全球热文

2023-01-20

中国队击败美国队,晋级世界大冬会女子冰壶决赛

2023-01-20

【热闻】黄金股早盘普涨,截至发稿,紫金矿业(02899.HK)涨4.61%,报13.16港元

2023-01-20

天天即时看!八命阵——百鬼空亡

2023-01-20

TCL科技披露业绩预告:行业下游需求不振,净利同比预降_天天热文

2023-01-19

快播:派斯林筹划出售两公司股权 全面去化房地产及物业管理业务

2023-01-19

车厘子的糖比可乐还高!看完你还敢狂炫2斤嘛?

2023-01-19

广西钦州“兔年新警”守护兔年春运

2023-01-19

印度羽球公开赛第二天,凡尘逆转惊险晋级,李诗沣昂首挺进16强

2023-01-19

国内激光雷达第一股来了!禾赛科技赴美IPO,累计出货10万套

2023-01-19

【阿姐鼓】超详细攻略第一章-环球最资讯

2023-01-18

浓浓年味暖民心 幸福罗江幸福年|环球关注

2023-01-18

春运期间,如果在公交车上遗失物品咋找回? 当前最新

2023-01-18

环球观焦点:FF中国总部将落地黄冈:长江基金搭建桥梁 2022年接触多次

2023-01-18

重庆校平机厂家_重庆校讯通

2023-01-18

原神某网站的奇怪同人图 第21期

2023-01-17

阳狮集团中国任命张宁为星传媒体首席执行官_全球报资讯

2023-01-17

2022年净利润增长177.00% 冠豪高新大涨5.16% 世界观察

2023-01-17

环球今热点:1月16日基金净值:华安文体健康混合A最新净值3.782,涨1.01%

2023-01-17

双林股份: 关于向不特定对象发行可转换公司债券预案披露的提示性公告|今日聚焦

2023-01-16

世界热门:烽火电子1月16日盘中涨幅达5%

2023-01-16

每日视点!什么是强奸强奸的刑事责任是什么

2023-01-16

核桃是几月份成熟的 核桃是哪个月份成熟的呢

2023-01-15

实时焦点:存400万港元,送免费打疫苗名额!香港银行业开年再掀存款争夺战

2023-01-15

有关猪肉价格!国家发改委发声

2023-01-14

春运以来长春机场运输生产稳步恢复 世界今头条

2023-01-14

微头条丨居间合同纠纷律师费如何计算

2023-01-13

天天即时:梅安森主力资金持续净流入,3日共净流入2067.22万元

2023-01-13

环球今日报丨板块异动 | 银行业首份业绩快报实现两位数增长 银行板块异动上扬

2023-01-13

育碧《刺客信条:幻景》的地图将“更丰富、更密集”,经典潜行玩法回归

2023-01-13

雷神众测漏洞周报2023.1.3-2023.1.8

2023-01-12

当前观察:4iNLOOK、BRIGHT布兰德获融资;可口可乐中国出售部分生产及包装业务;奈雪的茶直营门店数量达 1000 家|品牌日报

2023-01-12

自贡沿滩:齐心协力冲刺一季度“开门红”

2023-01-12

创全美先例,旧金山立法要求企业保障预备役收入_热门

2023-01-12

■A股今日提示■

2023-01-12

岳云鹏:“走路不敢抬头”到“脸比城墙厚”,这些年他经历了什么

2023-01-11

全国超30城市正建或筹建智算中心 即时看

2023-01-11

一起来聊聊关于WebIDE的实现

2023-01-11

康为世纪:公司的核心产品包括分子检测酶原料、核酸保存试剂、核酸提取纯化试剂以及分子诊断试剂盒

2023-01-11

看点:辉瑞新冠药没有那么神!背后是谁在炒作?

2023-01-10

兰州市各区县疾控中心电话一览

2023-01-10

《2023循环时尚行业趋势报告》发布

2023-01-10

未成年人打伤了人,想知道对于16岁打伤人怎么判刑

2023-01-10

环球热资讯!工行融e借借款逾期5个月不还会影响征信吗

2023-01-10