ChatGPT封杀潮,禁入学校,AI顶会特意改规则,LeCun:要不咱把小模型也禁了?

机器之心报道

编辑:陈萍、小舟

狂欢之后,事情的走向开始进入封杀这一过程。

要问近段时间 AI 界最出圈的模型是哪个,十人中得有九个人会投 ChatGPT 一票,没办法,这个模型实在是太火,只因它会的东西太多了。很多人形容它是一个真正的「六边形战士」:不仅能拿来聊天、搜索、做翻译,还能写故事、写代码、debug,甚至开发小游戏、参加美国高考…… 有人戏称,从此以后人工智能模型只有两类 —— ChatGPT 和其他。

一方面 ChatGPT 能力过于惊艳深受大众喜欢,另一方面,也是麻烦事不断,遭到不同机构的封禁。前段时间就有 Stack Overflow 封禁 ChatGPT 的消息满天飞,原因无他,官方表示暂时封禁 ChatGPT 是因为它生成的答案正确率太低,发布由 ChatGPT 创建的答案对网站和查询正确答案的用户来说是非常有害的。

这一次风波过去没多久,顶级人工智能会议也开始禁止使用 ChatGPT 和 AI 工具撰写的学术论文。具体是怎么回事,我们往下看。

ICML 禁止使用大型语言模型写论文

前几天,国际机器学习会议 ICML 宣布:禁止征稿使用大型语言模型(LLM,如 ChatGPT)生成的论文,除非生成的文本是作为论文实验分析的一部分呈现。

文件地址:https://icml.cc/Conferences/2023/llm-policy

根据 ICML 的说法,ChatGPT 等这类语言模型虽然代表了一种未来发展趋势,但随之而来的是一些意想不到的后果以及难以解决的问题。ICML 表示,ChatGPT 接受公共数据的训练,这些数据通常是在未经同意的情况下收集的,出了问题谁负责。

还有就是作者身份问题,是谁「写」的论文:机器还是人类?考虑到 ICML 仅禁止 AI 完全生成的文本,这一点尤为重要。会议组织者表示,他们并不禁止使用 ChatGPT 等工具编辑或润色作者撰写的文本,并指出许多作者已经使用语法校正软件 Grammarly 等半自动编辑工具来润色文章。

不过此消息一出,在社交媒体上还是引发了一次大讨论,Yann LeCun 转发并评论道:「大型语言模型不能用,那么中型和小型语言模型是不是还可以用。」

微软研究院 ML 基础团队的负责人 Sebastian Bubeck 则称该规则是「目光短浅」 ,并在推特上写道:「ChatGPT 及其变体是未来技术发展的一部分。禁止绝对不是最优的答案。」

图片正在加载中,请稍后

ICML 表示,明年将重新评估对 AI 生成文本的禁令。

一直以来,人们对人工智能生成文本的有害影响都有不同的担忧。最常见的问题之一是这些系统的输出结果根本不可靠。

人工智能模型经过训练可以预测任何给定句子中的下一个单词,但它们没有硬编码的「事实」数据库可供借鉴,因此模型的生成结果经常出现似是而非的情况。很多时候,生成的语句符合语法逻辑,却不符合客观现实。

还有一个问题也非常棘手 —— 我们难以区分文本是由 AI「润色编辑」的,还是完全由 AI 生成的。这个问题对于论文来说就非常严重,如果作者用 AI 模型基于论文生成简洁的摘要,这算是编辑文本还是从头生成文本?

当然,使用 ChatGPT 这样的 AI 工具并非只有弊端。例如在同行评审中,流畅的英文表达往往会收获更高的评价,AI 模型就可以帮助非英语母语的论文作者生成更流畅的英文文本。这将为研究人员节省时间,并为学术领域创造更公平的竞争环境。

但需要注意的是,ChatGPT 是大型语言模型(LLM),和 Grammarly 等简单的语法校正软件有很大的区别。LLM 本身的主要功能也不是调整已编写文本的结构和语言,而是生成一些新的文本。

实际上,几乎不会有论文作者会真的使用 AI 语言模型来生成学术论文。因为学术论文的要求是非常严谨的,一般在发表前作者都会反复核对论文内容。如果使用 AI 生成的论文出现错误,所有署名的论文作者的声誉都会受到严重影响,关系到论文作者的整个职业生涯。

从论文评审的角度讲,人们需要一个快速有效的检测工具,以分辨一篇文章是 AI 生成的还是人工撰写的。近期就有开发者发布了一个名为 GPTZero 的新应用程序,具备这种检测功能。

图片正在加载中,请稍后

GPTZero 是由普林斯顿大学计算机科学专业学生 Edward Tian 开发的,其中使用两种不同的指标来评估文本是否由 AI 模型编写:困惑度(perplexity)和突发性(burstiness)。这可能就是用「模型」打败「模型」吧。

纽约市学校禁止访问 ChatGPT

几乎同一时间,ChatGPT 遭到学校的封禁。由于担心 AI 工具会破坏教育,纽约市教育部已经在其网络和设备上阻止对 ChatGPT 的访问。

图片正在加载中,请稍后

该部门的发言人 Jenna Lyle 表示:此条禁令主要是担心 ChatGPT 对学生的学习产生潜在负面影响,以及对 ChatGPT 生成内容的安全性和准确性有所担忧。虽然该工具可以提供快速简单的答案,但它无法培养批判性思维和解决问题的能力,而这对于学生的学业和终身成功至关重要。

除此以外,ChatGPT 也存在其他语言模型所存在的问题。因为其训练数据来自互联网,所以它经常在答案中重复和放大性别歧视和种族偏见等。这类语言模型还倾向于编造信息,从历史日期到科学规律,但别人一般发现不了它在胡编乱造。

正是这些事实性错误,让教育工作者特别担心这个工具。许多老师表示,像 ChatGPT 这样的软件基本上不可能起到测试学生写论文的能力。如果 ChatGPT 可以在几秒钟内帮助学生完成写作,他们就不愿花心思去写了。

然而,另一些人认为,教育系统将不得不适应这种技术的出现 —— 就像它适应早期的颠覆性技术,如谷歌搜索和维基百科一样。但大家对 ChatGPT 适应,显然还需要点时间。

无论是人为制定和执行文本编写规范,还是使用一些方法分辨文本是否为 AI 生成,都说明人们意识到急需规范 ChatGPT 等文本生成模型的使用。ChatGPT 的使用场景和价值仍有待定义。

参考链接:

https://www.theverge.com/2023/1/5/23540263/chatgpt-education-fears-banned-new-york-city-safety-accuracy

https://www.theverge.com/2023/1/5/23540291/chatgpt-ai-writing-tool-banned-writing-academic-icml-paper

https://twitter.com/edward_the6/status/1610067688449007618?s=20&t=KcWXRmQ0sNLMWKgZFIivrw

https://www.thedailybeast.com/princeton-student-edward-tian-built-gptzero-to-detect-ai-written-essays

图片正在加载中,请稍后

标签: 人工智能

最新资讯

文档百科

比喻句的作用

《比喻句的作用》是由老资料网作文栏目小编精心为大家准备的,欢迎大家阅读。比喻句,通俗地说,就是为了让读者更明白你要说的意思,把一个很平常的东西说得不一样一点,另类一点,就是把不是的东西比做是的。其实比喻句就是把本体比喻成喻体组成的。有本体、喻体、喻词的句子叫比喻句。

2022年春节假期将延长到10天吗

对于春节假期一直被人们所诟病,拼拼补补的七天,还没感觉到过年的气氛就上班了,于是乎大家纷纷希望国家能够将春节的假期延长,这不近期便有消息传出2022年春节将有10天,一起看看吧。

北纬10°,沉香的“分水岭”

北纬10°,就是沉香的“分水岭”,生长在这个纬度以北的沉香是广受香界好评的越南沉香、海南沉香、柬埔寨沉香等,而处于北纬10°以南的沉香则是现代沉香的主要源产地,也被叫做星洲沉香。沉香的南北差异如果以北纬10°为分界线的话,那么南北沉香的差异还是挺大的。

怎样才能摆脱粗手臂 这七招有效瘦手臂

女生们是不是还在因为手臂粗壮而深受苦恼?那怎么做才能解决这个问题呢?想要拥有细长的手臂,就跟着小编一起看看,下面的方式可以有效瘦手臂,让大家摆脱手臂粗的烦恼!美眉们可以放心用这个动作收紧拜拜肉,让手臂曲线变得纤细。将右手臂伸高,往身后左肩胛骨弯曲,以左手压着右臂关节处,并触碰左肩胛骨,保持5秒。

怎样辨别是不是玉,请问有什么方法可以让普通人认识玉石?

根据我捡玉石的经验怎样辨别是不是玉,可以告诉你,凡是看到透明的石头,再看看有无裂缝,没有裂缝且透明的石头基本可以当成玉石了。由于我家乡的地质非常复杂,品种也多样,就算是专家也不会全部认识,所以请有认识的专业大神指点指点,供大家学习学习,谢谢评论!

什么时候吃水果最好?春季吃水果的最佳时间

吃水果显然已成为大众养生的重要方式之一。不过原来吃水果的时间也有讲究的,要学会挑准时间吃水果才能更好地发挥好水果的功效!那么,下面我们就来看看春季早上、中午、晚上我们适合吃哪些水果,不适合吃哪些水果吧!春季吃水果的最佳时间。夜宵吃水果既不利于消化,又因为水果含糖过多,容易造成热量过剩,导致肥胖。

CopyRight © 2000~2023 一和一学习网 Inc.All Rights Reserved.
一和一学习网:让父母和孩子一起爱上学习