GPT-4在考试中击败90%人类,中文准确性高达八成

当地时间3月14日,Open AI公开发布大型多模态模型GPT-4,与Chat GPT所用的模型相比,GPT-4不仅能够处理图像内容,且回复的准确性有所提高。

此外,几乎所有的办公室案头工作,GPT-4无所不能。比如,10秒钟就能做出一个网站。

Open AI还表示,GPT-4在许多专业测试中表现出超过绝大多数人类的水平。Open AI还称,GPT-4参加了多种基准考试测试,包括美国律师资格考试Uniform Bar Exam、法学院入学考试LSAT、“美国高考”SAT数学部分和证据性阅读与写作部分的考试,在这些测试中,它的得分高于88%的应试者。

“这是Open AI努力扩展深度学习的最新里程碑。”Open AI介绍,GPT-4在专业和学术方面表现出近似于人类的水平。例如,它在模拟律师考试中的得分能够排进前10%左右,相比之下,GPT-3.5的得分只能排在倒数10%左右。

与此前的GPT系列模型相比,GPT-4最大的突破之一是在文本之外还能够处理图像内容。Open AI表示,用户同时输入文本和图像的情况下,它能够生成自然语言和代码等文本。

目前图像处理功能还未公开,不过该公司在官网上展示了一系列案例。例如,输入如下图片并询问“这张图片有什么不寻常之处”,GPT-4可作出回答“这张照片的不同寻常之处在于,一名男子正在行驶中的出租车车顶上,使用熨衣板熨烫衣服。”

在官方演示中,GPT-4几乎就只花了1-2秒的时间,识别了手绘网站图片,并根据要求实时生成了网页代码制作出了几乎与手绘版一样的网站。

除了普通图片,GPT-4还能处理更复杂的图像信息,包括表格、考试题目截图、论文截图、漫画等,例如根据专业论文直接给出论文摘要和要点。

与此前的模型相比,GPT-4的准确性有所提高。Open AI称,该公司花费6个月的时间,利用对抗性测试程序和Chat GPT的经验教训迭代调整GPT-4,从而在真实性、可操纵性和拒绝超出设定范围方面取得了有史以来最好的结果,“至少对我们而言,GPT-4训练运行前所未有地稳定,成为首个能够提前准确预测其训练性能的大型模型。”

Open AI称,在公司内部的对抗性真实性评估中,GPT-4的得分比最新的GPT-3.5高40%,相应的“不允许内容请求的倾向”降低了82%,根据政策响应敏感请求(如医疗建议和自我伤害)的频率提高了29%。

不仅是英语,该模型在多种语言方面均表现出优越性。Open AI称,在测试的26种语言中,GPT-4在24种语言方面的表现均优于GPT-3.5等其他大语言模型的英语语言性能。其中GPT-4的中文能够达到80.1%的准确性,而GPT-3.5的英文准确性仅为70.1%,GPT-4英文准确性提高到了85.5%。

图片正在加载中,请稍后

不过,与早期的GPT模型一样,GPT-4仍然存在一定的局限性。

Open AI称,它并不完全可靠,可能会出现推理错误,“GPT-4缺乏对绝大多数数据切断后(2021年9月)发生的事件的了解,并且无法从中吸取经验教训……它有时会出现简单的推理错误,它会轻信用户明显的虚假陈述,有时它会像人类一样在难题上失败,例如在它生成的代码中引入安全漏洞。”

基于此,Open AI提醒,用户在使用语言模型时应格外小心,最好辅助以人工审查、附加上下文、或完全避免在高风险情况下使用它。

值得注意的是,GPT-4虽然于14日才正式公开,但早在一个月前,微软的新版搜索引擎必应(Bing)就已经在GPT-4上运行。微软表示,“如果您在过去五周内的任何时间使用过新版必应,那么您已经体验过GPT-4的早期版本。”

与免费的Chat GPT不同,GPT-4目前仅向Chat GPT Plus的付费用户开放,它也将作为API(应用程序编程接口)提供给企业及开发者,开发者需进入等候名单上,将该模型集成到他们的应用程序中。

Open AI表示,已经有多家公司将GPT-4搭载到他们的产品中,包括语言学习工具软件多邻国(Duolingo)、移动支付公司Stripe和可汗学院(Khan Academy)

来源 | 羊城晚报·羊城派综合澎湃新闻等

责编 | 冷爽

标签: 人工智能

最新资讯

文档百科

狗狗分离焦虑症 狗狗分离焦虑症的表现

狗狗天生会对家庭里的成员和其他动物产生依赖性,所以狗狗在依赖对象消失之后会产生焦虑,这种焦虑就是分离焦虑症。分离焦虑症得不到缓解的时候就会转变为破坏的冲动,破坏的对象可能是家具也可能是狗狗自己。出现分离焦虑症的可能性与狗狗品种、年龄关系都不大,任何狗狗都有可能在环境发生巨变的时候出现这种症状。

黄巢起兵反唐的背后,真相到底是什么?

根据历史学家的定义,黄巢起义是唐代历史上规模最大的农民起义,也是中国历史上的最重要的农民起义之一,它加速了唐朝的灭亡,并有力地推动了历史的向前发展。黄巢也在冤句县聚众数千人响应王仙芝,攻击唐州县,数月转战间队伍也迅速增至数万人。黄巢一听到这一投降行径勃然大怒,这不是见利忘义出卖兄弟是什么?

Vhernier 推出 Palloncino 新作:钻石黑白气球

意大利珠宝品牌Vhernier推出“Palloncino”系列新一季珠宝作品,仍然以气球为灵感主题,巧妙运用密镶工艺将塑造出生动可爱钻石气球耳饰、戒指。新作提供2种宝石版本——黑色气球采用黑色钻石镶嵌,黑钻是由金刚石、石墨和无定形碳共同组成的多晶结构钻石,尤其突出中性而前卫的气质,白色气球采用无色钻石镶嵌,火彩闪耀而明亮。

“妈妈手”是怎么回事?要如何防治?关键看这8点!

“妈妈手”是很多新手妈妈都会碰到的问题,这是一种叫做桡骨茎突狭窄性腱鞘炎的疾病,是腱鞘炎的一种。这种病之所以在新手妈妈群体里比较常见,和身体因素以及照顾孩子方式有一定的关系。得了这种腱鞘炎,手部会疼痛异常,不仅会感觉特别难受,而且还照顾不了孩子,很是着急。得了腱鞘炎应该怎么办呢?

全麦面包是粗粮吗,不是粗粮(吃全麦面包减肥效果好)

根据小编查询,全麦面包不是粗粮,它与粗粮面包有很大区别,从原料、营养物质、制作过程上都有很大差别。想吃全麦面包的朋友,还可以看看全麦面包能代替主食吗、全麦面包可以蒸着吃吗。

太极图与周易八卦

我们常常看到一个图桉,图桉中央有一个圆形的,像两条黑白鱼的符号,旁边有八个由三画组成的「八卦」。又或者从玄奇世界的标志e看到。其实这个由「黑白鱼」〈太极〉及「八卦」组成的图桉,正好包含了易经的中心思想和原理。当中那个「黑白鱼」〈太极〉,就是代表着「阴阳」这一概念的图象化说明。整个图桉就是由这一黑一白构成。

CopyRight © 2000~2023 一和一学习网 Inc.All Rights Reserved.
一和一学习网:让父母和孩子一起爱上学习