智东西(公众号:zhidxcom)
(相关资料图)
编译 | Glu
编辑 | 李水青
智东西 6 月 13 日消息,当地时间 6 月 7 日,科技巨头谷歌公司对其 AI 聊天机器人 Bard 进行了更新,提升了机器人逻辑与推理能力,并增加了表格的导出形式。
Bard 是谷歌公司为了对抗 ChatGPT 和 BingChat,在今年 3 月 21 日正式推出的一款聊天机器人。此次更新是谷歌继 5 月新增 Bard 图片回复功能后的又一次功能迭代,主要针对 Bard 的数学计算能力,预计能将 Bard 解决数学问题的能力提高 30%。
一、结果的生成:不只靠预测,加入计算力
Bard 这次的具体更新内容包括两个方面:
1、提升在数学计算、编码问题和字符串操作方面的能力;
2、提供了一个 " 到谷歌表格 " 的新导出选项。有了这个新功能,用户可以将 Bard 在其回答中创建的表格直接导出到表格中。
在第一项更新中,Bard 使用了一种名为" 隐式代码执行(implicit code execution)"的新技术,它可以让 Bard 编写和执行自己的代码。最新版本的 Bard 识别能根据逻辑代码的提示,在后台编写代码、对其进行测试,并使用结果来生成更准确的回答。
这大大提高了 Bard 的推理和数学能力,使其有能力解决高级推理和逻辑性较强的复杂问题。如:
15683615 的质因数是什么?
计算某人储蓄的增长率
倒写单词 "Lollipop"
▲ Bard 对倒写单词 "Lollipop" 的回复Bard 之前所使用的 LLM(大语言模型)像是一个预测引擎。LLM 根据提示,来预测可能进一步出现的词汇,进而生产回复,整个流程并不涉及精细的逻辑推理与计算。因此,他们有能力解决语言类、创造性任务,但却无法准确回答推理、数学等领域的问题。
二、结合大模型与传统代码,准确度提高 30%
这项技术的灵感来源是二分法,特别是丹尼尔 · 卡尼曼(Daniel Kahneman)的双系统思维模型,他认为人的大脑存在两个系统,并称之为系统 1 和系统 2:
系统 1 是无意识思考,是快速的、直观的、毫不费力的,如一个乐手在演出现场即兴演奏,使用的就是系统 1 思维;
系统 2 则需要耗费精力、保持专注,是缓慢的、审慎的,如人们运用数学运算、学习专业乐器演奏时,使用的是系统 2 思维。
以此类比:
LLM 是在系统 1 思维下运作的——没有经过深度思考,快速产生文本;
传统代码计算方法则与系统 2 类似——公式化、不灵活,但能产生正确的结果。
以做一道数学题为例,如果只使用系统 1,那根本不需要解题方法,直接把想到的答案写出来就行了;但是加上系统 2 后,便可以运用加减乘除等数学方法去解题。
本次更新中,谷歌结合了 LLM(系统 1)和传统代码(系统 2)的能力,来帮助提高 Bard 反应的准确性。谷歌称,在他们的内测数据集中,Bard 解决计算类问题的准确性提高了约 30%。
即使这样,Bard 也无法保证回应的绝对准确。Bard 不会生成有助于提示响应的代码,它生成的代码可能是错误的,它也无法保证一定将执行的代码包括在其响应中。
结语:各大厂商关注机器人逻辑性,AIGC 准确性将继续提高
6 月 1 日,OpenAI 宣布 ChatGPT 数学解题能力将大幅提升,现在,谷歌也宣布了 Bard 的数学计算能力提高了 30%。
这向我们释放了强烈的讯号,即 AIGC 聊天机器人行业陆续在关注着 AIGC 解决复杂问题的能力、生成内容的准确性,并不断在以各种方式提升 AIGC 内容的结构化、逻辑性。未来,我们将享受到能力更强大、结果更准确的 AI 服务。
来源:Google 官网
标签:
仓储物流“成渝圈”如何乘势而上? 12月3日,连接昆明和万象的中老铁路全线开通运营,被惠及的显...
两件西周青铜簋时隔三千年成功配对 考古工作者介绍,这个铜簋的盖、身分别时隔40余年出土,纹饰...
“医保砍价”不是一个人在战斗 晁星 “我眼泪都快掉下来了”“每一个小群体都不该被放弃”…...
“购物成瘾”真的是一种病 刘艳 牛雅娟 本周日即将迎来“双十二”促销季,很多人又开始摩拳...
因迷恋山间风景,一男子在甘孜州稻城县海拔4000多米的无人区迷失方向,随后与同伴失联。12月的稻城...
嫌疑人DNA信息比中后,成都市公安局刑侦支队技术处DNA实验室民警白小刚一下坐在凳子上,恍惚迟疑间...
一批反映南京大屠杀历史的新书发布 新华社南京12月7日电(记者邱冰清、蒋芳)“以史为鉴,开创未来...
我在现场·照片背后的故事|电影《亲爱的》里面没有的结局,在我眼前“上映” 12月6日,在深圳市...
冥想?泡脚?不如听听助眠音乐 晚上睡不着,白天睡不醒,成为最贴合都市人群的“睡眠画像”。随...
养老话题 老年教育面临缺口 “终身教育”潜力无限 【现实挑战】“新老年”群体愿意在培养兴...
孙海洋被拐14年儿子如何找到的? 警方侦办另一宗拐骗儿童案时发现线索,通过人像比对、DNA确认找...
北京天文馆、圆明园将对未成年人免费开放 12月6日,北京天文馆发布通知称,12月8日起试行对未成...
今年全国粮食总产量再创新高 连续7年保持在1 3万亿斤以上 根据对全国31个省(区、市)的抽样调...
斑块软的很危险 硬的就无碍? 血管里的“垃圾”分类 赶快学起来! 一项最新研究显示:中国...
诺西那生钠注射液大幅降价 聚焦医保谈判背后脊髓性肌萎缩症家庭 医保目录公布那天 好多家长都...
抖音“窗花剪剪”遭抄袭 被判获赔20万元 法院认为“窗花剪剪”的这种表达方式理应受到《著作权...
公安机关近日侦破3起拐卖儿童案件 失散十几年 3组家庭终于团圆了 北京青年报记者12月6日从公...
2021年度十大网络用语发布 本报讯(记者 路艳霞)作为年度“汉语盘点”活动最具网络特色的组成部...
北京天文馆向未成年人免费开放 本报讯(记者 牛伟坤)北京天文馆对票价免费及优惠政策作出调整:1...
2021北京百个网红打卡地发布 本报讯(记者 李洋)2021北京网红打卡地推荐榜单昨晚正式发布。自然...