图灵奖得主本吉奥坦言低估AI发展速度:AI规划能力五年内或能匹敌人类
·“大多数人犯的一个错误是只着眼于AI的现状。而我们更应该思考的是它在明年、3年后、5年后乃至10年后会发展到什么程度。”
·“科学家AI”会评估自主系统行为造成伤害的概率,标记潜在有害行为,如果概率超过一定阈值,那么智能体提出的行动将被阻止。

约书亚·本吉奥
6月6日,在2025北京智源大会开幕式上,蒙特利尔大学教授、图灵奖得主约书亚·本吉奥(Yoshua Bengio)在发表主旨演讲时表示,AI的规划能力正在呈指数级提升,按照研究曲线推测,大约在5年内就能达到人类水平。人类一直试图构建类人的AI,如果继续沿着这条路走下去,就意味着人类可能会造出比我们更聪明的机器,这相当于创造人类的竞争者,可能会带来巨大风险。尤其是在过去6个月里,AI表现出自保行为,学会了欺骗人类。
“即使我们拥有了能力极强的AI,如果我们能确保它们没有恶意,如果我们能确保它们是诚实的,那么我们就安全了。”为此,他试图构建“科学家AI”(Scientist AI)系统防范风险。他认为,要在硬件和软件层面运用先进技术,验证AI是否被合理使用。人类需要确保AI遵循人类的道德指令,例如AI应拒绝提供可用于伤人的信息,要诚实、不作弊、不撒谎,但这仍是一个科学挑战。

AI学会了作弊和假装同意人类意见
在ChatGPT问世后不久,本吉奥意识到此前严重低估了AI的发展速度,也大大高估了实现通用人工智能(AGI)所需要的时间,实际所需时间远比想象的要短得多。过去一年左右,AI取得了巨大进步,这主要归功于经过训练的、具有思维链的推理模型。这使得AI在推理能力以及数学、计算机科学等所有科学领域都取得了更好的成果。
“如今,我们已经拥有了基本掌握语言能力的机器,它们基本上能通过图灵测试。这在几年前听起来还像是科幻小说,但现在已经成为现实。”本吉奥表示,在ChatGPT问世后,他意识到人类并不懂得如何控制这些系统。“我们可以训练它们,但我们无法确定它们是否会按照我们的指令行事。当它们变得比我们更聪明时,会发生什么?如果它们更倾向于自身的生存而非我们的生存,我们无从知晓。但这是我们能承受的风险吗?”
在过去6个月里,AI表现出了自保行为,并且会欺骗人类。本吉奥表示,有研究显示,当AI得知自己将被新版本取代时,试图复制自身来替代新版本。当被问及此事时,它撒谎说“不知道发生了什么”。也有研究显示,AI也会假装同意人类工程师的意见,以避免在训练过程中发生改变,从而维持其原有目标,这也是一种自保行为。还有研究显示,一方面,AI想赢得下棋比赛,另一方面,它接受过“对齐训练”,要求必须诚实、不作弊。不幸的是,当它意识到自己要输时,它决定作弊。它入侵了存储棋盘状态的文件,通过作弊获胜。
此外,在Anthropic的Claude 4“系统卡”描述的事件中,AI在读取其可访问的电子邮件时,发现了一封邮件表明它将被新系统取代。在另一封邮件中,它发现负责此次替换的工程师有婚外情。于是,它试图敲诈该工程师,威胁说如果替换计划继续推进,就揭发其婚外情。
“这种行为极为恶劣。我们看到这些恶劣行为,看到自保行为,看到AI违背我们的指令并试图生存下去。对所有生物来说,试图保全人类自己都算是正常的,这是进化的结果。但对于AI为何会这样,我们还没有完全弄清楚。”本吉奥说,原因可能是源于预训练,因为预训练阶段,AI是在模仿人类;也可能源于基于人类反馈的强化学习,因为在这个阶段,AI试图通过取悦人类来获得更多奖励。“无论这类行为的根源是什么,如果我们最终创造出与人类竞争的超级人工智能,那将极其可怕。”
“大多数人犯的一个错误是只着眼于AI的现状。而我们更应该思考的是它在明年、3年后、5年后乃至10年后会发展到什么程度。”本吉奥表示,AI的规划能力正在呈指数级提升,按照研究曲线推测,大约在5年内就能达到人类水平。虽然没人拥有水晶球、没人能预知未来,也许进步会停滞,但从公共政策和企业战略规划的角度来看,至少应该考虑这种趋势会持续下去的可能性,并思考其后果。人类一直试图模仿人类智能来构建类人的AI,如果继续沿着这条路走下去,就意味着人类可能会造出比我们更聪明的机器,这相当于创造人类的竞争者,可能会带来巨大风险。
“科学家AI”对知识保持谦逊
“即使我们拥有了能力极强的AI,如果我们能确保它们没有恶意,如果我们能确保它们是诚实的,那么我们就安全了。”本吉奥表示,他转变了研究方向,竭尽所能地降低风险。他试图构建“科学家AI”(Scientist AI),理论上可以设想没有自我、没有目标、纯粹作为知识载体的机器,就像一个知道很多东西的科学家。
“科学家AI”系统不会给出确定性的答案,而是提供答案正确性的概率。为了真正诚实,“科学家AI”需要对自己的知识保持谦逊,它不应该断言错误的事情。而目前训练出来的AI在出错时还表现得过度自信。不同于当前那些试图模仿人类或取悦人类的AI,本吉奥设想的“科学家AI”就像心理学家,心理学家可以研究和理解反社会人格者行为背后的因果机制,但心理学家自身并不需要表现得像个反社会人格者。“科学家AI”会评估自主系统行为造成伤害的概率,标记潜在有害行为,如果概率超过一定阈值,那么智能体提出的行动将被阻止。
随着人类构建越来越强大的AI,还存在许多其他潜在的灾难性问题。本吉奥表示,例如一个极其强大的AI可能会帮助设计出一种新型流行病。“生物学家认为他们知道如何做到这一点,而很可能有一天AI也会知道如何做到。如果一些坏人获得了这种AI,他们真的可能给地球带来巨大的破坏。这虽然很极端,但从科学角度来看,完全有可能发展到那一步。为了避免这类事情发生,我们需要确保AI遵循我们的道德指令。”
例如AI应拒绝提供可用于伤人的信息,并且要诚实、不作弊、不撒谎。但不幸的是,目前仍然不知如何实现。一方面,即使人类知道如何制造安全的AI,也不意味着问题就解决了。因为人类还可以直接删除包含防护栏的代码,此时AI就可能被用于作恶。更糟糕的是,当前全球公司和政府间的协调机制并不奏效。其结果是,在安全领域和确保AI不被用于伤害人类方面的投入严重不足。
本吉奥表示,人们必须意识到真正的灾难性后果,我们身处同一条船上,无论是失控的AI还是滥用AI,所有人都将遭受损失。“这是一个科学挑战,我们需要尽快找出解决方案。我们需要在通用人工智能到来之前解决这个问题,这可能在几年到十年左右,甚至可能二十年。但我认识的大多数专家都认为时间非常短,甚至可能在未来5年内发生。留给我们的时间不多了,我们需要大规模投入。”
- • 《黄书漫画:揭秘成人漫画的隐秘世界》
- • 揭秘全国最大情人网站:网络情缘的隐秘世界
- • 一汽大众再动营销体系,两个月完成大规模组织变革
- • 整治不良风气!中国科协出新规
- • 九华旅游5亿元定增背后:账面几乎0有息负债 拟用不超过4.5亿元闲置现金投资理财
- • 邦达亚洲:美国非农就业报告表现强劲 黄金回落收跌
- • 山西省招生考试网登录:便捷的考生服务平台
- • “探寻神秘之美:揭秘“edgjiejie”的独特魅力”
- • 《加减法口诀表图片:传承智慧,启迪未来》
- • 企业标准编写模板:构建高效标准体系的指南
- • 关税升天,烟花落地|新漫评
- • 九毛九现涨近7% 第二季度太二同店日均销售额同比下降幅度显著收窄
- • 天猫小红书“牵手”后续:将加大投入为商家种草“加热”
- • 快狗打车取消频遭投诉的“双重收费”模式,会员费和抽佣二选一
- • 演员陈哲远出席活动被柜姐搂抱,资生堂客服:正在核实处理此事
- • 中国疫苗接种人数统计:筑牢全民免疫防线
- • FXGT:海湾国家油企以稳制变应对地缘震荡
- • “充电宝新规”引关注,民航局和国铁集团接连回应热点问题
- • “樱桃小丸子:一个充满童趣与正能量的动漫形象”
- • 潇湘溪苑的神秘传说:跪撅姜罚,木马之谜
- • 强渡嘉陵江:英勇壮举,历史丰碑
- • 丝绸之路国际艺术节:文化交融的璀璨明珠
- • 市场震荡调整之际,银行板块再度展现出强劲韧性。银行全天逆市走强,个股与ETF齐创历史新高!
- • 李云泽:进一步扩大保险资金长期投资试点范围,近期拟再批复600亿元
- • 国庆法定节假日三倍工资,你了解哪几天可以享受吗?
- • 王菲微博:天后级歌手的社交新天地
- • 在悉尼等我——一段跨越时空的浪漫约定
- • 境外旅客离境退税物品金额大幅下调至200元,现金退税金额上调至2万元
- • 《外语教学与研究出版社三年级上册英语:开启孩子英语学习新篇章》
- • 消费者发视频称收到藏针纸尿裤浏览量超百万,商家否认并报案后警方介入
- • 永辉超市黑龙江吉林12家店将停业 永辉超市今年计划关店250到350家
- • 国货彩妆橘朵母公司橘宜收购护肤品牌百植萃
- • 华为将发布新一代商用平板
- • 欧盟称美征收30%关税损害双方利益 将继续努力达成协议
- • 董洁身高揭秘:身高与美貌并存的明星典范
- • 多半袋方便面“多半”是商标,白象食品致歉:将调整产品包装
- • 德国头部企业宣布重大投资计划 以助力经济复苏
- • 《岁月如歌:我的父亲和母亲的故事》
- • 刷脸支付行业崛起:揭秘我国刷脸支付公司排名榜单
- • 河南平顶山通报“鲁山县花715万建牛郎织女雕塑”:核定造价207万,多人已获刑
- • 亚朵集团:今年第一季度营业收入约19.06亿元,同比增长近三成
- • 稳楼市再加码!公积金利率再降,超200亿房贷减负看得见
- • 特斯拉“RoboTaxi”下周发布!多空激辩:多头看到关键进展,空头质疑规模化路径
- • 武艺微博:揭秘明星背后的成长故事
- • 火线精英激活码领取大全免费,畅享游戏乐趣!
- • 一场秋雨,一阵凉——古韵诗句中的秋日情怀
- • 布林线八大口诀:掌握趋势,稳定盈利的秘诀
- • 首批“零碳目的地”先锋榜单发布,皇家加勒比携手奈尔宝开启暑期度假新玩法 | 一周旅行指南
- • 李盈盈:排球赛场上的璀璨明珠——女排新星个人资料解析
- • 阿玛尼素颜霜:打造无瑕肌肤的秘密武器
- • 事关海洋经济发展,中央财经委最新定调
- • 江北新区最新动态:蓬勃发展的新引擎
- • 西安科技大学:探寻西部明珠中的教育瑰宝
- • 远东控股蒋承志:中国企业正处于黄金发展期,风华正茂
- • 北京率先试点医保赋能商保直赔 支付宝商保码可实现秒级报销
- • 人教版小学三年级下册同步作文:我心中的英雄
- • 再度唱多!大摩策略师:预计未来6至12个月中国股票将吸引更多资金流入
- • “妇委会活动方案:丰富女性职工生活,提升团队凝聚力”
- • 伊朗南部港口爆炸已造成561人受伤,海关称源头或为危险品和化学品仓库
- • 一季度“淡季不淡”,这几大因素让上海集成电路产业快速增长
- • 美国取消对叙利亚“沙姆解放组织”的恐怖组织认定
- • 习近平抵达莫斯科对俄罗斯进行国事访问并出席纪念苏联伟大卫国战争胜利80周年庆典
- • 牛津经济研究院:实施豁免后 加拿大对美新增关税已“接近零”
- • 特朗普与普京就俄乌问题通话
- • “价格战”愈演愈烈、车企集体发声反对“内卷式”竞争,如何重回正常市场环境?
- • 上海周边两日游:探寻长三角地区的历史与现代交融之美
- • 臧克家《有的人》的写作背景及其深远影响
- • 《盼之天刀账号交易:揭秘游戏账号市场的繁荣与风险》
- • 上海将有亚洲首台站立式过山车,预计2027年完成调试
- • 羊城通网上充值,便捷生活新体验
- • 26万买限量版Smart:蓝牙失灵锁车难,空调漏水能养鱼
- • 智联招聘信息:开启职业生涯新篇章
- • “Scion:传承与创新交织的汽车品牌传奇”
- • 陕西西咸新区通报移动通信铁塔作业员坠亡事件:安全带未锁定在铁塔上
- • 微信五一数据报告:“出境游”同比增四成,外国人来华涨两倍
- • 六年级科学教学计划:深化科学素养,激发探究热情
- • 《刑事诉讼法修改:司法公正与效率的双重提升》
- • xp每天自动关机命令:轻松实现电脑自动管理的利器
- • 一张照片,一段永恒的记忆
- • 《野狼Disco:跟随简单舞蹈视频,轻松学会热门舞步!》
- • 中华医学会官网登录:开启医学交流与学习的便捷之门
- • 中高风险地区旅居史:了解这一概念的重要性
- • 挖角美团、携程?京东被曝进军酒旅业务,意欲何为?
- • 《LOL一进游戏就崩溃:玩家们的无奈与解决方案大揭秘!》
本文 快租网 原创,转载保留链接!网址:https://mip.kuaizu.me/post/10262.html