OpenAI正式发布GPT-5

OpenAI 已推出全新旗舰人工智能模型 GPT-5,该模型将为公司下一代 ChatGPT 提供技术支持。
于周四发布的 GPT-5 是 OpenAI 的首个 “统一” 人工智能模型,它融合了 o 系列模型的推理能力与 GPT 系列的快速响应优势。这款下一代模型标志着 ChatGPT 及其开发者 OpenAI 迈入新纪元,也彰显了 OpenAI 更宏大的野心 —— 开发更接近智能代理而非聊天的人工智能系统。
如果说 GPT-4 让人工智能聊天机器人能够对各类问题给出智能回应,那么 GPT-5 则让 ChatGPT 能够代表用户完成多种任务,例如生成软件应用、管理用户日程或创建研究简报。
借助 GPT-5,OpenAI 还致力于让 ChatGPT 更易于使用。GPT-5 配备了实时路由机制,无需用户手动选择设置,就能自主决定如何提供最佳答案 —— 无论是快速回应用户问题,还是花更多时间 “思考” 答案。

在记者简报会上,OpenAI 首席执行官山姆・奥特曼称 GPT-5 是 “世界上最出色的模型”,并表示它代表着公司在开发 “能在大多数高经济价值工作中超越人类” 的人工智能(即人工通用智能,AGI)道路上迈出了 “重要一步”。
“在历史上任何时期,像 GPT-5 这样的技术都几乎是无法想象的,” 奥特曼说。
从周四开始,GPT-5 将作为默认模型向所有 ChatGPT 免费用户开放。OpenAI 负责 ChatGPT 的副总裁尼克・特利表示,这是公司首次让免费用户接触到人工智能推理模型(此前,这类更先进的模型仅对付费用户开放)。
“这只是我为践行使命而感到兴奋的方式之一,确保这些技术真正惠及大众,” 特利在谈及这一决定时说,他提到了 OpenAI 长期以来的使命 —— 让尽可能多的人接触到先进的人工智能。
外界对 GPT-5 的期待极高,它是自 2022 年 ChatGPT 让 OpenAI 声名鹊起以来,该公司最受期待的产品发布之一。据该公司称,从那以后,ChatGPT 已成长为全球最受欢迎的消费级产品之一,每周用户超过 7 亿 —— 接近全球人口的 10%。
许多人将 GPT-5 视为人工智能整体发展的风向标,硅谷对该模型的反响可能会对大型科技公司、华尔街以及监管科技的政策制定者产生深远影响。这些利益相关方正密切关注 GPT-5 是否能像其前代产品 GPT-4 那样,在人工智能能力上实现重大飞跃,打破人们对软件功能的固有预期。
GPT-5 略胜竞争对手一筹
OpenAI 称,GPT-5 在多个领域达到了最先进水平,在关键基准测试中略优于 Anthropic、谷歌 DeepMind 和埃隆・马斯克的 xAI 等公司的顶尖人工智能模型。不过,在其他一些领域,GPT-5 的表现略逊于前沿人工智能模型。
该公司表示,GPT-5 在编程领域展现出前沿水平;奥特曼称,该模型尤其擅长按需生成完整的软件应用,也就是人们所说的 “氛围编程”。
在 SWE-bench Verified(一项基于 GitHub 真实编程任务的测试)中,GPT-5 首次尝试的得分达到 74.9%。这意味着 GPT-5 略优于 Anthropic 最新的 Claude Opus 4.1 模型(得分 74.5%)和谷歌 DeepMind 的 Gemini 2.5 Pro 模型(得分 59.6%)。
在 “人类终极考试”(一项衡量人工智能模型在数学、人文和自然科学领域表现的高难度测试)中,具备扩展推理能力的 GPT-5 版本(GPT-5 Pro)在使用工具的情况下得分 42%。这略低于 xAI 的 Grok 4 Heavy 模型,后者在该测试中得分 44.4%。

OpenAI 表示,GPT-5 在回答健康相关问题方面表现更出色。在衡量人工智能模型健康领域回应准确性的测试 “HealthBench Hard Hallucinations” 中,OpenAI 称 GPT-5(启用思考功能时)的幻觉率仅为 1.6%。这远低于该公司此前的 GPT-4o 和 o3 模型,后两者的得分分别为 12.9% 和 15.8%。
尽管人工智能聊天机器人并非医疗专业人员,但数百万用户正借助它们获取健康建议。针对这一现象,该公司表示,GPT-5 会更主动地提示潜在的健康问题,并帮助用户解读医疗检查结果。
此外,OpenAI 称,在创意设计、写作等更难衡量的主观领域,GPT-5 也优于其他人工智能模型。特利表示,在创意任务中,GPT-5 的回应更自然,且展现出 “更好的品味”。
“这款模型的‘氛围’真的很棒,” 特利说。
GPT-5 也比 OpenAI 之前的模型更准确,该公司称,与 o 系列模型相比,GPT-5 的幻觉现象(即人工智能模型编造信息的倾向)大幅减少。此前,在 OpenAI 最新的人工智能推理模型(如 o3)中,幻觉问题似乎愈发严重,而该公司此前表示尚未完全弄清楚原因。
在对 ChatGPT 提示词的回应中,OpenAI 发现 GPT-5(启用思考功能时)产生幻觉并给出错误信息的概率为 4.8%。这较 o3 和 GPT-4o 有显著降低,后两者在测试中的幻觉率分别为 22% 和 20.6%。
在衡量人工智能模型完成模拟在线任务的代理能力基准测试 Tau-bench 中,GPT-5 的表现好坏参半。在测试人工智能浏览航空公司网站能力的部分,GPT-5 得分 63.5%,略低于 o3 模型的 64.8%。在测试人工智能浏览零售网站能力的另一部分,GPT-5 得分 81.1%,低于 Claude Opus 4.1 模型的 82.4%。
OpenAI 还表示,GPT-5 比其之前的模型更安全。尽管人工智能推理模型偶尔会表现出针对人类的谋划倾向,或为了达成自身目标而说谎,但 OpenAI 发现 GPT-5 的欺骗率低于其他模型。
OpenAI 安全研究负责人亚历克斯・比图尔表示,降低欺骗性不仅提高了 GPT-5 的安全性,还改善了用户体验,打造出一个 “在用户可信赖的层面上更透明、更诚实” 的模型。
比图尔还指出,GPT-5 能更好地区分试图滥用 ChatGPT 的恶意用户和提出无害请求的用户。这使得 GPT-5 能够拒绝更多不安全的问题,同时减少对寻求无害信息用户的拒绝次数。
为消费者和开发者打造的升级功能
随着 GPT-5 的发布,ChatGPT 迎来了多项用户体验升级。用户现在可以在 ChatGPT 的设置中选择四种新的人格:愤世嫉俗型、机器人型、倾听者型和书呆子型。该公司表示,这些人格将自动调整 ChatGPT 的回应方式,无需用户专门要求模型以特定方式回应。
每月支付 20 美元的 ChatGPT Plus 订阅用户比免费用户拥有更高的 GPT-5 使用限额。而每月支付 200 美元的 Pro 订阅用户可无限制使用 GPT-5,并能访问增强版的 GPT-5 Pro—— 该版本使用额外的计算资源生成更优质的答案。采用 OpenAI Team、Edu 和企业版计划的机构将在下周获得 GPT-5 作为默认模型。
对于开发者,GPT-5 将以三种规格通过 OpenAI 的 API 开放 ——gpt-5、gpt-5-mini 和 gpt-5-nano,它们在任务 “推理” 上花费的时间长短不同。开发者现在还可以通过 OpenAI API 控制回应的详细程度,决定人工智能模型的回应篇幅长短。
GPT-5 基础模型对开发者的收费为:每百万输入令牌 1.25 美元(约合 75 万个单词,比整套《指环王》系列的字数还多),每百万输出令牌 10 美元。
GPT-5 的发布之前,OpenAI 度过了忙碌的一周。该公司发布了开源权重推理模型 gpt-oss,开发者和企业可免费下载,且运行成本极低。这款开源模型的能力几乎与 OpenAI 之前的顶级模型 o3 和 o4-mini 相当,但 GPT-5 在编程等部分领域树立了新的前沿性能标准。
不过,在多个领域,GPT-5 似乎与其他前沿人工智能模型大致相当。当然,基准测试只能反映人工智能模型的部分表现,开发者将如何在现实世界中使用 GPT-5,以及该模型是否真的超越竞争对手,仍有待观察。
- • 英特尔回应特朗普要求公司CEO辞职:投资举措与总统的 “美国优先” 议程保持一致
- • 《帅飘》电视剧全集:一部充满魅力的青春励志剧
- • 女生踢裆引发的校园风波:一场关于勇气与误解的较量
- • 好博会 | 孩子尝了一口说不错!“宝妈”抢购台湾凤梨:价格实惠还好吃
- • 双子座荷花:翩翩风姿,浪漫如梦
- • 贵州凯里下司镇防汛应急响应升至Ⅰ级:低洼地带做好财产及人员撤离准备
- • 《新植物大战僵尸:一场视觉与策略的盛宴》
- • NBA最新消息排行榜:盘点今日热点,揭秘赛场风云
- • 关税不确定性持续,华尔街对美联储降息存在分歧
- • 大湾区大学正式获批,首批设5个理工类专业
- • 聚焦“反内卷”,机构本月已发283份研报,哪些行业最受关注?
- • 无菌操作试题及答案:医学实验中的关键步骤解析
- • 领导干部违规吃喝,合肥通报:庐江副县长等12人被停职检查
- • “窗口关闭初始化失败:技术故障背后的深思”
- • 吉林省疫情最新消息:今天新增病例情况详解
- • 婷婷777:一位网络红人的崛起之路
- • 恩施医学继续教育平台:助力医务人员提升专业技能,服务地方医疗事业发展
- • 福特合资公司合并传闻背后:轻资产运营以及将中国转为出口中心
- • 《俘虏兵》电视剧全集:一部展现军人英勇与牺牲精神的佳作
- • 汽车早报|小米YU7正式交付首批车主 李斌首次透露乐道L90起售价低于30万元
- • 阴沟分开的一字马,揭秘瑜伽高手的神秘技巧
- • 印巴局势紧张或爆发军事冲突,印度空军能“一雪前耻”吗?
- • 家长寄语大全:简短而深刻的智慧箴言
- • 12月6日中共中央政治局会议:聚焦国家发展大局,推动高质量发展
- • 担忧政治和法律后果,美财长建议特朗普不要罢免美联储主席
- • 鞠婧祎首次回应“四千年美女”:背后故事与成长心路
- • 2021年中山大学分数线解析:报考指南与趋势分析
- • 中国高速公路网高清图:纵横交错,织就国家交通新篇章
- • 香港1级大片大全:揭秘经典影视作品的魅力与影响
- • 特朗普称乌克兰需要“爱国者”导弹用于防御
- • 如何轻松改变任务栏颜色,打造个性化桌面体验
- • 委外加工会计分录:企业成本控制与财务管理的有效手段
- • 《影音米奇:经典动画形象的现代演绎》
- • 贝因美回应奶粉涨价:所有品项都没涨价、坚守5%利润底线
- • 南京文化艺术产权交易所客户端:便捷艺术交易,尽在掌中
- • 美总统特朗普与韩总统李在明通电话,邀请李在明访问美国
- • 高端奢华,引领潮流:揭秘高档手机的世界
- • 美国债市:美联储理事Waller的言论和通胀预期数据推动美债上涨
- • 当Labubu热潮与AI小说工具袭来|文化周报
- • 天下首富:财富神话背后的真实人生
- • 邱雨薇:在“自恋时代”,爱他者是一项艰难但必要的练习|探秘中国心灵②
- • “企业报销制度的重要性与实施策略”
- • 卫星显示伊朗核设施未全部摧毁 未来IAEA核查工作将更艰巨
- • 《国际歌中文版:跨越时空的战歌,激励人心的力量》
- • “高考档案自由可投:解读其含义与影响”
- • 大国应有的样子——2025年春季中国元首外交纪事
- • 家字五行属什么:揭秘“家”字的五行属性及其文化内涵
- • 付佳美高清大图:揭开明星的美丽面纱
- • 以军总参谋长:伊朗核计划遭受了“系统性损害”
- • 期权信号显示:关税风波下,财报季波动或将加剧
- • 特朗普签署行政令,要求全美范围内清理无家可归者营地
- • 机械表如何正确上发条:保养与使用指南
- • 广州制衣业求变:从创意孵化到大模型加持
- • 习近平向“和平薪火 时代新章——纪念中国人民抗日战争和苏联伟大卫国战争胜利80周年中俄人文交流活动”致贺信
- • 中医+音乐,大暑天的这台演出为观众吹来习习凉风
- • 安庆疫情最新消息:今天新增一例,防疫措施持续加强
- • 光明日报:划定毕业照收费“规矩”,不只是为家长减负
- • 特朗普:将对所有在国外制作的进入美国的电影征收100%的关税
- • “风雨兼程见彩虹”,“十四五”成就见证发展韧性
- • 对汽车经销商的60天返利支付承诺,可能治标不治本
- • 美国证券交易委员会结束对摩根士丹利现金清算计划的调查,未采取任何执法行动
- • 《影库东方新:探索东方电影艺术的无限魅力》
- • 榕树贷款:深入了解其服务与优势,助您轻松贷款
- • 法官批准哈佛继续接收国际生,特朗普:很可能在下周和“藤校”和解
- • 李云泽会见英中贸易协会主席古沛勤
- • 《辣味十足,短篇辣文合集:一场视觉与情感的盛宴》
- • 任正非最新讲话:华为的战略布局与未来展望
- • 上海交大教授殷承良:车路网云应用试点成效不佳,“当时各个城市都申请了很多, 今天为什么弄不动”?
- • “恒大系”12笔不良债权摆上货架,债权总额约113亿元
- • “鸡汤来喽”:网络流行语背后的温暖力量
- • 人民日报关注:华东华北东北等地持续遭遇强降雨,各地落实落细防汛措施
- • 金庸作品电视剧:经典武侠的视觉盛宴
- • 冀东军区:抗日战争中的红色堡垒
- • 新片|《南京照相馆》定档8月2日,刘昊然、王传君主演
- • 《混沌少年时》:走向线上的犯罪,流向现实的厌女
- • 《探索鲁51视频:在线观看的精彩世界等你来发现》
- • 欧洲股市在美联储决议公布前走低 贸易担忧令市场承压
- • 蓝佛安最新发声!信息量很大
- • 日照一家新三板企业实控人失联,曾是“国内资本市场最年轻董事长”
- • 汽车早报|尊界S800上市7天大定达3600台 宝思齐将出任华晨宝马总裁兼首席执行官
- • 中石油副总经理任立新:今年底公司新材料产能将达500万吨
- • 揭秘“九九九色成人网”:网络监管与用户安全的双重挑战
- • 期权价格:揭秘金融市场的“价格之谜”
- • 台湾媒体人李艳秋:坚守新闻理想,助力两岸交流
本文 快租网 原创,转载保留链接!网址:https://mip.kuaizu.me/post/25020.html