OpenAI推出不到一周的最新旗舰模型没能等来“好评如潮 ”。
近日 ,OpenAI在十周年之际发布了GPT-5.2系列模型,官方数据显示其在GDPval等专业基准测试中超越人类专家,是迄今为止在“专业知识工作方面”表现最好的模型 。
据OpenAI官方披露,GPT-5.2在多领域实现技术突破:GDPval测试中覆盖44个职业的任务表现70.9%优于顶尖专家 ,SWE-bench Pro编程测试获55.6%的SOTA成绩,还将幻觉率较GPT-5.1降低38%。该公司CEO山姆·奥特曼称其为“许久以来最大的升级”,并透露计划2026年1月解除应对谷歌竞争的“红色警报”。
但该模型上线后遭到大量用户吐槽 ,认为其从常识问答到情感交互,“智商不稳定 ”。
SimpleBench常识推理测试显示,GPT-5.2得分低于Anthropic发布的Claude Sonnet 3.7 ,甚至在“garlic有几个r”的基础问题上反复出错——有用户三次测试仅一次答对,而谷歌的Gemini 3.0等竞品均稳定通关 。该测试旨在评估大模型在处理普通人认为简单,但对机器而言充满挑战的逻辑推理任务的能力。前AWS总经理Bindu Reddy直言 ,“不值得从GPT-5.1升级”。
网友晒出GPT-5.2在SimpleBench上的成绩单 。
一些编程爱好者则发现,GPT-5.2生成的交通灯模拟代码画面仅达“黑白火柴人级别 ”,蒙娜丽莎ASCII艺术创作效果远逊于GPT-4o。情感交互中有用户倾诉“恐慌发作” ,竟收到“很高兴听到这个消息”的回复,安慰失宠孩童时则机械强调“生物都会停止运作 ”,缺乏此前版本的亲和力和自然表达。
此外,该版本在处理连续对话时不稳定 ,甚至在明确选择“高级思考模式”时也会返回低质量的自动响应,令用户不得不重新调整使用方式 。
还有用户表示,GPT-5.2的安全策略实施过于严格 ,在执行普通且无风险的请求时也会拒绝操作并给出无关的安全提示。
有观察人士指出,这轮差评潮背后存在几重因素。一方面,OpenAI推广时着重强调GPT-5.2的专业能力和基准测试成绩 ,但普通用户更关注日常对话 、流畅性和创造性体验,两者的期望存在错位;另一方面,由于竞争加剧和内部发布节奏加快 ,有观点认为该版本可能发布过早,尚未充分优化在关键使用场景中的稳定性与一致性,因此用户的实际感受出现明显落差 。
截至发稿 ,OpenAI尚未就这轮用户反馈作出公开回应,但公司在官方资料中表示,会持续改善用户体验、优化安全策略,并根据用户反馈推进后续版本的迭代。
当前 ,OpenAI仍面临来自谷歌的巨大竞争压力。谷歌此前推出的Gemini 3在编程、多模态理解等关键企业应用场景上实现了对ChatGPT的性能超越 。11月,谷歌宣布Gemini月活跃用户已突破6.5亿,较7月报告的4.5亿实现大幅增长 ,而OpenAI披露的周活跃用户数接近8亿。
为此,奥特曼曾发布“红色代码”警报,决定暂时搁置包括Sora视频生成器在内的长期研发项目 ,转而在短期内全力通过提升用户活跃度来巩固ChatGPT的大众市场地位。但急转直下的口碑或在很大程度上影响ChatGPT的使用率,OpenAI能否拿出更强有力的“武器 ”反击谷歌仍存在不确定性。
股票的买入技巧:股票突破平台是什么意思-12月15日晚间沪深上市公司重大事项公告最新快递
新上市的股票买入技巧:股票如何手机交易-美联储今夜降息无悬念!华尔街紧盯鲍威尔 这一表述或定调明年政策走向
买入股票详细技巧:买股票在手机上怎么开户-网易三季度营收增长8% 丁磊:未来将更专注、持续投入已有的成功产品
配资炒股平台首选配资:股票分批买入的技巧-年内A股IPO回暖 港股首发融资千亿
怎么融资杠杆炒股:手机上交易股票-7月15日龙虎榜复盘:“成都系”1.6亿元净买入新易盛
手机上怎么样才能买股票:融资买入股票的利息和手续费-iPhone Air上市遇冷 史上最薄的iPhone卖不动了?
长宏网-杠杆配资网-专业配资杠杆炒股-专业杠杆配资开户提示:文章来自网络,不代表本站观点。
2025年3月24日下午三点A股收盘后,港股科技板块持续走强至四点十分收盘。消息面上,一方面美元相对于人民币连续3个交易...
7月16日出版的第14期《求是》杂志将发表中共中央总书记、国家主席、中央军委主席习近平的重要文章《坚定不移推进高水平...
6月18日(星期三),今日报刊头条主要内容精华如下: 中国证券报 国企改革深化提升行动重点任务平均完成率超80%...
美股三大指数集体收涨,纳斯达克指数涨2.06%,标普500指数涨1.81%,道琼斯指数涨1.56%。标普500指数本周上...
首个可叠加国补政策红利的618大促落下帷幕,扫地机器人成为小家电细分品类中的“销量担当”。天猫数据显示,618期间可...
央行公告,为保持银行体系流动性充裕,更好满足不同参与机构差异化资金需求,自本月起中期借贷便利(MLF)将采用固定数量、利...
2025年4月8日至9日,中国人民银行副行长宣昌能赴马来西亚吉隆坡出席东盟与中日韩(10+3)财政和央行副手会,并代表中...
记者|张乔遇火锅丸子等速冻食品“一哥”安井食品近日披露了向香港联交所递交了境外发行上市申请,拟在联交所主...
热点聚焦 中美关系: 玉渊谭天发文详解中美元首通话。其中写道,6月5日晚,国家主席习近平应约同美国总统特朗普通电...
据央视新闻报道,当地时间19日夜间,以色列12频道披露了以色列对伊朗核科学家发动暗杀行动的更多细节。 报道称,以色...
国金证券指出,7月A股迎来自下而上的牛市氛围,市场的火热是流动性宽松与政策预期共振的结果,情绪改善来自外部环境的积极...
对抗阻碍执法、消极应对整改的*ST紫天(300280)6月27日深夜公告,福建证监局对公司出具《行政处罚事先告知书》...
“公司的产品有在人形机器人上应用吗?”在近期的互动平台上,这是电池企业需要解答的投资者问题之一。市场关注的背后,全球人形...
海洋经济再迎利好。 今天(7月2日)早盘海洋经济概念飙升。截至上午收盘,海洋经济指数涨近6%。消息面上,中央财经委...
界面新闻记者|邹文榕继1月正式取得经营证券期货业务许可证后,3月21日,国信证券资产管理有限公司(下称:国信...