原文:OpenAI Just Upgraded ChatGPT's Default Model—Here's What GPT-5.5 Instant Actually Does
将 Decrypt 添加为您的首选来源,以便在 Google 上查看我们的更多故事。
简而言之,从今天开始,GPT-5.5 Instant 取代 GPT-5.3 Instant 成为 ChatGPT 的默认模型,并免费向所有用户推出。
在 OpenAI 的内部测试中,该模型在高风险医疗、法律和财务提示方面产生的幻觉索赔比其前身减少了 52.5%。
GPT-5.5 Instant 是 OpenAI 在网络安全和生物领域归类为“高能力”的第一个 Instant-tier 模型,在部署时需要额外的保护措施。
OpenAI 刚刚更换了 ChatGPT 内的引擎。从今天开始,GPT-5.5 Instant 取代 GPT-5.3 Instant 成为每天打开 ChatGPT 的数亿人使用的默认模型。
这不是一次华丽的发布;而是一次华丽的发布。没有新模式,没有令人瞠目结舌的演示。但当升级将幻觉减少一半以上时,“小改进”是一个相对术语。
什么是 GPT-5.5 Instant?
OpenAI 的 GPT 系列是分层发布的。 Instant 是日常型号,专为速度和一般用途而设计;对于复杂问题,思考是更慢、更具分析性的版本; Pro 是适合最大强度任务的重量级产品。
GPT-5.5 Instant 是大多数 ChatGPT 用户将与之交互的层的最新更新,无论他们是否意识到。
据 OpenAI 称,在医学、法律和金融领域的高风险提示上,新模型比 GPT-5.3 Instant 产生的幻觉主张更少。从一开始,幻觉就是 ChatGPT 最持久的缺陷。
OpenAI 还针对真实用户之前标记为事实错误的对话进行了测试。其中,不准确的索赔下降了 37.3%。
在 HealthBench(测试人工智能对真实医疗问题的反应的基准测试,评分从 0 到 100)上,GPT-5.5 Instant 得分从 49.6 分上升到 51.4 分。在临床使用版本 HealthBench Professional 上,它从 32.9 点跃升至 38.4 点。
健康问题是人们最常问 ChatGPT 的问题之一,这使得解决这些问题不仅仅是一个长凳
