OpenAI 推出 GPT-5,具有更智能的推理、更安全的響應和自定義個性

OpenAI 正式推出了迄今為止最強大的人工智能係統 GPT-5。該模型面向所有 ChatGPT 用戶推出,在智能、安全、推理以及寫作、編碼、健康和視覺感知方面的可用性方面進行了重大升級。 GPT-5將成為登錄用戶的默認模型,“GPT-5思維”和“GPT-5專業版”為更複雜的任務提供增強的推理和更高質量的響應。

GPT-5是一個統一的系統,由三部分組成:用於一般查詢的快速高效的基礎模型、用於更困難問題的更深層次的推理模型以及決定使用哪個版本的實時路由器。路由器根據提示的複雜性、用戶指令和工具要求進行智能調整。如果用戶達到使用限制,較小的 GPT-5 迷你模型將繼續服務請求。 OpenAI 的目標是在未來將這些組件統一為一個模型。

與早期模型相比,GPT-5 顯著減少了幻覺,更準確地遵循指令,並更誠實地適應困難或模糊的請求。例如,在現實世界的測試中,GPT-5 的回答包含事實錯誤的可能性比 GPT-4o 低 45%,與 OpenAI o3 相比,“GPT-5 思維”將幻覺減少了 80%。該模型對其局限性也不再那麼阿諛奉承,而是更加直率,能夠提供更清晰、更安全、更有幫助的答复。

GPT-5 的性能在廣泛的基準測試中創下了新記錄。它在 AIME 2025 上的數學得分為 94.6%,在 SWE-bench Verified 上的代碼得分為 74.9%,在 HealthBench Hard 上的醫學問題得分為 46.2%。它還在多模態理解方面表現出色,在 MMMU 上達到 84.2%,並在 GPT-5 pro 的 GPQA 上達到 88.4%。這些改進轉化為法律、工程、物流和科學問題解決等領域的現實收益。

OpenAI 還介紹新的定制功能。 GPT-5 支持改進的指令遵循,現在包括預設個性的研究預覽:憤世嫉俗者、機器人、傾聽者和書呆子。這些有助於定制 ChatGPT 響應的語氣,無需立即進行工程設計,旨在減少過度同意並提高對話質量。

在安全方面,GPT-5引入了一種新的“安全完成”訓練方法,用既有幫助又限制在安全範圍內的響應取代簡單的拒絕。這包括對雙重用途查詢的細緻處理以及在任務無法完成的情況下提高誠實度。在生物和化學等高風險領域,GPT-5 思維被視為高性能,並配有額外的安全機制,例如紅隊和始終在線的分類器。

對於開發人員和高級用戶來說,GPT-5 pro 取代了 OpenAI o3-pro,並提供 GPT-5 系列中最佳的性能。它在生成過程中使用並行計算來進行更深入的推理,在現實世界任務中,專家們在 67.8% 的情況下更喜歡它,而不是基礎 GPT-5,特別是在科學、健康和高級編碼等領域。

GPT-5 現已向 ChatGPT Free、Plus、Pro 和 Team 用戶推出。專業版用戶可以獲得無限制的訪問權限,並且可以使用 GPT-5 專業版。免費用戶可以訪問核心 GPT-5 模型,但有使用限制,一旦達到限制,即可回退到 GPT-5 mini。 GPT-5 將在一周內到達 Enterprise 和 Edu 客戶。此外,GPT-5 現在可通過 OpenAI Codex CLI 和 API 供開發人員使用。

有關的:OpenAI 首席執行官 Sam Altman 概述了 GPT-4.5 和 GPT-5 的路線圖