OpenAI 推出了 GPT-OSS,這是一個專為開源社區設計的小型、開放權重語言模型的新系列。這些模型針對效率、速度以及與各種硬件的廣泛兼容性進行了優化,使其成為想要在不依賴大規模基礎設施的情況下獲得可定制人工智能工具的開發人員和研究人員的理想選擇。
GPT-OSS 以三種模型大小發布:1.2 億、4.1 億和 11 億個參數。每個版本都經過指令調整併支持多種語言。這些模型比 GPT-3.5 和 GPT-4 小,但旨在在邊緣設備上提供快速性能,並在離線或受限環境中良好運行。儘管尺寸很小,但這些模型在各種基準測試中都表現出了強勁的結果,包括 MMLU 和 GSM8K。
GPT-OSS 的目標是為大型模型提供輕量級、靈活的替代方案,特別是在優先考慮低延遲、可解釋性或能源效率的用例中。這些模型還旨在作為學術研究或微調實驗的強有力的基線。 OpenAI 表示,他們已經將 GPT-OSS 與類似的開放權重模型進行了基準測試,發現它們在一般語言任務中具有競爭力。
與 ChatGPT 或 GPT-4 不同,GPT-OSS 模型未連接到更廣泛的 OpenAI 生態系統。沒有本機 API 集成、內存或瀏覽支持。相反,它們以開放重量許可證發布,並在 GitHub 和 Hugging Face 上提供,使開發人員能夠完全控制部署、定制和本地使用。權重附帶模型卡和透明度評估指標。
OpenAI 發布 GPT-OSS 之際,輕量級模型在設備上應用程序和私有部署中越來越受歡迎。隨著人們對開放權重模型的興趣日益濃厚以及對可重複研究的需求增加,GPT-OSS 為那些尋求具有 OpenAI 訓練基礎設施可靠性的小型法學碩士的人提供了一個新的切入點。該公司強調,這些模型沒有使用私人用戶數據進行訓練,並且安全評估已記錄在模型卡中。
雖然 GPT-OSS 在推理或多輪聊天質量方面無法與 GPT-4 相媲美,但其可訪問性、性能尺寸比和易於實驗使其對開放權重模型生態系統做出了寶貴的貢獻。開發人員現在可以在本地使用 GPT-OSS 進行構建,針對特定領域對其進行微調,或將其用作架構研究的測試平台。
