Apple 發布用於設備端 AI 的開源 OpenELM

Apple 通過 OpenELM(開源高效語言模型)在設備人工智能方面取得了重大進展。這套開源大型語言模型旨在直接在您的 iPhone、iPad 或 Mac 上運行,讓強大的 AI 功能離您更近。這種方法通過將數據保存在設備上而不是依賴遠程服務器來優先考慮用戶隱私。

OpenELM 是一個由八個緊湊語言模型組成的系列,專門針對 Apple 設備上的高效操作進行了優化。這些模型的參數大小從 2.7 億到 30 億不等,在公開數據集上進行訓練。您可以通過 Hugging Face Hub 訪問它們,這是一個供人工智能開發人員共享和協作代碼的流行平台。

更多閱讀:中國開源人工智能模型“悟空”挑戰美國主導地位

OpenELM 的與眾不同之處在於它使用了分層擴展策略。這意味著模型內的資源分配更加有效,從而提高了準確性。蘋果發布了預訓練模型和根據具體指令進一步調整的模型,展示了他們對人工智能領域開放研究和合作的承諾。作為概述通過蘋果:

OpenELM,最先進的開放語言模型。 OpenELM 使用分層縮放策略來有效地分配變壓器模型每一層內的參數,從而提高準確性。例如,在參數預算約為 10 億個參數的情況下,OpenELM 與 OLMo 相比,精度提高了 2.36%,同時需要的預訓練令牌減少了 2 倍。

與之前僅提供模型權重和推理代碼以及在私有數據集上進行預訓練的做法不同,我們的版本包括在公開數據集上訓練和評估語言模型的完整框架,包括訓練日誌、多個檢查點和預訓練配置。

通過將 OpenELM 開源,Apple 邀請更廣泛的研究社區來探索和改進這些模型。這提高了透明度,使研究人員能夠識別並解決數據和模型設計中的潛在偏差。除此之外,開發人員和企業還可以針對特定應用程序調整 OpenELM,從而加速創新。

雖然 OpenELM 尚未集成到 Apple 設備中,但有傳言稱 iOS 18 將推出令人興奮的新 AI 功能。我們期望 Apple 將利用 OpenELM 來增強設備上的用戶體驗,同時將您的隱私放在首位。

總體而言,Apple 推出 OpenELM 標誌著設備上 AI 處理向前邁出了重要一步。這種方法優先考慮用戶隱私並促進人工智能研究社區內的協作。隨著 OpenELM 可能集成到 iOS 18 中,我們可以期待在不久的將來在我們的 Apple 設備上獲得更強大、更安全的 AI 體驗。