OpenAI 首次推出 GPT-OSS,这是一个供开源使用的轻量级模型系列

OpenAI 推出了 GPT-OSS,这是一个专为开源社区设计的小型、开放权重语言模型的新系列。这些模型针对效率、速度以及与各种硬件的广泛兼容性进行了优化,使其成为想要在不依赖大规模基础设施的情况下获得可定制人工智能工具的开发人员和研究人员的理想选择。

GPT-OSS 以三种模型大小发布:1.2 亿、4.1 亿和 11 亿个参数。每个版本都经过指令调整并支持多种语言。这些模型比 GPT-3.5 和 GPT-4 小,但旨在在边缘设备上提供快速性能,并在离线或受限环境中良好运行。尽管尺寸很小,但这些模型在各种基准测试中都表现出了强劲的结果,包括 MMLU 和 GSM8K。

GPT-OSS 的目标是为大型模型提供轻量级、灵活的替代方案,特别是在优先考虑低延迟、可解释性或能源效率的用例中。这些模型还旨在作为学术研究或微调实验的强有力的基线。 OpenAI 表示,他们已经将 GPT-OSS 与类似的开放权重模型进行了基准测试,发现它们在一般语言任务中具有竞争力。

与 ChatGPT 或 GPT-4 不同,GPT-OSS 模型未连接到更广泛的 OpenAI 生态系统。没有本机 API 集成、内存或浏览支持。相反,它们以开放重量许可证发布,并在 GitHub 和 Hugging Face 上提供,使开发人员能够完全控制部署、定制和本地使用。权重附带模型卡和透明度评估指标。

另请阅读:中国开源人工智能模型“悟空”挑战美国主导地位

OpenAI 发布 GPT-OSS 之际,轻量级模型在设备上应用程序和私有部署中越来越受欢迎。随着人们对开放权重模型的兴趣日益浓厚以及对可重复研究的需求增加,GPT-OSS 为那些寻求具有 OpenAI 训练基础设施可靠性的小型法学硕士的人提供了一个新的切入点。该公司强调,这些模型没有使用私人用户数据进行训练,并且安全评估已记录在模型卡中。

虽然 GPT-OSS 在推理或多轮聊天质量方面无法与 GPT-4 相媲美,但其可访问性、性能尺寸比和易于实验使其对开放权重模型生态系统做出了宝贵的贡献。开发人员现在可以在本地使用 GPT-OSS 进行构建,针对特定领域对其进行微调,或将其用作架构研究的测试平台。