Apple 的 MGIE 和 Keyframer 為圖像和動畫帶來人工智能驅動的創造力

蘋果最近推出了兩款人工智能工具:MGIE(MLLM 引導圖像編輯)和 Keyframer。這些尖端技術有望重新定義用戶與圖像和動畫交互的方式,利用人工智能的力量來簡化複雜的任務,並使所有人更容易進行創造性的努力。

Apple 與加州大學聖巴巴拉分校的研究人員合作推出了 MGIE,這是一種人工智能模型,旨在通過自然語言命令徹底改變圖像編輯。通過利用多模式大語言模型 (MLLM),MGIE 解釋用戶指令以執行精確的像素級操作,提供無縫且直觀的編輯體驗。從裁剪和調整大小等基本調整到對像操作和顏色增強等高級修改,MGIE 使用戶能夠釋放他們的創造力,而無需專門的軟件。

Apple 的 Keyframer 代表了動畫設計的重大進步,使用戶能夠使用簡單的文本提示為靜態圖像製作動畫。 Keyframer 由大型語言模型 (LLM) 提供支持,可從靜態 SVG 圖像和文本描述生成 CSS 動畫代碼,從而無需複雜的動畫軟件。雖然仍處於原型階段,Keyframer 擁有未來融入 Apple 產品生態系統的巨大潛力,為直觀且易於訪問的動畫創作鋪平了道路。來自一篇論文發表蘋果研究人員:

Keyframer 是一種基於大型語言模型 (LLM) 的動畫原型製作工具,可以從靜態圖像 (SVG) 生成動畫。用戶可以通過添加提示和編輯 LLM 生成的 CSS 動畫代碼或屬性來迭代他們的設計。此外,用戶可以請求設計變體來支持他們的構思和探索。

雖然一次性提示界面在 Dall·E 和 Midjourney 等商業文本到圖像系統中很常見,但我們認為動畫需要一組更複雜的用戶考慮因素,例如時間和協調,這些因素很難在單個提示中完全指定,因此,可能需要替代方法,使用戶能夠迭代地構建和完善生成的設計,尤其是對於動畫。

我們將基於語言提示設計工件的新興設計原則與法學碩士的代碼生成功能相結合,構建了一種名為 Keyframer 的新的人工智能驅動的動畫工具。借助 Keyframer,用戶可以通過自然語言提示從靜態 2D 圖像創建動畫插圖。使用 GPT-4 3,Keyframer 生成 CSS 動畫代碼,以對輸入的可縮放矢量圖形 (SVG) 進行動畫處理。

MGIE 和 Keyframer 都體現了增強創造力和民主化設計的需求。通過利用人工智能和自然語言處理,這些工具打破了進入壁壘,使所有技能水平的用戶都可以使用高級編輯和動畫功能。

了解更多:

閱讀更多:

  • Apple 將在 WWDC 2024 上推出 Siri 的生成式 AI 功能 – Gurman – Classic e