Grok Imagine 影片生成

Grok Imagine Video 是 xAI 的旗艦 AI 影片生成模型,由 Elon Musk 的 xAI 團隊打造。它基於 Aurora 自迴歸 MoE 引擎,在一次前向推理中生成短小、高保真的影片片段(6 或 10 秒,最高 720p、24 fps)。現已登陸 Elser AI 統一平台——無需 GPU 或複雜配置。

探索 Elser AI 上的 Grok Imagine Video 生成模式

文字生影片

僅憑一段文字提示詞就能直接生成影片。描述場景、動作、運鏡和氛圍——Grok Imagine Video 會從零開始生成完整的視覺序列。無需任何源圖。

立即體驗 Grok Imagine

圖片生影片

上傳一張靜態圖片——人像、產品照或插畫——看它在真實的運動與物體互動中活起來。模型能理解不同的內容類型:卡通角色、產品展示或人像動畫。

立即體驗 Grok Imagine

參考生影片(R2V)

提供最多 7 張參考圖並配上文字提示詞,在多個鏡頭間引導角色一致性、視覺風格或場景設定。這徹底消除了其他 AI 影片模型常見的「換臉漂移」問題。

立即體驗 Grok Imagine

如何在 Elser AI 上使用 Grok Imagine Video

第 1 步:註冊並輸入提示詞

建立免費的 Elser AI 帳號。用自然語言描述你的影片構想——指定角色、場景動作、機位角度和氛圍。Grok Imagine Video 能理解專業的電影製作術語。

第 2 步:選擇生成模式並上傳參考素材

選擇你的模式——文字生影片、圖片生影片(上傳 1 張圖)或參考生影片(上傳最多 7 張參考圖以保持角色/風格一致)。為獲得最佳效果,請上傳標準格式(JPG、PNG、WEBP)的清晰、高對比度圖片。

第 3 步:自訂並生成

調整影片時長(6 或 10 秒)、解析度(480p 或 720p)和長寬比(16:9、9:16 或 1:1)。可選地設定負向提示詞或固定種子以獲得更精細的控制,然後生成並匯出為 MP4——可直接用於社群、廣告或創意專案。

用 Grok Imagine Video 你能做什麼?

用文字生成電影級 AI 影片

僅憑文字提示詞生成電影級影片。描述任意場景——從未來都市景觀到細膩的角色時刻——Grok 都能交付帶流暢運鏡與連貫動態的畫面。

適合用於:

  • 短片與敘事短影片
  • 社群短片與廣告
  • 創意實驗與概念短片

把靜態圖片動畫成影片

把靜態產品攝影變成動態演示——一張手錶照片變身優雅轉腕的奢華廣告,一張球鞋圖獲得戲劇燈光下的 360 度旋轉。或把專業頭像動畫成帶自然表情和肢體語言的影片介紹。

非常適合:

  • 產品展示與電商廣告
  • 人像與頭像動畫
  • 讓插畫與美術作品動起來

跨場景保持角色一致

借助最多 7 張參考圖,Grok Imagine Video 在多個鏡頭之間保持角色身份、服裝與面部特徵一致——徹底消除老模型常見的換臉漂移問題。非常適合動畫系列、品牌吉祥物或系列化敘事。

你可以:

  • 用同一個主角講完多場景故事
  • 讓品牌吉祥物與角色設計保持統一
  • 為系列化廣告活動生產可量產內容

你可能也感興趣

大家都在討論 Grok Imagine Video

Grok Imagine 在 DesignArena 的影片榜單上橫掃全部四個類別——影片競技場、圖生影片、影片編輯和多圖生影片——超越了 Google Veo 3.1、OpenAI Sora 和 Kling。

— DesignArena 基準測試,2026 年 3 月

每分鐘生成影片 4.20 美元,Grok Imagine 1.0 的價格與 Kling 2.5 Turbo 持平,且遠低於 Google Veo 3.1 Preview(12 美元/分鐘)和 OpenAI Sora 2 Pro(30 美元/分鐘)。

— DeepLearning.AI,2026 年 3 月

Aurora 自迴歸 MoE 架構與擴散模型有本質區別。基於參考的角色一致性和場景連貫性,對製作流程是顛覆性的。

— David T.,AI 研究員

我們用 Grok Imagine 的參考生影片在一部 50 秒短片裡保持角色一致。沒有換臉漂移,沒有不一致。幫我們省下了好幾週的手動修復。

— Sofia L.,獨立動畫師

文字生影片約 17 秒就能出片,快得驚人。我們把 API 接進了社群內容流水線,單條片段的成本低得驚人。性價比無可匹敵。

— Marcus W.,行銷技術負責人

Grok Imagine 在 API 上線後的第一個月就生成了 12.45 億條影片——這是經過規模驗證的基礎設施。

— xAI 官方公告

常見問題

Grok Imagine Video 是 xAI 的旗艦 AI 影片生成模型,構建於 Aurora 自迴歸專家混合(MoE)引擎之上。它可以從文字提示詞、靜態圖片或參考照片生成短小、電影級的影片片段(6 或 10 秒)。

該模型支援三種主要模式:(1) 文字生影片——僅憑提示詞生成,無需源圖。(2) 圖片生影片——將單張靜態圖片動畫成影片片段。(3) 參考生影片(R2V)——使用最多 7 張參考圖,在多個鏡頭間引導角色一致性與視覺風格。

最高解析度為 720p、24 fps。可生成 6 秒或 10 秒的片段,支援 16:9、9:16 或 1:1 三種長寬比——很適合橫螢幕、直螢幕和方形等社群格式。

2026 年 3 月,DesignArena 基準排名顯示 Grok Imagine Video 在影片生成競技場(Elo 1337)、圖生影片(Elo 1298)、影片編輯(Elo 1291)和多圖生影片均位列第一——超越 Google Veo 3.1、OpenAI Sora 和 Kling。

可以。除了主提示詞,你還可以加入負向提示詞,引導模型避開不想要的元素;並設定固定種子,以重現某次結果或在多次生成中保持一致地迭代。

無需任何配置。所有處理都在 Elser AI 的雲端基礎設施上運行——無需 GPU、無需大記憶體、無需安裝軟體。只要一台能上網的裝置即可。

生成的片段以標準 MP4 檔案匯出,可直接下載用於社群、廣告或你的剪輯時間線——無需轉換。

註冊免費的 Elser AI 帳號,進入 Grok Imagine Video 模型頁,選擇生成模式(文字 / 圖片 / 參考生影片),輸入提示詞和可選的參考素材,調整時長和解析度並生成。第一段影片片段不到一分鐘即可完成。

了解更多 Grok Imagine Video

用 Grok Imagine Video 讓你的故事鮮活起來

在 Elser AI 註冊即可解鎖 Grok Imagine Video 的全部能力——從文字生影片、圖片生影片,到基於參考的逐鏡頭角色一致性。

在 Elser AI 上體驗 Grok Imagine Video