GPT-5.6 AI 影片生成提示詞指南

來源: Elser AI

GPT-5.6 AI 影片生成提示詞指南

AI 視頻提示與圖像提示並不相同。

圖像提示用於描述單影格畫面。 視頻提示則用於描述時間維度。 這意味著它需要在數秒內管控主體、運動、鏡頭、光線、連貫性、風格以及各類限制條件。 若提示詞不夠精準,生成結果或許依然視覺效果出眾,但可能無法實際投入使用。 角色可能出現偏移。 產品可能發生扭曲變形。 鏡頭運動幅度過大。 藝術風格可能發生改變。 場景可能沒有足夠空間新增字幕。 轉場也可能無法與前一鏡頭銜接。

GPT-5.6 能夠幫助創作者撰寫更優質的提示詞,因為它可以對生產流程架構進行推理。OpenAI 的 GPT-5.6 預覽版推出了由 Sol、Terra 和 Luna 組成的模型家族,其中 Sol 被定位為旗艦型號,Terra 為低成本高效能的優選方案,Luna 則是速度最快、成本效益最高的選項。在預覽階段,OpenAI 表示目前僅透過 API 和 Codex 向經過篩選的可信組織開放訪問權限,後續計劃擴大開放範圍。

對於創作者而言,這意味著GPT-5.6應被視為一個規劃層。它有助於梳理思路並撰寫出更完善的指令。像這類工具 Elser AI 隨後將這些指令轉化為生成式影片:動漫片段、產品廣告、角色場景、圖轉影片鏡頭、音樂錄影帶畫面、應用推廣內容以及短影片內容。

本指南為你提供了一套實用的提示框架,用於運用GPT-5.6風格的推理 AI影片生成.

核心AI影片提示詞公式

一個優質的AI影片提示詞通常包含八個部分:

格式

主題

身分或產品保護

操作

相機

照明

風格

限制

公式如下:

“拍攝一段[format]格式的影片鏡頭。 拍攝主體為[subject]。 請保留[identity/product/style details]。 在該鏡頭中,[specific action]。 鏡頭設定:[movement and framing]。 燈光:[source and mood]。 風格:[visual style]。 請規避[failure modes]。”

這種結構之所以有效,是因為它將穩定元素與靈活元素分離開來。

固定元素是指不得更改的內容:角色形象、產品包裝、logo、服裝造型、藝術風格、場地布局。

靈活元素指的是可進行調整的各類元素:動作、鏡頭、情緒、背景動態、光影氛圍、字幕位置。

人工智慧影片相關問題通常出現在提示詞未向模型指明哪些元素應歸屬於哪個類別的情況下。

角色一致性提示

對於角色類影片,角色身分必須擺在首位。 不要以動作開場。 要以角色開場。

弱提示詞

動漫女孩在城市中奔跑。

強提示詞:

“使用參考圖中的同一動漫角色。保留她完全一致的臉型、琥珀色眼眸、黑色短髮、黃色防雨外套、紅色徽章、黑色短褲、白色運動鞋,勻稱小巧的身材比例,以及乾淨的賽璐璐上色動漫風格。在本鏡頭中,她奔跑在飄雨的霓虹小巷,同時手持一個發光包裹。鏡頭:側面追蹤鏡頭,中景構圖。打光:藍色霓虹反光與暖調街燈。無面部走形、無服裝變更、無髮型更動、無年齡變化、無風格走樣。”

此提示詞在請求執行動作前會保護身份資訊。

使用Elser AI時,請先上傳或建立角色參考。隨後使用GPT-5.6產生可重複使用同一身份模組的場景提示詞。這比僅透過文字產生所有場景要安全得多。

產品影片徵集

對於產品影片來說,準確性比視覺想像力更為重要。 產品不得改變形狀、標籤、標誌、包裝、材質、顏色或比例。

提示詞模板:

“根據參考圖片製作[format]的產品影片。請完整且準確地保留產品的外形、logo、標籤、顏色、包裝、材質、瓶蓋、螢幕、按鍵及比例。產品[action or visual treatment]。鏡頭:[movement]。燈光:[style]。背景:[environment]。如需新增[text/CTA],請預留空間。嚴禁對產品進行變形,不得扭曲標籤、更改logo,亦不得虛構產品特性。”

範例:

“根據參考圖片製作一條直式9:16比例的TikTok風格產品廣告。請保留產品的精確形狀、品牌標誌、標籤、包裝、瓶蓋、顏色、材質及比例。以快速吸睛的視覺鉤子開篇,隨後在乾淨的影棚檯面上清晰展示該產品。鏡頭:先快速推近,再緩慢停留以打造高級質感。燈光:使用明亮柔和的影棚燈光,搭配真實自然的陰影效果。頂部預留乾淨空白區域用於添加字幕文字。請勿對產品進行變形,請勿扭曲產品標籤,請勿新增任何包裝細節。”

GPT-5.6 可協助將單份產品簡介改寫為多種提示詞變體:電商主視覺廣告、奢侈品廣告、生活場景素材、TikTok引流鉤子、問題解決方案類廣告以及最終的CTA鏡頭。隨後Elser AI即可根據產品圖片生成對應的影片版本。

圖像轉影片提示

圖生影片提示詞應保留來源圖像。提示詞不應要求AI重新設計所有內容。

提示詞模板:

“使用[特定運動]為來源圖像製作動畫。保留原始主體、構圖、藝術風格、色彩、光照、背景以及重要細節。新增[環境運動或鏡頭運動]。請勿變更[受保護元素]。”

範例:

“為來源動漫圖像添加細膩可控的動態效果。角色緩緩轉頭看向鏡頭並眨眼。保留完全一致的面部造型、髮型、服裝、身體比例、背景構圖、色彩搭配以及賽璐璐動漫風格。添加輕微的髮絲飄動與柔和的燈光閃爍效果。鏡頭:緩慢推近。禁止面部變形、更換服裝、身體扭曲以及風格偏移。”

圖像轉影片在運動幅度適中時效果最佳。如果你要求過大的運動幅度,該模型可能需要憑空補全缺失的人體結構、拍攝角度或背景細節。

提示相機移動

鏡頭運動應該具體且有合理的動機。避免僅使用「電影感」一詞。

實用相機用語包括:

緩慢推入

靜態特寫

中景側面跟拍鏡頭

低角度揭示

平緩地從左向右平移

過肩鏡頭

廣角定場鏡頭

微距產品特寫

細微的手持動作

環繞產品的緩慢軌道運行

平拍中景鏡頭

相機應符合影片的用途。

用於情緒烘托:緩慢推鏡。

用於營造張力:靜態構圖或大特寫鏡頭。

高端產品展示:微距特寫與緩慢旋轉。

動漫動作拍攝:側面跟拍鏡頭或動態推鏡頭。

用於教育:穩定的架構與清晰可讀的圖表。

適用於房地產場景:緩慢看房漫遊或輕柔平移鏡頭。

GPT-5.6 可以依據創作目標幫助選擇合適的鏡頭語言。隨後 Elser AI 可在生成過程中應用該方向。

光照提示

照明應當有光源。「美觀的照明」太過籠統。「左側的溫暖窗邊自然光」才是實用的。

範例:

從左側照來的柔和窗光

暖調日落逆光

手機螢幕發出的藍色光暈

濕滑路面上的霓虹倒影

單盞檯燈營造出溫馨的陰影

高階專業攝影棚燈光,帶有柔和反光

陰天的日光,色彩柔和

黃金時段輕裝旅行

光線會影響畫面一致性。如果每個鏡頭的打光風格都不一樣,影片就會顯得脫節。對於多鏡頭影片,請在各個提示詞中保持打光描述的一致性。

過渡提示

流暢的鏡頭轉場需要做好連貫性規劃。若角色在某段鏡頭的結尾處做出轉動動作,下一段鏡頭應延續該動作,或是展示他們正在注視的事物。

提示列:

這個鏡頭承接了上一個場景。

保持相同的角色位置和光照方向。

攝影機繼續進行上一個鏡頭的緩慢推鏡動作。

角色看向物體,下一個鏡頭便展示了該物體。

“使用與前一個鏡頭相同的拍攝地點和色彩搭配方案。”

GPT-5.6 可協助將故事板轉換為具備過渡感知能力的提示詞。相較於孤立的鏡頭片段,它能夠生成連貫的鏡頭序列。

針對短視頻的提示

請為TikTok、YouTube Shorts以及Instagram Reels指定直式格式與字幕空間。

提示詞模板:

“製作一條9:16比例的豎版短影片。開頭第一秒須設定清晰的視覺吸睛點。【拍攝主體/動作】。鏡頭:【鏡頭運動方式】。請在【頂部/底部/左側/右側】預留乾淨區域用於添加字幕。畫面須能在手機螢幕上清晰顯示。請勿讓畫面過於擁擠。”

短格式提示詞應優先保證可讀性。視覺效果複雜的鏡頭在桌面端可能觀感不錯,但在行動裝置上卻會出問題。

聯合使用 GPT-5.6 與 Elser AI 進行提示

一個強大的工作流程看起來是這樣的:

讓GPT-5.6將你粗略的想法轉化為一份條理清晰的創意簡報。

讓它根據這份簡報撰寫三個AI影片提示詞。

選擇最強的提示詞。

將提示詞與視覺參考匯入Elser AI

產生影片。

檢查失敗項目:面部、動態效果、產品精度、光線、節奏或風格。

根據此次失敗,讓GPT-5.6修改該提示詞。

在Elser AI中重新生成。

此工作流程可創造迭代效果。首次輸出不必盡善盡美。它只需讓你明晰需要改進的地方。

範例完整提示詞

“製作一條豎屏9:16比例的AI短影片,用於YouTube Shorts。使用參考圖中的同一位動漫發明家。完整保留她的銀灰色短髮、綠色眼眸、圓形眼鏡、寬鬆橙色連帽衫、黑色短褲、工具包、小巧勻稱的身材比例,以及乾淨的賽璐璐動漫渲染風格。在該鏡頭中,她自豪地展示工作台上的一台小型冒煙機器人,隨後發現機器人開始晃動。鏡頭設定:中景鏡頭搭配緩慢推鏡。燈光設定:左側暖調檯燈,營造柔和陰影,搭配溫馨的工作室背景。整體氛圍:詼諧有趣又略帶混亂感。頂部預留乾淨區域用於新增字幕。請勿更改她的面部造型、穿搭、髮型、身形、年齡或整體風格。禁止手部變形、出現多餘手指,背景不得出現扭曲變形。”

這個提示詞可行,因為它明確規定了格式、主題、身份設定、動作、拍攝機位、燈光、氛圍、標題布局以及限制條件。

結語

GPT-5.6 能夠優化 AI 影片提示的效果,因為它可以幫助創作者建構創意指令。它能夠將粗略的想法轉化為可投入正式製作的提示詞,保留關鍵細節,生成多種變體,還能診斷輸出結果失敗的原因。

但提示環節僅占整個工作流程的一半。你仍然需要一個影片生成平台。

將 GPT-5.6 用作規劃與提示詞編寫層。使用Elser AI做為生成與迭代層。在Elser AI上註冊,上傳你的參考圖片或產品照片,然後測試使用該結構建構的提示詞。提示詞品質越高,影片的可控性就越強。

最新發布