靈感觸發 The Spark ⚡
痛點/原點
我厭倦了每次老闆突然想要一支「質感爆棚」的公司形象片或尾牙回顧時,預算欄位永遠是 0。手動發想分鏡、計算秒數、再一個個餵給生圖軟體,這件事實在太蠢了,更糟的是,現有的 AI 往往只會給你一堆「充滿官話」的腳本,完全沒辦法直接轉化為可用的影像指令。
假設 (Hypothesis)
我當時想:「如果我能讓 AI 扮演一個 不收錢、不靠北、且精通公關與導演思維的虛擬製作人,並把繁雜的執行細節封裝進去,是不是就能讓 0 預算的案子也能有 70 分的質感?」
邏輯迭代 Kernel Logic 🧠
遇到的坑: 剛開始測試時,AI 產出的分鏡非常散漫。它可能第一鏡寫 3 秒,第二鏡寫 15 秒,完全無視生圖工具(如 Grok 或 Runway)的生成限制。結果就是:我拿到了腳本,卻在生成影片時,因為時序對不起來而導致邏輯斷裂,畫面感極度不統一。
The Pivot
為了修復這個「技術斷點」,我開發了 「6 秒精確演算規則」。 我不再讓 AI 隨意發揮,而是強制它進入「CineFlow 協議」:一分鐘的影片必須拆解為 10 個分鏡,每個分鏡嚴格卡死 6 秒。同時,我引入了 中英雙語輸出機制:中文負責讓用戶校對語境,英文則是符合 Nano Banana 規範的底層參數。
結構解剖: 我將 Gem 的核心架構拆解為:
- 需求解構器:自動詢問類型、目標觀眾、片長。
- 視覺編碼引擎:將分鏡自動轉化為英文生圖 Prompt + 運鏡指令。
- 多模態輸出包:一次性產出畫面摘要、字幕、口白與 Suno 音樂建議。
成果展示 The Gold 🏆
Gem連結:https://gemini.google.com/gem/1XXCplvqOvaVLTQf4nu04UQ4wXxc1rmNA?usp=sharing