從小說到影片, 我和 ChatGPT 的完整協作過程

從小說到影片, 我和 ChatGPT 的完整協作過程

自從我發布了那部 5 分鐘看完《Pink Pace/粉紅色的步伐》 的影片之後,不少人開始好奇:「這是怎麼做出來的?」「你是用哪一套 AI 做的?」「這不可能是 AI 做的吧,怎麼可能每一集的人物角色都維持得一樣?」甚至也有人開玩笑說:「裡面的人物很有韓劇感,看來一個人成立電視台或電影公司的時代真的要來了。」

影片發布當天,我就收到不少私訊,甚至一路回到隔天凌晨兩點多。既然這麼多人在問,我也想趁這篇文章,把整個製作過程一步一步整理出來,跟大家分享這支影片到底是怎麼完成的。

這部影片,我只用了三項工具:Word、PowerPoint 和 ChatGPT。如果文中有時候為了方便簡稱 AI,指的其實也就是 ChatGPT

好,接下來我就一步一步帶大家看,這整個影片是怎麼從小說內容、角色卡、Banner,一路走到最後的 MP4。


第一步,不是先做影片,而是先把小說寫完

在開始談影片怎麼做之前,我想先回答一個有些人很在意,但我其實不太想回答的問題:「這本小說裡,AI 參與的比例有多高?」甚至更不客氣一點,直接問:「這是你寫的,還是 AI 生成的?」

我不想正面回答這個問題的原因,不是因為答不出來,而是因為這個問題本身,不僅無法達到捍衛人類創作價值的目的,反而更凸顯提問者對創作過程的無知。它把一個歷經一年多、從發想到動筆、從角色設定到情節鋪陳的創作過程,硬生生壓縮成一個扁平的百分比,好像只要算出幾成是 AI 參與的,就足以否定這本小說的價值,順便把自己放到一個捍衛人類價值的道德至高點上。

《Pink Pace/粉紅色的步伐》這本小說,從我真正開始構想到敲下第一個字,到最後完成,中間歷經了一年多。裡面的故事,絕大部分都是真實故事改編。甚至寫到某些情節時,我還會不自覺掉下眼淚。自己寫小說寫到哭,我大概也可以出國比賽了。但那是真正經歷過、痛過、跌倒過,卻還要逼自己爬起來繼續往前走的那種重量。

所以,如果你最後還是覺得這是 AI 生成的,那就是吧。

這本小說的源頭,並不是我打開 ChatGPT,下個指令,小說就自己跑出來了。而是先有我自己的故事、經驗、觀察,以及我對角色、場景和情緒的理解。等到整部小說用 Word 寫完了之後,才開始讓 ChatGPT 進來,成為後續整理、討論與延伸製作的協作工具。

它會幫我看文章、找錯字,也會提供一些寫法上的建議。後來我在做 Banner、角色卡和影片時,它當然也參與了很多討論。不然圖怎麼畫、場景怎麼定,這些都不可能憑空跑出來。

但在情節和文字上,我有我自己的堅持。我們常常會一路爭到最後,甚至有時候,它一開始就會先承認:「這段不要改,改了就不像你了。」因為它可以給建議,但它不是我。它能協助,不代表它能取代創作本身。而我之所以那麼堅持,是因為有些地方一旦接受了它的建議去修改,我的故事就會開始變得平凡。

不過整本小說裡,真的有一小段,我算是對 ChatGPT 讓步了。那一段是顧霆宇第一次到林采薇家裡過夜。原本我寫得很簡單,林采薇握住他的手,牽著他往樓上走。那一晚,他沒有回家。對我來說,這樣就已經夠了。

我們年輕的時候,電視、電影裡的這種情節,很多時候根本不需要寫得那麼白。鏡頭只要帶一下,觀眾自然就懂。浪漫一點的,就是花灑灑水在一朵玫瑰花上,故事情節就交代過去了;如果女主角是被迫的、無奈的,那可能就是一朵玫瑰花被折斷;若是遭受到比較粗暴的對待,鏡頭就是一陣狂風暴雨,然後花瓣落滿地。哪會有什麼情節,大家自然就知道發生了什麼。

從小說到影片, 我和 ChatGPT 的完整協作過程

但 ChatGPT 覺得我這樣寫太含蓄,讀者未必能收到我想傳達的訊號。它認為應該是顧霆宇抱住林采薇,林采薇沒有抗拒,然後…,我們為了那一小段,來回爭了很久。最後我才同意只加上一段隔天起床後旁邊多了一個人。不然呢?在那種氣氛下,總不會讓顧霆宇睡客廳吧。就算我這樣寫,顧霆宇也不會同意!

現在回頭看,我還是覺得那場爭論很有趣。因為它不是在幫我「生成內容」,而是在用另一種閱讀習慣跟我辯論敘事方式。有時候它甚至比我還八卦。

所以如果一定要問,ChatGPT 在這本小說裡扮演的是什麼角色,我會說,它比較像一個書評,也像一個編輯。它會陪我討論、會提供建議,偶爾還會跟我爭論情節,但它不是一個按下去就把故事吐出來的自動生成器。

所以,小說本身一定要先完成,故事一定要先站穩。只有在這個前提下,你才不會被 ChatGPT 帶著走,也不會因為它的建議而慢慢偏離原本的主題。也只有在這個基礎上,後面的角色卡、Banner、封面、封底,乃至整支影片,才有可能真的做得出來。


第二步,先把角色卡定清楚,再讓 ChatGPT 幫你做定裝照

角色卡並不是後面才補的東西,而是在寫小說的時候就已經先定好了。不管是寫小說,還是寫程式、這都是我的習慣。因為如果連角色都沒有定義好,你怎麼寫一個以使用者為中心的資訊系統?同樣的道理,如果角色卡都沒有先想清楚,故事寫到後面一定會偏掉。

從小說到影片, 我和 ChatGPT 的完整協作過程

這一步工作,就是先把我原本已經定好的角色卡交給 ChatGPT,讓它根據角色的內容、個性、穿著風格,先幫我設計出一張定裝照。這裡的重點不是先追求華麗,而是先把人定住。主要角色除了正面定裝照之外,還必須額外再做兩三張不同角度的參考圖,讓後面在不同場景、不同構圖下,還能盡量維持同一個人。如果角色可能會在不同情境出現,需要換衣服,也可以在這裡多加加幾張。

從小說到影片, 我和 ChatGPT 的完整協作過程

這一步雖然很煩,但一定要做。因為如果你沒有先把這些基準建立起來,後面一旦開始大量做 Banner,角色很快就會一路漂移。今天看起來像這個人,明天又變成另外一個人。前面明明是一線大明星,後面卻像換了代班演員。對小說改編成影片或 Banner 這種形式來說,這是很致命的事情。所以角色卡和定裝照這一步,就是為後面所有畫面設定一個參考基準。

不過,即使角色卡做了,也不代表後面就不會出錯。這次我最大的體會就是,ChatGPT 不只會照著角色卡畫,它還會依據情境自己推論,然後幫你補一些它以為合理的東西。結果就是,原本斯文的人,只因為我講了一句他身高 185,後面就開始往粗獷的方向跑,連鬍渣都出現了。

更麻煩的是,這本小說是以女性角色為主,女性角色除了五官、髮型、服裝之外,最難控制的其實是身材。前面幾集明明還是 D 罩杯,後面忽然變成 A 罩杯,這種事情真的會發生,而且一眼就看得出來。偏偏你如果直接跟它說胸部要大一點,ChatGPT 又會很正義凜然的回答你「您的要求違反內容政策」。所以最後只能繞路,想辦法從整體輪廓、服裝版型、姿勢和參考圖下手。不然就只能回去把之前畫好的全部重畫,通常同一天畫的不會差太多。

從小說到影片, 我和 ChatGPT 的完整協作過程

從小說到影片, 我和 ChatGPT 的完整協作過程

從小說到影片, 我和 ChatGPT 的完整協作過程

還有一種情境也很麻煩,就是多人同框。因為訂閱制工具在限流之前看起來像吃到飽,但實際上所有 AI 都傾向省資源。當同一張圖裡角色一多,你很快就會發現,每個人開始越長越像。明明是不同角色,看起來卻像同一家人,甚至像同一張臉只是換了髮型。這時候還是只能把角色卡拿出來,要求 ChatGPT 一個一個精修,不然角色辨識度很快就會崩掉。

從小說到影片, 我和 ChatGPT 的完整協作過程

所以角色卡真正的作用,不是保證 ChatGPT 永遠不會畫歪,而是當它畫歪的時候,你手上有一個可以把它拉回來的參考點。


第三步,先討論劇情,再決定每一張 Banner 要怎麼拍

角色卡和定裝照準備好之後,下一步並不是直接叫 ChatGPT 畫圖,而是先回到劇情本身,去挑出每一集最重要、最有代表性的場面。因為 Banner 不是插圖,也不是把小說裡某一段話直接翻成圖片,它比較像是替這一集挑出一個最能代表情緒、衝突或轉折的鏡頭。這一步最重要的,不是畫得多漂亮,而是先想清楚:這一集到底要抓哪一個場面?要讓哪些人出現?這些人之間的關係是什麼?畫面的情緒是緊張、曖昧、失落、溫暖,還是反擊之後的痛快?

從小說到影片, 我和 ChatGPT 的完整協作過程

所以我每次在做一張 Banner 之前,都會先將一整集的文章貼給 ChatGPT ,再和它討論這一集最適合呈現的劇情場面。接著再往下拆:場景要放在哪裡,是百貨公司專櫃、品薇、駁二、市集、流光咖啡館,還是某個更有代表性的地方;光線要怎麼處理,是白天、傍晚、夜景,還是室內偏暖光;拍攝角度要怎麼模擬,是正面、側面、近景、中景,還是像電影劇照那樣帶一點鏡頭語言。這一步其實很像真的在討論拍戲,只是我們不是拿攝影機去拍,而是先把這些條件講清楚,再讓 ChatGPT 根據這些條件去生圖。

等到場面、角色、光線、角度都大致確認之後,我才會把對應角色的角色卡上傳給 ChatGPT,讓它依據前面討論好的規格開始出圖。也就是說,角色卡不是一開始就亂丟進去,而是在劇情和鏡頭感都先定得差不多之後,才正式拿來當作人物基準。這樣做的好處是,圖不會只是「有人站在那裡」,而是比較有可能真的接近我心裡想要的那個場面。

從小說到影片, 我和 ChatGPT 的完整協作過程

不過,就算前面已經討論得很細,這一步還是常常要來回精修很多次。因為 ChatGPT 有時候場景對了,人物站位不對;有時候人對了,光線不對;有時候光線和場景都對了,表情又不對;有時候整體氣氛有了,但鏡頭感太平,沒有我要的戲劇張力。這時候就只能一輪一輪地修,重新講站位、重新講構圖、重新講光線,必要時再把角色卡拿出來校正。說穿了,這一步最花的不是按下生成,而是前面反覆討論與後面來回精修。因為真正決定一張 Banner 成不成立的,不只是技術,而是你有沒有先把那個畫面想清楚。

在這個過程中,有兩個特別有趣。一個是淡水一日遊的取景畫面。捷運站階梯或紅毛城其實都是最直覺、也最容易想到的場景,但後來我決定改成河濱步道,讓人物在那裡散步嬉鬧,遠眺對岸的觀音山。那個情境自然得多,不像擺拍,畫面也更有呼吸感。

從小說到影片, 我和 ChatGPT 的完整協作過程

另一個則是化妝品和人物一起入鏡的畫面設計。以前我在寫品牌遺珠故事館時,ChatGPT 就曾經幫我「拍過」不少精品品牌大片。但這一次,我想換個方式,做得自然一點。因為 Model 是自己人,不可能真的砸那麼多錢去拍精品廣告。可是一旦讓 Model 直接拿著美妝商品,新的問題又來了:商品很容易變得太小,看不清楚;不然就是被不成比例地放大,一支口紅拿在手上,活生生變成一支冰棒。

從小說到影片, 我和 ChatGPT 的完整協作過程

後來我換了一個方式處理。我先讓 ChatGPT 生成正常比例的人像照片,讓陳語嫣自然地拿著口紅。接著,再把這張照片轉成型錄,或是雜誌內頁。最後,再讓這本型錄或雜誌和真正的美妝商品一起出現在同一個畫面裡。這其實是經過三層轉換的設計,不是 ChatGPT 可以一次到位直接生成出來的,而是經過多次討論、測試和調整之後,才慢慢做出來的。

從小說到影片, 我和 ChatGPT 的完整協作過程

從小說到影片, 我和 ChatGPT 的完整協作過程

做到這裡,如果還有人只會問「這是不是 AI 生成的」,那我只能說,他看到的只是工具,沒看到方法,也沒看到背後那個不斷拆解問題、反覆修正的人。


第四步,反覆校正角色、調性、服裝、身高比例與前後連戲

到了這一步,真正麻煩的其實已經不只是角色像不像,而是整體有沒有連戲。因為單看某一張圖,可能覺得還不錯,但一旦把前後幾集放在一起看,問題就會全部跑出來。這時候要修的,除了角色本身,還包括整體調性、服裝、身高比例,還有場景前後的連續性。也就是說,這一步不是單純修圖,而是在做視覺上的連戲管理。

最常見的問題,就是服裝突然不連戲。明明下午那一場還穿著白襯衫,怎麼到了晚上同一天的下一個場景,突然變成 T-Shirt?明明只是場景切換,不是換季,也不是過了好幾天,結果角色卻像整個衣櫃都重開了一次。這種問題如果出現在單張圖裡,可能不一定有人立刻發現,但一旦你把它放進一整套 Banner 或影片裡,違和感就會非常明顯。

另一種很常見的問題,是人物的狀態被 ChatGPT 自行誇大。明明劇情只是心情不好、壓力比較大,它卻可能自動把角色畫得整個人消瘦一圈,甚至連臉都凹下去了,好像一個晚上就歷經重大創傷。這就是前面一直提到的,ChatGPT 會自己依照情境去補推論,而且補得太多。你原本只是要一個情緒低落的版本,它卻直接幫你畫成元氣大傷的版本。這種時候,如果不回頭修,角色很快就會失去前後一致性。

從小說到影片, 我和 ChatGPT 的完整協作過程

身高、體重比例也是一個很容易出錯、但又很容易被忽略的地方。像顧霆宇 185、沈柏謙 180,這種設定如果沒有反覆盯住,後面畫著畫著,很可能兩個人不是差太多,就是顧霆宇整個小了一號。更麻煩的是,一旦同框人物變多,ChatGPT 有時候為了構圖方便,會自動把人物比例拉平,例如為了配合小敏的身材,將張志凱變得瘦一點。結果原本應該有的胖瘦差、高低差、氣場差、站位關係,都被畫得模糊掉了。這時候就得回頭重新講清楚:誰應該高一點,誰應該站前面,誰應該只是陪襯。不能只是因為畫面看起來順眼,就把人物關係整個畫亂了。

從小說到影片, 我和 ChatGPT 的完整協作過程



從小說到影片, 我和 ChatGPT 的完整協作過程

而場景部分,室內空間也是一個必須處理的問題。如果是咖啡館、百貨公司這種相對複雜的環境,就算取鏡角度不同,讀者通常還不太會在意。但如果是女主角的工作室,空間本來就那麼小,不可能每天都在重新裝潢、重新設計吧。所以像這種核心場景,必須事先準備好固定的場景圖,後面才能維持一致,不然畫著畫著,連工作室都會像換了一間。

從小說到影片, 我和 ChatGPT 的完整協作過程

另外,這本小說還有一個很重要的場景,就是藍色狂想。因為它在故事裡有明確的指向性,所以我不能只靠 ChatGPT 自己想像,而是必須把真實照片餵給它,再讓它根據那些照片去合成。也就是說,有些場景可以讓它自由發揮,但有些場景如果本身就有真實對應,還是得先把正確的素材準備好,才不會最後畫出來完全不是那個地方。

所以到了第四步,工作重點已經不是「生成」,而是「校正」。我要做的,不只是看這一張圖漂不漂亮,而是去檢查它放回整體脈絡後,有沒有接得上前一張、下一張,有沒有符合角色原本的狀態,有沒有維持原先的服裝邏輯、身高邏輯、場景邏輯和情緒邏輯。說穿了,這一步其實很像拍戲時的連戲工作。只是我們不是在片場盯演員,而是在一張一張圖裡,盯著 ChatGPT 不要越畫越偏。


第五步,把單張 Banner 變成一套可以看的作品,補上封面與封底

前面幾步做完之後,手上雖然已經有一張一張 Banner,但那還只是素材,不等於作品已經完成。因為單張圖做得再好,如果只是散的,它還是一堆圖。真正要讓別人一口氣看完、看懂,甚至願意轉成影片分享,你還得再往前走一步,就是把這些分散的 Banner 整理成一套有開頭、有收尾、有整體感的展示內容。

所以到了第五步,我開始思考的就不再只是某一集漂不漂亮,而是整體要怎麼被觀看。這時候要處理的事情就包括:封面要怎麼設計、封底要怎麼收、53 張 Banner 排在一起的感覺順不順、整體的調性有沒有統一,甚至連最後一頁要不要放網址、要不要加一點置入行銷式的彩蛋,我都會一起想。

封面這件事,其實很重要。因為封面不是隨便挑一張最好看的圖擺上去就好,它代表的是整部作品的第一印象。這次我最後決定把封面做成女性群像,因為《Pink Pace》這本小說真正的主軸,本來就不是戀愛,而是女性成長。所以封面要講清楚這件事:核心是五位女性一路走來的變化、陪伴與成長,而不是把男性角色放到畫面中央,讓整個重心跑掉。也因為這樣,封面在設計時,不只是選圖,而是還要重新思考人物站位、背景空間、標題文字、整體氣質,讓它看起來像一個系列的總封面,而不是某一集的放大版。

從小說到影片, 我和 ChatGPT 的完整協作過程

封底也是一樣。封底如果只是隨便找一張圖墊著,其實收不起來。這次我最後選擇用品薇的空景來當 Ending,那個決定其實很合理。因為封面已經有人物群像了,中間 53 張也全都是故事場景,到最後反而需要一張乾淨一點的畫面,讓整個系列有一個落點。所以封底除了 Thank You,我後來還補上了冠名播出的字樣,甚至連 PinkPace.LV 也一起放進去。因為影片做完丟出去,觀眾如果看完之後根本不知道去哪裡找小說,那這個封底就等於少做了一半。

也就是說,第五步真正做的事,不只是「做封面、做封底」,而是把原本分散的 53 張 Banner,整理成一套可以被完整觀看的內容。這一步很像展覽的策展,也很像一本書最後的裝幀。前面是創作單張,這一步是在決定別人會用什麼方式看見你的作品。只有這一步做好了,後面的 PPT 和 MP4 才真的有意義。


第六步,用 PowerPoint 排出播放節奏,再把整套內容轉成 MP4

到了第六步,並不只是把圖片一張一張排進 PowerPoint 而已。因為如果只是很單純地把封面、53 張 Banner、封底照順序排好,再直接輸出成 MP4,那它比較像投影片自動播放,不太像一支真的設計過的影片。所以我後來做的,不只是排版,而是用 PowerPoint 去做最基本的排演,讓整支影片看起來更順,也更像一支完整作品。

排演部分其實沒有做得很複雜。每張投影片停留 5 秒。這個秒數不是亂抓的,而是實際測試過後,我覺得剛好夠觀眾把畫面和文字看完,又不會停得太久。轉場時間則統一設定為 0.75 秒,效果選最簡單的淡出。這樣的設定也比較符合 Pink Pace 所代表的意義,讓整體播放節奏順順地往前走。

最後一個畫面因為資訊量比較多,所以我把它拆成四張圖,用類似動畫的方式處理。這個最後畫面的做法,其實也是整支影片裡少數比較有設計感的小地方。它不是一頁就把所有東西全部丟上去,而是先出現基本版面,再加上冠名播出,再加上網址,最後再補上免費音樂來源。因為底圖基本上是一樣的,所以觀眾看到時,會以為這些資訊是在同一個畫面裡一層一層浮出來。但實際上,它只是用四張幾乎相同的投影片去做出這個效果。

從小說到影片, 我和 ChatGPT 的完整協作過程

另外,音樂也是這一步很重要的工作。因為影片一旦有了音樂,整個感覺就完全不一樣。沒有音樂,它比較像一份會動的 slides;有了音樂,它才比較像一支真正的影片。所以在 PowerPoint 排頁之外,我還得花時間去找適合的免費音樂來源,確認它的情緒、步調、質感,能不能和整支影片搭得起來。這看起來像附加工作,但其實非常重要。因為音樂如果選錯,前面辛苦做出來的畫面質感,很容易一下就被沖掉。最後我在 Pixabay 選了 Warm Memories 這個音檔作為背景音樂。

從小說到影片, 我和 ChatGPT 的完整協作過程

所以第六步表面上看起來只是「用 PowerPoint 轉 MP4」,但實際上還包含兩件事:一個是把整體播放節奏排順,另一個是把音樂找對。前面所有做好的內容,到這一步才真正被整理成一支可以播放、可以分享,也可以讓觀眾一口氣看完的影片。

全部設定完成之後,最後其實就很單純了,直接利用 PowerPoint 內建的匯出功能,把整份投影片輸出成影片。也就是說,前面那些 Banner、封面、封底、停留秒數、轉場設定、最後一幕拆成四張圖的設計,到了這一步,都會一起被包進同一支 MP4 裡。

所以從技術上來說,最後的輸出反而是最簡單的一步。真正花時間的,不是按下匯出,而是前面那一整套準備工作:小說內容先定稿、角色卡先建立、每一集 Banner 的場景與人物先討論清楚、角色反覆精修、封面封底補齊,最後再把整體播放節奏和音樂安排好。這些事情都做好之後,PowerPoint 匯出影片,其實只是最後把所有準備完成的東西,正式收成一支可以播放的成果。


結語

整個流程走完之後,我自己的感受其實很簡單:這支影片真正難的,並不是最後用 PowerPoint 匯出成 MP4,也不是下個指令讓 ChatGPT 生成圖片,而是前面那一連串看起來零碎、其實一個都不能少的準備工作。小說要先寫完,角色卡要先定好,定裝照要先建立,每一集 Banner 要先討論場景、人物、光線和角度,後面還得不斷去修角色、修服裝、修連戲,最後再補上封面、封底、網址、冠名資訊和音樂。這些東西單看每一步,好像都不算特別厲害,但全部加起來,才真的把一部小說、把每一集各自獨立的 Banner,慢慢推成一支影片。

如果要說這次最大的收穫,並不是讓 ChatGPT 幫我畫了一堆圖,或是針對小說內容提出建議和批評,而是我更清楚什麼叫做和工具協作。ChatGPT 確實很有幫助,它能陪我討論、幫我整理思緒、幫我把模糊的構想慢慢拉成可以執行的畫面和流程。但同樣地,它也會腦補、會跑偏、會偷省資源、會把角色畫歪,甚至有時候還會比我更八卦。也因為這樣,我反而更確定一件事:工具再強,前面沒想清楚,後面一樣會亂。不要怪 ChatGPT 做不好,很多時候,問題其實是你自己還沒準備好。

所以如果你問我,這支影片是用什麼工具做出來的,我可以很簡單地告訴你:ChatGPT、Word 和 PowerPoint

但如果你是真心想了解背後的過程,以及在這個協作過程中,人類到底扮演了什麼角色,那這也是我這次最想分享的地方。不是因為我找到了一個神奇捷徑,而是因為我真的把一套完整流程走過一遍,從小說、角色卡、Banner,到最後的 MP4,慢慢把它做完。對我來說,這比任何單一工具本身都更重要。

因為真正有價值的,並不是工具本身,而是人怎麼理解故事、怎麼判斷取捨、怎麼在工具做不到的地方,換一個方法把它完成。工具可以放大效率,但真正能創作出作品的,還是人的經驗、選擇與堅持。


🎬 5 分鐘看完《Pink Pace/粉紅色的步伐》

2026-05-07 14:28 發佈
謝謝分享這麼詳細的邏輯思考過程,這才是核心價值,五分奉上!
adamas555 wrote:謝謝分享這麼詳細的邏...(恕刪)

很高興有人喜歡這類文章,我以為又沒人看哩。
想看清涼點
奇點降臨 wrote:想看清涼點(恕刪)
露最多就這樣



內文搜尋
X
評分
評分
複製連結
Mobile01提醒您
您目前瀏覽的是行動版網頁
是否切換到電腦版網頁呢?