從小說到影片，我和 ChatGPT 的完整協作過程

Ricado
個人積分：8107分
文章編號：93116755

8107分

樓主

2026-05-07 14:28

自從我發布了那部 5 分鐘看完《Pink Pace／粉紅色的步伐》 的影片之後，不少人開始好奇：「這是怎麼做出來的？」「你是用哪一套 AI 做的？」「這不可能是 AI 做的吧，怎麼可能每一集的人物角色都維持得一樣？」甚至也有人開玩笑說：「裡面的人物很有韓劇感，看來一個人成立電視台或電影公司的時代真的要來了。」

影片發布當天，我就收到不少私訊，甚至一路回到隔天凌晨兩點多。既然這麼多人在問，我也想趁這篇文章，把整個製作過程一步一步整理出來，跟大家分享這支影片到底是怎麼完成的。

這部影片，我只用了三項工具：Word、PowerPoint 和 ChatGPT。如果文中有時候為了方便簡稱 AI，指的其實也就是 ChatGPT。

好，接下來我就一步一步帶大家看，這整個影片是怎麼從小說內容、角色卡、Banner，一路走到最後的 MP4。

第一步，不是先做影片，而是先把小說寫完

在開始談影片怎麼做之前，我想先回答一個有些人很在意，但我其實不太想回答的問題：「這本小說裡，AI 參與的比例有多高？」甚至更不客氣一點，直接問：「這是你寫的，還是 AI 生成的？」

我不想正面回答這個問題的原因，不是因為答不出來，而是因為這個問題本身，不僅無法達到捍衛人類創作價值的目的，反而更凸顯提問者對創作過程的無知。它把一個歷經一年多、從發想到動筆、從角色設定到情節鋪陳的創作過程，硬生生壓縮成一個扁平的百分比，好像只要算出幾成是 AI 參與的，就足以否定這本小說的價值，順便把自己放到一個捍衛人類價值的道德至高點上。

《Pink Pace／粉紅色的步伐》這本小說，從我真正開始構想到敲下第一個字，到最後完成，中間歷經了一年多。裡面的故事，絕大部分都是真實故事改編。甚至寫到某些情節時，我還會不自覺掉下眼淚。自己寫小說寫到哭，我大概也可以出國比賽了。但那是真正經歷過、痛過、跌倒過，卻還要逼自己爬起來繼續往前走的那種重量。

所以，如果你最後還是覺得這是 AI 生成的，那就是吧。

這本小說的源頭，並不是我打開 ChatGPT，下個指令，小說就自己跑出來了。而是先有我自己的故事、經驗、觀察，以及我對角色、場景和情緒的理解。等到整部小說用 Word 寫完了之後，才開始讓 ChatGPT 進來，成為後續整理、討論與延伸製作的協作工具。

它會幫我看文章、找錯字，也會提供一些寫法上的建議。後來我在做 Banner、角色卡和影片時，它當然也參與了很多討論。不然圖怎麼畫、場景怎麼定，這些都不可能憑空跑出來。

但在情節和文字上，我有我自己的堅持。我們常常會一路爭到最後，甚至有時候，它一開始就會先承認：「這段不要改，改了就不像你了。」因為它可以給建議，但它不是我。它能協助，不代表它能取代創作本身。而我之所以那麼堅持，是因為有些地方一旦接受了它的建議去修改，我的故事就會開始變得平凡。

不過整本小說裡，真的有一小段，我算是對 ChatGPT 讓步了。那一段是顧霆宇第一次到林采薇家裡過夜。原本我寫得很簡單，林采薇握住他的手，牽著他往樓上走。那一晚，他沒有回家。對我來說，這樣就已經夠了。

我們年輕的時候，電視、電影裡的這種情節，很多時候根本不需要寫得那麼白。鏡頭只要帶一下，觀眾自然就懂。浪漫一點的，就是花灑灑水在一朵玫瑰花上，故事情節就交代過去了；如果女主角是被迫的、無奈的，那可能就是一朵玫瑰花被折斷；若是遭受到比較粗暴的對待，鏡頭就是一陣狂風暴雨，然後花瓣落滿地。哪會有什麼情節，大家自然就知道發生了什麼。

從小說到影片，我和 ChatGPT 的完整協作過程

但 ChatGPT 覺得我這樣寫太含蓄，讀者未必能收到我想傳達的訊號。它認為應該是顧霆宇抱住林采薇，林采薇沒有抗拒，然後…，我們為了那一小段，來回爭了很久。最後我才同意只加上一段隔天起床後旁邊多了一個人。不然呢？在那種氣氛下，總不會讓顧霆宇睡客廳吧。就算我這樣寫，顧霆宇也不會同意！

現在回頭看，我還是覺得那場爭論很有趣。因為它不是在幫我「生成內容」，而是在用另一種閱讀習慣跟我辯論敘事方式。有時候它甚至比我還八卦。

所以如果一定要問，ChatGPT 在這本小說裡扮演的是什麼角色，我會說，它比較像一個書評，也像一個編輯。它會陪我討論、會提供建議，偶爾還會跟我爭論情節，但它不是一個按下去就把故事吐出來的自動生成器。

所以，小說本身一定要先完成，故事一定要先站穩。只有在這個前提下，你才不會被 ChatGPT 帶著走，也不會因為它的建議而慢慢偏離原本的主題。也只有在這個基礎上，後面的角色卡、Banner、封面、封底，乃至整支影片，才有可能真的做得出來。

第二步，先把角色卡定清楚，再讓 ChatGPT 幫你做定裝照

角色卡並不是後面才補的東西，而是在寫小說的時候就已經先定好了。不管是寫小說，還是寫程式、這都是我的習慣。因為如果連角色都沒有定義好，你怎麼寫一個以使用者為中心的資訊系統？同樣的道理，如果角色卡都沒有先想清楚，故事寫到後面一定會偏掉。

從小說到影片，我和 ChatGPT 的完整協作過程

這一步工作，就是先把我原本已經定好的角色卡交給 ChatGPT，讓它根據角色的內容、個性、穿著風格，先幫我設計出一張定裝照。這裡的重點不是先追求華麗，而是先把人定住。主要角色除了正面定裝照之外，還必須額外再做兩三張不同角度的參考圖，讓後面在不同場景、不同構圖下，還能盡量維持同一個人。如果角色可能會在不同情境出現，需要換衣服，也可以在這裡多加加幾張。

從小說到影片，我和 ChatGPT 的完整協作過程

這一步雖然很煩，但一定要做。因為如果你沒有先把這些基準建立起來，後面一旦開始大量做 Banner，角色很快就會一路漂移。今天看起來像這個人，明天又變成另外一個人。前面明明是一線大明星，後面卻像換了代班演員。對小說改編成影片或 Banner 這種形式來說，這是很致命的事情。所以角色卡和定裝照這一步，就是為後面所有畫面設定一個參考基準。

不過，即使角色卡做了，也不代表後面就不會出錯。這次我最大的體會就是，ChatGPT 不只會照著角色卡畫，它還會依據情境自己推論，然後幫你補一些它以為合理的東西。結果就是，原本斯文的人，只因為我講了一句他身高 185，後面就開始往粗獷的方向跑，連鬍渣都出現了。

更麻煩的是，這本小說是以女性角色為主，女性角色除了五官、髮型、服裝之外，最難控制的其實是身材。前面幾集明明還是 D 罩杯，後面忽然變成 A 罩杯，這種事情真的會發生，而且一眼就看得出來。偏偏你如果直接跟它說胸部要大一點，ChatGPT 又會很正義凜然的回答你「您的要求違反內容政策」。所以最後只能繞路，想辦法從整體輪廓、服裝版型、姿勢和參考圖下手。不然就只能回去把之前畫好的全部重畫，通常同一天畫的不會差太多。

從小說到影片，我和 ChatGPT 的完整協作過程

還有一種情境也很麻煩，就是多人同框。因為訂閱制工具在限流之前看起來像吃到飽，但實際上所有 AI 都傾向省資源。當同一張圖裡角色一多，你很快就會發現，每個人開始越長越像。明明是不同角色，看起來卻像同一家人，甚至像同一張臉只是換了髮型。這時候還是只能把角色卡拿出來，要求 ChatGPT 一個一個精修，不然角色辨識度很快就會崩掉。

從小說到影片，我和 ChatGPT 的完整協作過程

所以角色卡真正的作用，不是保證 ChatGPT 永遠不會畫歪，而是當它畫歪的時候，你手上有一個可以把它拉回來的參考點。

第三步，先討論劇情，再決定每一張 Banner 要怎麼拍

角色卡和定裝照準備好之後，下一步並不是直接叫 ChatGPT 畫圖，而是先回到劇情本身，去挑出每一集最重要、最有代表性的場面。因為 Banner 不是插圖，也不是把小說裡某一段話直接翻成圖片，它比較像是替這一集挑出一個最能代表情緒、衝突或轉折的鏡頭。這一步最重要的，不是畫得多漂亮，而是先想清楚：這一集到底要抓哪一個場面？要讓哪些人出現？這些人之間的關係是什麼？畫面的情緒是緊張、曖昧、失落、溫暖，還是反擊之後的痛快？

從小說到影片，我和 ChatGPT 的完整協作過程

所以我每次在做一張 Banner 之前，都會先將一整集的文章貼給 ChatGPT ，再和它討論這一集最適合呈現的劇情場面。接著再往下拆：場景要放在哪裡，是百貨公司專櫃、品薇、駁二、市集、流光咖啡館，還是某個更有代表性的地方；光線要怎麼處理，是白天、傍晚、夜景，還是室內偏暖光；拍攝角度要怎麼模擬，是正面、側面、近景、中景，還是像電影劇照那樣帶一點鏡頭語言。這一步其實很像真的在討論拍戲，只是我們不是拿攝影機去拍，而是先把這些條件講清楚，再讓 ChatGPT 根據這些條件去生圖。

等到場面、角色、光線、角度都大致確認之後，我才會把對應角色的角色卡上傳給 ChatGPT，讓它依據前面討論好的規格開始出圖。也就是說，角色卡不是一開始就亂丟進去，而是在劇情和鏡頭感都先定得差不多之後，才正式拿來當作人物基準。這樣做的好處是，圖不會只是「有人站在那裡」，而是比較有可能真的接近我心裡想要的那個場面。

從小說到影片，我和 ChatGPT 的完整協作過程

不過，就算前面已經討論得很細，這一步還是常常要來回精修很多次。因為 ChatGPT 有時候場景對了，人物站位不對；有時候人對了，光線不對；有時候光線和場景都對了，表情又不對；有時候整體氣氛有了，但鏡頭感太平，沒有我要的戲劇張力。這時候就只能一輪一輪地修，重新講站位、重新講構圖、重新講光線，必要時再把角色卡拿出來校正。說穿了，這一步最花的不是按下生成，而是前面反覆討論與後面來回精修。因為真正決定一張 Banner 成不成立的，不只是技術，而是你有沒有先把那個畫面想清楚。

在這個過程中，有兩個特別有趣。一個是淡水一日遊的取景畫面。捷運站階梯或紅毛城其實都是最直覺、也最容易想到的場景，但後來我決定改成河濱步道，讓人物在那裡散步嬉鬧，遠眺對岸的觀音山。那個情境自然得多，不像擺拍，畫面也更有呼吸感。

從小說到影片，我和 ChatGPT 的完整協作過程

另一個則是化妝品和人物一起入鏡的畫面設計。以前我在寫品牌遺珠故事館時，ChatGPT 就曾經幫我「拍過」不少精品品牌大片。但這一次，我想換個方式，做得自然一點。因為 Model 是自己人，不可能真的砸那麼多錢去拍精品廣告。可是一旦讓 Model 直接拿著美妝商品，新的問題又來了：商品很容易變得太小，看不清楚；不然就是被不成比例地放大，一支口紅拿在手上，活生生變成一支冰棒。

從小說到影片，我和 ChatGPT 的完整協作過程

後來我換了一個方式處理。我先讓 ChatGPT 生成正常比例的人像照片，讓陳語嫣自然地拿著口紅。接著，再把這張照片轉成型錄，或是雜誌內頁。最後，再讓這本型錄或雜誌和真正的美妝商品一起出現在同一個畫面裡。這其實是經過三層轉換的設計，不是 ChatGPT 可以一次到位直接生成出來的，而是經過多次討論、測試和調整之後，才慢慢做出來的。

從小說到影片，我和 ChatGPT 的完整協作過程

做到這裡，如果還有人只會問「這是不是 AI 生成的」，那我只能說，他看到的只是工具，沒看到方法，也沒看到背後那個不斷拆解問題、反覆修正的人。

第四步，反覆校正角色、調性、服裝、身高比例與前後連戲

到了這一步，真正麻煩的其實已經不只是角色像不像，而是整體有沒有連戲。因為單看某一張圖，可能覺得還不錯，但一旦把前後幾集放在一起看，問題就會全部跑出來。這時候要修的，除了角色本身，還包括整體調性、服裝、身高比例，還有場景前後的連續性。也就是說，這一步不是單純修圖，而是在做視覺上的連戲管理。

最常見的問題，就是服裝突然不連戲。明明下午那一場還穿著白襯衫，怎麼到了晚上同一天的下一個場景，突然變成 T-Shirt？明明只是場景切換，不是換季，也不是過了好幾天，結果角色卻像整個衣櫃都重開了一次。這種問題如果出現在單張圖裡，可能不一定有人立刻發現，但一旦你把它放進一整套 Banner 或影片裡，違和感就會非常明顯。

另一種很常見的問題，是人物的狀態被 ChatGPT 自行誇大。明明劇情只是心情不好、壓力比較大，它卻可能自動把角色畫得整個人消瘦一圈，甚至連臉都凹下去了，好像一個晚上就歷經重大創傷。這就是前面一直提到的，ChatGPT 會自己依照情境去補推論，而且補得太多。你原本只是要一個情緒低落的版本，它卻直接幫你畫成元氣大傷的版本。這種時候，如果不回頭修，角色很快就會失去前後一致性。

從小說到影片，我和 ChatGPT 的完整協作過程

身高、體重比例也是一個很容易出錯、但又很容易被忽略的地方。像顧霆宇 185、沈柏謙 180，這種設定如果沒有反覆盯住，後面畫著畫著，很可能兩個人不是差太多，就是顧霆宇整個小了一號。更麻煩的是，一旦同框人物變多，ChatGPT 有時候為了構圖方便，會自動把人物比例拉平，例如為了配合小敏的身材，將張志凱變得瘦一點。結果原本應該有的胖瘦差、高低差、氣場差、站位關係，都被畫得模糊掉了。這時候就得回頭重新講清楚：誰應該高一點，誰應該站前面，誰應該只是陪襯。不能只是因為畫面看起來順眼，就把人物關係整個畫亂了。

從小說到影片，我和 ChatGPT 的完整協作過程

而場景部分，室內空間也是一個必須處理的問題。如果是咖啡館、百貨公司這種相對複雜的環境，就算取鏡角度不同，讀者通常還不太會在意。但如果是女主角的工作室，空間本來就那麼小，不可能每天都在重新裝潢、重新設計吧。所以像這種核心場景，必須事先準備好固定的場景圖，後面才能維持一致，不然畫著畫著，連工作室都會像換了一間。

從小說到影片，我和 ChatGPT 的完整協作過程

另外，這本小說還有一個很重要的場景，就是藍色狂想。因為它在故事裡有明確的指向性，所以我不能只靠 ChatGPT 自己想像，而是必須把真實照片餵給它，再讓它根據那些照片去合成。也就是說，有些場景可以讓它自由發揮，但有些場景如果本身就有真實對應，還是得先把正確的素材準備好，才不會最後畫出來完全不是那個地方。

所以到了第四步，工作重點已經不是「生成」，而是「校正」。我要做的，不只是看這一張圖漂不漂亮，而是去檢查它放回整體脈絡後，有沒有接得上前一張、下一張，有沒有符合角色原本的狀態，有沒有維持原先的服裝邏輯、身高邏輯、場景邏輯和情緒邏輯。說穿了，這一步其實很像拍戲時的連戲工作。只是我們不是在片場盯演員，而是在一張一張圖裡，盯著 ChatGPT 不要越畫越偏。

第五步，把單張 Banner 變成一套可以看的作品，補上封面與封底

前面幾步做完之後，手上雖然已經有一張一張 Banner，但那還只是素材，不等於作品已經完成。因為單張圖做得再好，如果只是散的，它還是一堆圖。真正要讓別人一口氣看完、看懂，甚至願意轉成影片分享，你還得再往前走一步，就是把這些分散的 Banner 整理成一套有開頭、有收尾、有整體感的展示內容。

所以到了第五步，我開始思考的就不再只是某一集漂不漂亮，而是整體要怎麼被觀看。這時候要處理的事情就包括：封面要怎麼設計、封底要怎麼收、53 張 Banner 排在一起的感覺順不順、整體的調性有沒有統一，甚至連最後一頁要不要放網址、要不要加一點置入行銷式的彩蛋，我都會一起想。

封面這件事，其實很重要。因為封面不是隨便挑一張最好看的圖擺上去就好，它代表的是整部作品的第一印象。這次我最後決定把封面做成女性群像，因為《Pink Pace》這本小說真正的主軸，本來就不是戀愛，而是女性成長。所以封面要講清楚這件事：核心是五位女性一路走來的變化、陪伴與成長，而不是把男性角色放到畫面中央，讓整個重心跑掉。也因為這樣，封面在設計時，不只是選圖，而是還要重新思考人物站位、背景空間、標題文字、整體氣質，讓它看起來像一個系列的總封面，而不是某一集的放大版。

從小說到影片，我和 ChatGPT 的完整協作過程

封底也是一樣。封底如果只是隨便找一張圖墊著，其實收不起來。這次我最後選擇用品薇的空景來當 Ending，那個決定其實很合理。因為封面已經有人物群像了，中間 53 張也全都是故事場景，到最後反而需要一張乾淨一點的畫面，讓整個系列有一個落點。所以封底除了 Thank You，我後來還補上了冠名播出的字樣，甚至連 PinkPace.LV 也一起放進去。因為影片做完丟出去，觀眾如果看完之後根本不知道去哪裡找小說，那這個封底就等於少做了一半。

也就是說，第五步真正做的事，不只是「做封面、做封底」，而是把原本分散的 53 張 Banner，整理成一套可以被完整觀看的內容。這一步很像展覽的策展，也很像一本書最後的裝幀。前面是創作單張，這一步是在決定別人會用什麼方式看見你的作品。只有這一步做好了，後面的 PPT 和 MP4 才真的有意義。

第六步，用 PowerPoint 排出播放節奏，再把整套內容轉成 MP4

到了第六步，並不只是把圖片一張一張排進 PowerPoint 而已。因為如果只是很單純地把封面、53 張 Banner、封底照順序排好，再直接輸出成 MP4，那它比較像投影片自動播放，不太像一支真的設計過的影片。所以我後來做的，不只是排版，而是用 PowerPoint 去做最基本的排演，讓整支影片看起來更順，也更像一支完整作品。

排演部分其實沒有做得很複雜。每張投影片停留 5 秒。這個秒數不是亂抓的，而是實際測試過後，我覺得剛好夠觀眾把畫面和文字看完，又不會停得太久。轉場時間則統一設定為 0.75 秒，效果選最簡單的淡出。這樣的設定也比較符合 Pink Pace 所代表的意義，讓整體播放節奏順順地往前走。

最後一個畫面因為資訊量比較多，所以我把它拆成四張圖，用類似動畫的方式處理。這個最後畫面的做法，其實也是整支影片裡少數比較有設計感的小地方。它不是一頁就把所有東西全部丟上去，而是先出現基本版面，再加上冠名播出，再加上網址，最後再補上免費音樂來源。因為底圖基本上是一樣的，所以觀眾看到時，會以為這些資訊是在同一個畫面裡一層一層浮出來。但實際上，它只是用四張幾乎相同的投影片去做出這個效果。

從小說到影片，我和 ChatGPT 的完整協作過程

另外，音樂也是這一步很重要的工作。因為影片一旦有了音樂，整個感覺就完全不一樣。沒有音樂，它比較像一份會動的 slides；有了音樂，它才比較像一支真正的影片。所以在 PowerPoint 排頁之外，我還得花時間去找適合的免費音樂來源，確認它的情緒、步調、質感，能不能和整支影片搭得起來。這看起來像附加工作，但其實非常重要。因為音樂如果選錯，前面辛苦做出來的畫面質感，很容易一下就被沖掉。最後我在 Pixabay 選了 Warm Memories 這個音檔作為背景音樂。

從小說到影片，我和 ChatGPT 的完整協作過程

所以第六步表面上看起來只是「用 PowerPoint 轉 MP4」，但實際上還包含兩件事：一個是把整體播放節奏排順，另一個是把音樂找對。前面所有做好的內容，到這一步才真正被整理成一支可以播放、可以分享，也可以讓觀眾一口氣看完的影片。

全部設定完成之後，最後其實就很單純了，直接利用 PowerPoint 內建的匯出功能，把整份投影片輸出成影片。也就是說，前面那些 Banner、封面、封底、停留秒數、轉場設定、最後一幕拆成四張圖的設計，到了這一步，都會一起被包進同一支 MP4 裡。

所以從技術上來說，最後的輸出反而是最簡單的一步。真正花時間的，不是按下匯出，而是前面那一整套準備工作：小說內容先定稿、角色卡先建立、每一集 Banner 的場景與人物先討論清楚、角色反覆精修、封面封底補齊，最後再把整體播放節奏和音樂安排好。這些事情都做好之後，PowerPoint 匯出影片，其實只是最後把所有準備完成的東西，正式收成一支可以播放的成果。

結語

整個流程走完之後，我自己的感受其實很簡單：這支影片真正難的，並不是最後用 PowerPoint 匯出成 MP4，也不是下個指令讓 ChatGPT 生成圖片，而是前面那一連串看起來零碎、其實一個都不能少的準備工作。小說要先寫完，角色卡要先定好，定裝照要先建立，每一集 Banner 要先討論場景、人物、光線和角度，後面還得不斷去修角色、修服裝、修連戲，最後再補上封面、封底、網址、冠名資訊和音樂。這些東西單看每一步，好像都不算特別厲害，但全部加起來，才真的把一部小說、把每一集各自獨立的 Banner，慢慢推成一支影片。

如果要說這次最大的收穫，並不是讓 ChatGPT 幫我畫了一堆圖，或是針對小說內容提出建議和批評，而是我更清楚什麼叫做和工具協作。ChatGPT 確實很有幫助，它能陪我討論、幫我整理思緒、幫我把模糊的構想慢慢拉成可以執行的畫面和流程。但同樣地，它也會腦補、會跑偏、會偷省資源、會把角色畫歪，甚至有時候還會比我更八卦。也因為這樣，我反而更確定一件事：工具再強，前面沒想清楚，後面一樣會亂。不要怪 ChatGPT 做不好，很多時候，問題其實是你自己還沒準備好。

所以如果你問我，這支影片是用什麼工具做出來的，我可以很簡單地告訴你：ChatGPT、Word 和 PowerPoint。

但如果你是真心想了解背後的過程，以及在這個協作過程中，人類到底扮演了什麼角色，那這也是我這次最想分享的地方。不是因為我找到了一個神奇捷徑，而是因為我真的把一套完整流程走過一遍，從小說、角色卡、Banner，到最後的 MP4，慢慢把它做完。對我來說，這比任何單一工具本身都更重要。

因為真正有價值的，並不是工具本身，而是人怎麼理解故事、怎麼判斷取捨、怎麼在工具做不到的地方，換一個方法把它完成。工具可以放大效率，但真正能創作出作品的，還是人的經驗、選擇與堅持。