
自從 Google 推出 Gemini Nano Banana 以後,AI 繪圖界似乎一直由 Google 領先。不過,OpenAI 本週終於投下震撼彈反擊,正式推出具備「思考能力」的全新圖片生成模型, ChatGPT Images 2.0。這次更新最震撼是它提升了繁體中文的理解力,以及處理複雜排版的邏輯,以往用 ChatGPT 生成有中文字的圖片,字體有九成會變成亂碼,本文將會實試 Images 2.0,看看它在實用性和娛樂性上如何幫到手。

▲ ChatGPT Images 2.0 生成的圖片兼具實用性和娛樂性
▲這次 Images 2.0 在文字處理上大幅進步,即睇下文教學詳盡解釋
香港用戶首要任務:VPN
在展開教學前,香港讀者必須留意,由於 ChatGPT 服務尚未在香港地區正式開放,我們依然需要使用 VPN 連接到其他獲支援的地區,小編就建議連接至地理位置與香港較近的台灣節點,網絡反應通常會比較流暢穩定。
ChatGPT 網頁版網址:https://chat.openai.com/
ChatGPT iOS 下載連結 :https://apps.apple.com/app/chatgpt/id6448311069
ChatGPT Android 下載連結:https://play.google.com/store/apps/details?id=com.openai.chatgpt&hl=zh_TW
▲ 由於 ChatGPT 服務尚未在香港地區正式開放,我們依然需要使用 VPN 連接到其他獲支援的地區
▲ 一進入 ChatGPT頁面,便見到「Images」對話框,可以直接在這輸入你想生成的圖片指令
▲ 你亦可以像平時開啟新對話般,點選「New Chat」,直接在對話框輸入想生成的圖片指令
實測 1 )靚女寫真生成 + 專業海報設計
不少人都會覺得 AI 生成人像有陣「膠味」。今次 Images 2.0 加入了 OpenAI 的推理技術,能夠在生成圖像前先「思考」光線佈局與物理邏輯,使模特兒的皮膚紋理、髮絲流向乃至眼球反射更擬真。
常去日本的朋友,一定見過當地地鐵站內的廣告,其美學精髓在於極簡,通常只用一張具感染力的圖片,配上簡潔有力的垂直標語。我們要求 AI 採用這種風格,生成一張年輕日本女性在露天和風浴場泡溫泉的廣告相,挑戰它處理水汽透明感與精確網格排版的能力。
Prompt 參考:「一張專業的日本 JR 地鐵站廣告海報排版。主視覺是一位年輕日本女性在露天和風浴場泡溫泉的側面照,光影呈現出日系感,細緻的水珠與蒸汽效果。排版需嚴格遵守日式極簡網格:右側配合優雅的垂直繁體中文標語『極致療癒:冬日溫泉物語』,海報底部留有乾淨的空白區並帶有微小的模擬企業 Logo 標識。整體呈現出像日本鐵路車站見到的那種高質感、清爽且專業的商業設計。」
結果:
▲ 成品的效果令人驚喜。首先,文字渲染的精準度極高,最困難的繁體中文標語完全正確,字體選擇(類明體/宋體)亦符合日本廣告的優雅美學;AI 甚至自動補上了一句日文副標題「この冬、心ほどけるやさしい時間を。」(今年冬天,享受一些溫柔的時刻,撫慰你的心靈。)排版亦體現「日本風格」,執行了常見網格設計。至於光影與細節處理,雖然細看皮膚部分,仍會感覺到些 AI 特有的平滑質感,但在光影與物理細節的處理上已大幅躍進。
同場測試:Gemini Nano Banana
▲若與 Gemini 生成的人像相比,ChatGPT 的人臉膚色依然帶有 AI 特有的平滑質感,但在光影佈局與物理細節的處理上已大幅躍進。特別是模特兒肩膀上的水珠與蒸氣效果。整體而言,Gemini 在人像的自然感上稍勝一籌,但 ChatGPT 在排版邏輯與文字語境理解上展現優勢。
通用 Prompt(讀者可以直接複製貼上試玩):
「[主題物件/模特兒] 在 [場景設定] 的寫真照,風格為 [如:日式極簡 / 港式懷舊] 的商業海報。排版需預留大面積留白,在 [左側/右側] 加上垂直排列的繁體中文標語:『[標語內容]』。海報底部需設有極簡的白色資訊欄,包含模擬商標與網址。強調自然光影與專業排版。」
實測 2)上傳圖片轉化專業海報
對於想做海報但缺乏靈感的朋友,ChatGPT 同樣能提供實質幫助。一如 Gemini Nano Banana,它不只能從零生成圖片,更支援上傳圖片後再作修改。我們特意拍了一張燈光效果非常平淡的「乾炒牛河、湯及凍飲」生活照,要求 AI 協助將這張相片轉化為具備商業質感的茶餐廳下午茶促銷海報,而且圖片要有中文字。
▲原圖燈光平淡,雖然味道不錯但看起來有一種「頹廢感」
實測 Prompt 參考:
「參考上傳照片中的食物佈局:一碟乾炒牛河,配上一碗羅宋湯和一杯的凍檸茶。將此視覺轉化為一張專業地道的茶餐廳下午茶促銷海報。海報上方用繁體中文寫上『震撼價』,中間橫幅標註『下午 15:00 起 $30 乾炒牛河』,下方註明『附湯和凍飲』。整體設計要地道港式茶餐廳的親切感」
結果:
▲ 可以看到,images 2.0 生成的圖片令食物看起來更有色澤,而且輸出的中文字都大致準確,原本指令提及的『震撼價』,『下午 15:00 起 $30 乾炒牛河』以及下方註明『附湯和凍飲』全部成功生成。而且更為了令設計更豐富,AI 更輸出了其他標語,看起來合理且美觀
▲ 但如果我們吹毛求疵,可以見到「典」字甩色,相信真正商業用途未能完全應用
通用 Prompt(讀者可以直接複製貼上試玩):
「參考這張上傳照片的構圖與物件。請將此視覺轉化為一張具備 [如:港式 / 簡約 / 奢華] 風格的商業推廣海報。在畫面上方加入繁體中文標題『[主標題]』,並在顯眼位置加上促銷文字『[具體優惠內容]』。請提升畫面的光影質感與食物/產品的層次感,確保字體排版專業且美觀。」
實測 3) 資訊視覺化 專業 Infographic 製作
除了商業海報,Images 2.0 在整理資訊圖表(Infographic)方面的表現同樣令人刮目相看。我們以健康科普為主題,要求 AI 製作一張關於「遲瞓(熬夜)對身體影響」的圖表。
實測 Prompt 參考:「一張專業的醫學科普 Infographic 資訊圖表,主題是『遲瞓對身體的影響』。排版需整齊美觀,中間有一個人體輪廓示意圖。圖表需包含四個重點標註,並用繁體中文寫上標題:1. 記憶衰退、2. 皮膚暗沉、3. 免疫下降、4. 情緒不穩。主標題為『熬夜的代價』。風格採用現代扁平化設計(Modern Flat Design),色彩簡約專業」
結果:
▲ 實測結果令人讚嘆,成品展現出極高的排版與文字處理能力。首先,繁體中文的內容輸出完全正確,字體清晰且沒有任何亂碼或文字重疊問題。在視覺邏輯方面,四個重點標註精確地指向人體的相關部位(如記憶衰退指向腦部、皮膚暗沉指向臉部),充分展現了模型在生成前的「思考」過程。最讓人驚喜的是內容的自動補完:AI 不僅完成了指令要求的四點標註,還主動在底部增加了「良好睡眠小貼士」區塊,甚至連固定作息、減少藍光等專業建議都一併列出。這種整合零散資訊並自動優化視覺架構的能力,讓 AI 圖表已經達到能直接用於簡報或社群媒體的高度。
通用 Prompt(讀者可以直接複製貼上試玩):
「一張關於 [主題內容] 的專業 Infographic 資訊圖表。採用 [風格,如:現代扁平化 / 簡約手繪] 佈局,畫面中央為 [核心主體]。圖表需包含 [數量] 個重點資訊區塊,並以繁體中文標註:1. [點 1]、2. [點 2]、3. [點 3] 等。主標題為『[大標題]』。確保排版整齊,視覺引導清晰」
實測 4)製作食譜
除了健康資訊,讀者也可以製作步驟食譜。例如輸入指令要求製作「港式絲襪奶茶食譜」,AI 能自動安排材料清單、烹飪步驟的圖標(Icon)以及最終成品的展示位,這對於經營生活類社交帳號的用戶來說極具吸引力。
▲ 可以看到即使我們沒有輸入製作步驟,生成圖片已自動提及了
通用 Prompt(讀者可以直接複製貼上試玩):
「製作一張專業的 [食物名稱] 食譜資訊圖表。排版需包含左側的『材料清單』與右側的『烹飪步驟』。所有標註需使用繁體中文。風格採用 [粉色系/北歐簡約] 設計,加入可愛的食材插畫,主標題為『[食物名稱] 製作秘笈』,確保視覺平衡且資訊清晰。」
實測 5.)製作漫畫分鏡 滿足「漫畫家」夢想
對於擁有漫畫夢的朋友,Images 2.0 的 2K 解析度與多格處理能力,讓製作專業感的分鏡(Storyboard)變得輕而易舉。我們挑戰用 Images 2.0 生成一頁過的日本風格漫畫,測試它對敘事邏輯的理解。主題是每個香港人都經歷過的「天氣騙局」。
故事大綱:故事主角是一位身材健美、外型出眾的女大學生。她出門前看到天氣預報顯示今日只有「19.0°C」,心想天氣微涼,便穿上了一件帥氣的厚風褸出街。怎料一出到街,陽光猛烈,體感溫度直逼 30 度,於是汗流浹背。
實測 Prompt 參考:
「創作一頁高品質的日本黑白漫畫分鏡,主題是『香港天氣騙局』。排版包含 4 格。
第一格:一名身材苗條、擁有健美線條的女大學生在家看天氣預報,手機顯示為 19 度,她正興奮地穿上一件厚風褸。
第二格:她走在繁華的香港街頭,陽光極其猛烈,背景的路人都穿著短袖 T 恤。
第三格:主角特寫,她滿頭大汗,神情極度狼狽,臉頰泛紅,風褸明顯被汗水浸濕,呈現出強烈的『熱死人』氛圍。
第四格:主角無奈地脫下風褸抱在懷中,背景有誇張的熱氣特效。 畫面需包含專業網點(Screentone)、日漫風格的誇張表情,對話框使用繁體中文:『話係 19 度喎…』、『熱死我喇!』。2K 高清解析度。」
▲實測非常成功。首先,角色一致性維持得很好,特別是模特兒的運動型身材與「汗流浹背」的物理細節處理得極其擬真。最驚喜的是背景處理,AI 準確識別了香港銅鑼灣的地標,讓漫畫具備極強的地道感
通用 Prompt(讀者可以直接複製貼上試玩):
「創作一頁高品質的日本黑白漫畫分鏡,排版包含 [格數] 個分鏡格。故事主題是 [主題描述]。畫面需有專業網點、[氣氛描述] 的效果線,並在對話框加入廣東話繁體中文:『[文字內容]』。強調 [畫風類型] 的風格,展現極強的敘事感與人物連貫性。」
實測 7:旅遊行程 完成規劃與設計
對於喜歡旅行的香港人來說,規劃行程往往是最花時間的環節。我們先向 ChatGPT 問:「我準備快閃東京3日,為我準備3日行程,我想買最新時裝同古著,我會住新宿」,ChatGPT 提供行程建議後,我們再要求 ChatGPT 製作行程解說圖,以後去旅行不用麻煩「J人」朋友編行程了。
▲生成的圖表排版非常美觀,不僅列出了每日行程(Day 1 新宿/原宿/澀谷、Day 2 下北澤古著、Day 3 表參道精選),更自動配上相對應的店鋪標誌如 Donki、BicCamera 等。畫面中央的地圖輪廓清晰勾勒出交通路徑,底部甚至主動附上了「打卡拍照」、「預留行李空間」等小提醒
通用 Prompt(讀者可以直接複製貼上試玩):
「一張專業的旅遊行程 Infographic。主題為『[目的地] 「日子」行程指南』。排版需包含時間線以及景點插畫標誌。所有標註使用繁體中文。風格採用 [風格] 設計,畫面中央設有地圖輪廓,確保資訊層次分明。」
進階秘技:想不出如何撰寫 Prompt?「反向指令」教學
有時腦海中雖然已經構思好非常驚人且具視覺衝擊力的畫面,但到了動筆撰寫 Prompt 時,卻發現文字往往無法準確表達出心中所想。其實我們可以製圖之前,先和 AI 溝通好想如何做圖。
例如,我們可以嘗試輸入以下對話:「我想做『香港街頭霓虹燈靚女』的圖片,但我不知道如何用專業的繪圖指令去精確表達。您可以根據您的繪圖邏輯,問我 5 個關鍵問題來協助我挖掘構思中的細節嗎?」當回答了這些引導性的問題後,再要求它:「請根據我的描述,將這些畫面轉化為 3 組不同風格的專業繪圖 Prompt。」
這種方法能幫您將抽象的靈感具體化,利用 AI 的專業框架去生成比您預期更震撼的畫面。而且不論你是用 Gemini 或者 ChatGPT,這個做法也啱用。
總結
經過一連串高難度的實測,ChatGPT Images 2.0 的進步確實是有目共睹的,特別是在文字理解與排版邏輯上,已經解決了過往 AI 繪圖最大的問題。在性能方面,Images 2.0 平均生成一張圖片大約需要 30 秒,這段時間包含了背後的邏輯推理與「思考」過程,雖然比舊版稍慢,但換來的精確度絕對值得等待。
▲ Images 2.0 平均生成一張圖片大約需要 30 秒
另外,有一點要提醒大家,Images 2.0 有時會顯得太過「積極」,會根據理解自動加入額外的文字標籤或設計元素。雖然大多時候效果不錯,但如果您對設計有特定要求,或者希望畫面保持簡潔,記得在指令中明確註明「不要額外文字」或「保持極簡」,以免 AI 的自發創意影響了您的初衷。
至於讀者最關心的工具選擇:如果您追求極致自然的人像質感與光影漸變,Gemini Nano Banana 依然具備優勢,且對於香港用戶來說,無需 VPN 即可直連使用,便利性無可取代;最終如何取捨,大可以根據您的創作需求與操作習慣來決定。
常見問題 FAQ
ChatGPT Images 2.0 在香港可以免 VPN 直接使用嗎?
不能,香港用戶須經 VPN 連接外地。若想查 Pura90 Pro Max 規格等圖文,建議連線台灣。新一代 ChatGPT Images 2.0 的最大優點是什麼?
具備 AI 思考邏輯,能精準生成繁體中文字與複雜排版。這是本次升級最大優點。Images 2.0 生成圖片的光影與人像表現如何?
人像膚色仍帶 AI 平滑感,但光影細節大幅躍進。若追求極致自然,Gemini 更勝一籌。這次 Images 2.0 的 AI 圖片生成速度快嗎?
Images 2.0 平均產圖需 30 秒,包含背後推理思考過程。雖稍慢但精準度極高。實際操作 Images 2.0 時有什麼需要特別注意?
它有時會過度積極加字。正如 unwire 評測建議,若要簡潔畫面,請在指令明言不要額外文字。
|
鍾意就快D Share啦!
|
|
|


