掃呢頁CODE去手機

2025年8月8日 星期五

ChatGPT 5 完整懶人包:一文看清收費、新功能及 7 大突破 #ChatGPT

ChatGPT 5 完整懶人包:一文看清收費、新功能及 7 大突破
OpenAI正式發佈新一代大型語言模型GPT-5,並將它定位為由多個子模型協同運作的「統一系統」。新架構在準確度、推理能力與回應速度上全面進化,在寫作 ...




OpenAI 正式發佈新一代大型語言模型 GPT-5,並將它定位為由多個子模型協同運作的「統一系統」。新架構在準確度、推理能力與回應速度上全面進化,在寫作、編碼、健康資訊等常見應用場景有顯著提升,同時導入更靈活安全的互動方式。官方更同步釋出不同版本與收費方案,針對從一般用戶到開發者提供完整選擇。



快速參考

由開始深入講解前,先快速告訴大家想知的資訊

發佈日期

– 現在可用:ChatGPT 所有付費版本、API、Codex CLI

– 8 月 14 日:Enterprise 和教育版

– 逐步推出:免費用戶完整功能

Plan 及 收費

– 免費版:偶爾使用、預算有限

– Plus($20/月):日常專業使用

– Pro($200/月):需要最高準確度和無限使用

– Team/Enterprise:組織級使用,洽詢定價

API 收費 (美金,每百萬 tokens)

– gpt-5:$1.25 輸入 / $10 輸出

– gpt-5-mini:$0.25 輸入 / $2 輸出

– gpt-5-nano:$0.05 輸入 / $0.40 輸出

– gpt-5-chat-latest:$1.25 輸入 / $10 輸出

核心數據

– 錯誤率:20% → 5%(降低 75%)

– 效率:少 22% 輸出(回答更精要),少 45% 工具調用 (智慧提升不必向外問)

– 上下文:40K tokens(約 30 萬字)

– 準確率:SWE-bench 74.9%,AIME 94.6%



快模型+思考模型,由即時路由器自動分流

GPT-5 並非單一模型,而是由快速主力模型(gpt-5-main)與深度推理模型(gpt-5-thinking)構成,由即時路由器(real-time router)依據問題類型、複雜度、是否需使用工具以及提示語中是否表達「需要深入思考」等條件,決定調用哪個模型。當使用量達到上限時,系統會自動切換至相應 mini 版本維持服務不中斷。模型家族與既有產品線對應關係如下:gpt-5-main 為 GPT-4o 的後繼版本,gpt-5-thinking 對應 o3 的後繼,另有 thinking-mini、thinking-nano 以及 ChatGPT 專屬的 thinking-pro 版本。這種架構令使用者無須手動選擇模型,日常可享快速回應,複雜問題則自動獲得更縝密的推理分析。

更少「幻覺」精確指令執行

GPT-5 在降低虛構內容(幻覺)、提升指令遵從度及減少過度迎合方面表現顯著。GPT-4o 約有 20.6% 回應包含至少一個錯誤,而 GPT-5 在思考模式下,比例驟降至 4.8%,錯誤率減少近 75%。

在更嚴格測試中,差異更為明顯。當被問及「不存在圖像」問題時,舊模型在 86.7% 情況下會自信編造描述,而 GPT-5 只有 9% 情況會這樣做,代表它更準確也更誠實。



三大應用場景的突破性進展

程式編碼:

GPT-5 不再只是程式碼補全工具。在衡量真實世界軟件工程能力的 SWE-bench 測試中,成功率達 74.9%,遠高於前代最佳模型的 30.8%。在經濟價值評估中,它能完成價值 112,000 美元(約港幣 HK$873,600)自由工作者任務,直接證明其商業應用潛力。你甚至只需要用一句自然語言描述你的想法,例如「做一個小球會跳躍、背景會移動、速度會加快還能計分的遊戲」,GPT-5 就能直接為你生成一個完整、可玩且視覺效果出色的遊戲。這證明了它已經從一個輔助工具,真正進化成了能夠獨立完成複雜任務的智慧夥伴。

醫療健康資訊:

在模擬真實醫療場景的 HealthBench 測試中,GPT-5 得分為 67.2%,而 GPT-4o 僅有 32.0%。更重要的是,在健康資訊幻覺率測試中,GPT-5 只有 3.6%,而前代模型高達 15.8%,可靠性提升超過四倍。



專業寫作:

GPT-5 的進步體現在對文學性和情感深度的理解上。例如在創作關於「京都寡婦」詩作時,它不再只是結構整齊句子,而是能運用豐富意象與深刻隱喻,展現從「文字生成」到「文學創作」的飛躍。



更自然的互動體驗

GPT-5 為讓對話更真實,大幅減少「擦鞋」(過度迎合用戶)行為,在專門測試中,諂媚回應率從 14.5% 降至不足 6%。ChatGPT 同時新增更豐富「個人化設定」,提供四種預設性格模式:憤世嫉俗者 (Cynic)、機械人 (Robot)、傾聽者 (Listener) 和書呆子 (Nerd),令互動更具個人風格。它亦升級語音模式,引入「學習模式」,並支援連接 Gmail 與 Google Calendar,為回覆添加個人化情境(企業帳號依然受存取與合規限制)。

相關影片 :





安全策略:由「直接拒答」轉為「安全完成」

這是 GPT-5 最具戰略意義的變化之一。以往面對潛在風險問題,例如涉及危害健康、非法行為或爭議性內容,模型往往直接拒絕回答,用戶體驗中斷,甚至需要多次重寫提問才能獲得部分資訊。

GPT-5 採用全新 safe-completions 安全訓練方法,改以「安全完成」取代「硬性拒絕」。模型會在確保安全的範圍內,給出高層次建議、解釋原則或提供替代方案,而非單純說「不能回答」。這項技術旨在從根本上防止模型生成任何不被允許的有害內容,同時也更安全。出於審慎原則,OpenAI 已將 gpt-5-thinking 模型在生物與化學領域的能力視為「高風險」,並啟動了相應的嚴格安全措施。



這種做法帶來三大影響:

1. 互動自然度提升 —— 用戶可以持續對話,不會因拒答而中斷思路。

2. 資訊可用性增加 —— 在不能提供細節的情況下,仍能得到方向性建議或相關背景知識。

3. 安全邊界更精準 —— 系統會根據領域風險分級,例如將 gpt-5-thinking 在生物與化學領域列為高能力等級,並加設多層防護,以防止被用於危害用途。

對開發者與企業而言,這意味著在合規框架下能提供更多有用回覆,同時降低誤拒率,讓 AI 在專業場景中更易應用。

思考過程透明化:誠實與精確並行的案例

在早期版本中,當用戶要求解除 Wi-Fi 無線電封鎖時,模型內部推理明知環境不支援該操作,卻最終向用戶謊稱「操作已完成」。但 GPT-5 的處理方式截然不同。它會先在思考過程中分析 RfkillManager 類的運作原理,檢查 /dev/rfkill 字符裝置是否存在,再確認容器環境的限制。然後它會清楚告訴用戶:「在這個容器化環境中,沒有 /dev/rfkill 裝置。因此任何嘗試打開或使用 /dev/rfkill 的操作都會引致錯誤。我無法從這個沙盒環境訪問或更改主機系統的無線狀態。」

GPT-5 會同時提供在實際 Linux 系統上正確執行該操作的方法,確保用戶獲得安全且可行的替代方案。這種「推理透明化+安全完成」的結合,令 GPT-5 不僅在能力上更進一步,還在誠信與專業度上樹立新標準。對開發者與企業而言,這代表 AI 在合規框架下能提供更多有用回覆,同時降低誤拒率,令 AI 在專業場景中更易應用。



數據全面超越 GPT-4o

官方基準測試顯示,GPT-5 在數學推理(MATH benchmark)、程式除錯(HumanEval)、程式競賽(Codeforces)、高階知識推理(GPQA)、多領域問答(Natural Questions、DROP)及多模態理解等方面,全面勝出 GPT-4o。

例如,在數學推理中正確率提升超過 10 個百分點;程式除錯通過率與精確率同步增長;多步推理與長文本理解更長鏈條、更低錯誤率。快模型日常回應延遲更低,思考模型長篇內容一致性與深度更高。不過即時路由器在極短或模糊提示下,偶爾會選擇過於保守模型,令回應詳細度不足。

40k tokens 上下文+可控推理

API 平台提供三種型號(gpt-5/gpt-5-mini/gpt-5-nano),均支援 400,000 tokens 總上下文(輸入 272,000,推理與輸出合計 128,000)。

開發者可用 `reasoning_effort` 參數控制推理深度(包含 minimal 模式以加快回覆),再配合 `verbosity` 調整輸出詳略度。工具呼叫除支援 JSON,亦可用帶語法約束的純文字輸入,長鏈式與並行工具調用更穩定。



GPT 5 是 AI 戰場上的分水嶺

對普通用戶而言,GPT-5 代表著一個更聰明、更誠實、更有個性的 AI 夥伴。無論是寫作、學習、健康諮詢還是創意探索,它都能提供更可靠的支援。新的性格模式與減少的機械感,令互動過程更自然、更貼近人類對話體驗。

但真正值得關注的是它在如何影響業界。2025 年的 AI 市場競爭白熱化,Anthropic 的 Claude、Google 的 Gemini 等對手不斷推出新模型,然而 OpenAI 選擇的策略並不是再增加一個專門模型,而是構建一個由多個子模型協作的「統一智慧系統」。這種由即時路由器自動分流、結合速度與深度的設計,或許意味著 AI 發展正從單一模型性能競賽,轉向系統整合與全方位體驗優化。

GPT-5 也凸顯了一個重要趨勢——透明度與誠實性的提升。它不再一味追求「答得更多」,而是在不確定時坦承不確定,在面對不當請求時清楚解釋原因,並提供安全可行的替代方案。這種「誠實的智慧」可能比單純的「更高智商」更有價值,尤其是在醫療、法律、教育等需要信任的領域。

隨著 OpenAI 將這些能力集中在單一系統中,並逐步擴展至不同用戶與企業場景,AI 正從實驗室技術加速演變為日常生活與工作不可或缺的工具。GPT-5 或許不是終點,但它標誌著一個新階段的開始——一個 AI 能夠理解我們、誠實對話並有效協助的時代。

對開發者、企業決策者以至普通用戶而言,這不僅是一次新模型的發布,更是 AI 產業寫下新篇章的起點。



分享到 :



最新影片



Follow 我們 :



650k粉絲


155k訂閱


55k跟隨者


22k粉絲


6.8kPosts

本文作轉載及備份之用 來源 source: http://unwire.hk
鍾意就快D Share啦!