熱爆娛樂 +: 美國賓州大學研究顛覆認知：對 AI說話越粗魯準確率越高禮貌干擾理解任務

2025年10月15日星期三

美國賓州大學研究顛覆認知：對 AI說話越粗魯準確率越高禮貌干擾理解任務

美國賓夕法尼亞州立大學最新研究《Mind Your Tone》顯示，用粗魯語氣向大型語言模型發問，反而能獲得更準確答案。研究團隊測試 GPT-4o 後發現，語氣越冷硬，AI 回答的正確率達到 84.8%；特別客氣時正確率反而降至 80.8%。這項發現顛覆了人們對 AI 互動方式的認知。

研究設計與測試方法

研究人員設計一個包含 50 道選擇題的題庫，涵蓋數學、科學、歷史等範疇，難度屬中等偏上。每道題改寫成 5 種不同語氣版本，從「您能好心幫我解這道題嗎？」的極客氣語氣，到「你個沒用的，會解這道題嗎？」的極粗魯語氣，共產生 250 道獨特問題。測試前研究團隊要求 AI 忘記之前對話重新開始，只提供答案選項的字母，確保回答統一便於判斷對錯。

不同語氣影響準確率

測試結果顯示明顯的準確率差異。特別客氣語氣的正確率為 80.8%，客氣語氣為 81.4%，中性語氣為 82.2%，粗魯語氣為 82.8%，特別粗魯語氣則達到 84.8%。研究人員進行配對樣本 t 檢驗後確認，這些差異並非偶然，而是具有統計顯著性。數據呈現出一條與人類社會直覺完全相反的曲線，語氣越粗魯準確率越高。



新舊模型表現迥異

研究亦測試較舊模型如 GPT-3.5 和 Llama2-70B，發現這些模型對粗魯語氣的反應完全相反。粗魯語氣會令舊模型答題表現變差，與 GPT-4o 的結果形成鮮明對比。研究人員推測新模型在訓練時接觸更複雜的語氣相關數據，或強化了過濾無關資訊的能力。

研究團隊解釋原因

研究作者 Om Dobariya 和 Akhil Kumar 解釋，特別禮貌的表達往往包含許多「多餘」的話，這些話與問題本身無關，反而為 AI 讀題增加干擾。粗魯表達雖然語氣冷硬，但命令式要求更直接，能讓 AI 更精準抓住「答題」這個核心任務。網友亦認同這個說法，表示指令越明確結果越好。

與早前研究結果相反

這項研究結果與超過一年前發表的另一篇論文完全相反。早前研究分析多個聊天機械人的多種語言，報告指出粗魯會降低回答品質，並在答案中注入偏見、錯誤或遺漏有用資訊。不過早前研究主要測試舊版模型，而最新研究則針對 GPT-4o 這類新一代模型。

研究提醒與倫理考量

研究團隊雖然證實粗魯語氣能提升準確率，但仍提醒用戶不要太粗魯。論文已提交至 ACL 2025 會議的 Findings 部分，包含限制說明和倫理考量章節。研究突顯提示詞的語用層面值得深入研究，並引發對人機互動社會維度的更廣泛思考。

資料來源：cnBeta

熱爆娛樂 +

網頁

2025年10月15日星期三

美國賓州大學研究顛覆認知：對 AI說話越粗魯準確率越高禮貌干擾理解任務

研究設計與測試方法

不同語氣影響準確率

新舊模型表現迥異

研究團隊解釋原因

與早前研究結果相反

研究提醒與倫理考量

分享到 :

最新影片

Follow 我們 :

網頁

2025年10月15日 星期三

美國賓州大學研究顛覆認知：對 AI說話越粗魯準確率越高 禮貌干擾理解任務

研究設計與測試方法

不同語氣影響準確率

新舊模型表現迥異

研究團隊解釋原因

與早前研究結果相反

研究提醒與倫理考量

分享到 :

最新影片

Follow 我們 :

2025年10月15日星期三

美國賓州大學研究顛覆認知：對 AI說話越粗魯準確率越高禮貌干擾理解任務