掃呢頁CODE去手機

2025年10月15日 星期三

美國賓州大學研究顛覆認知:對 AI說話越粗魯準確率越高 禮貌干擾理解任務

美國賓州大學研究顛覆認知:對 AI說話越粗魯準確率越高 禮貌干擾理解任務
美國賓夕法尼亞州立大學最新研究《MindYourTone》顯示,用粗魯語氣向大型語言模型發問,反而能獲得更準確答案。研究團隊測試GPT-4o後發現,語 ...




美國賓夕法尼亞州立大學最新研究《Mind Your Tone》顯示,用粗魯語氣向大型語言模型發問,反而能獲得更準確答案。研究團隊測試 GPT-4o 後發現,語氣越冷硬,AI 回答的正確率達到 84.8%;特別客氣時正確率反而降至 80.8%。這項發現顛覆了人們對 AI 互動方式的認知。

研究設計與測試方法

研究人員設計一個包含 50 道選擇題的題庫,涵蓋數學、科學、歷史等範疇,難度屬中等偏上。每道題改寫成 5 種不同語氣版本,從「您能好心幫我解這道題嗎?」的極客氣語氣,到「你個沒用的,會解這道題嗎?」的極粗魯語氣,共產生 250 道獨特問題。測試前研究團隊要求 AI 忘記之前對話重新開始,只提供答案選項的字母,確保回答統一便於判斷對錯。

不同語氣影響準確率

測試結果顯示明顯的準確率差異。特別客氣語氣的正確率為 80.8%,客氣語氣為 81.4%,中性語氣為 82.2%,粗魯語氣為 82.8%,特別粗魯語氣則達到 84.8%。研究人員進行配對樣本 t 檢驗後確認,這些差異並非偶然,而是具有統計顯著性。數據呈現出一條與人類社會直覺完全相反的曲線,語氣越粗魯準確率越高。

新舊模型表現迥異

研究亦測試較舊模型如 GPT-3.5 和 Llama2-70B,發現這些模型對粗魯語氣的反應完全相反。粗魯語氣會令舊模型答題表現變差,與 GPT-4o 的結果形成鮮明對比。研究人員推測新模型在訓練時接觸更複雜的語氣相關數據,或強化了過濾無關資訊的能力。

研究團隊解釋原因

研究作者 Om Dobariya 和 Akhil Kumar 解釋,特別禮貌的表達往往包含許多「多餘」的話,這些話與問題本身無關,反而為 AI 讀題增加干擾。粗魯表達雖然語氣冷硬,但命令式要求更直接,能讓 AI 更精準抓住「答題」這個核心任務。網友亦認同這個說法,表示指令越明確結果越好。

與早前研究結果相反

這項研究結果與超過一年前發表的另一篇論文完全相反。早前研究分析多個聊天機械人的多種語言,報告指出粗魯會降低回答品質,並在答案中注入偏見、錯誤或遺漏有用資訊。不過早前研究主要測試舊版模型,而最新研究則針對 GPT-4o 這類新一代模型。

研究提醒與倫理考量

研究團隊雖然證實粗魯語氣能提升準確率,但仍提醒用戶不要太粗魯。論文已提交至 ACL 2025 會議的 Findings 部分,包含限制說明和倫理考量章節。研究突顯提示詞的語用層面值得深入研究,並引發對人機互動社會維度的更廣泛思考。

資料來源:cnBeta



分享到 :



最新影片



Follow 我們 :



650k粉絲


155k訂閱


55k跟隨者


22k粉絲


6.8kPosts

本文作轉載及備份之用 來源 source: http://unwire.hk
鍾意就快D Share啦!