熱爆娛樂 +: Elon Musk 嫌 Grok 答錯《柏德之門》押後模型更新並緊急抽調工程師補救 #Elon Musk

2026年2月26日星期四

Elon Musk 嫌 Grok 答錯《柏德之門》押後模型更新並緊急抽調工程師補救 #Elon Musk

Elon Musk 旗下 AI 公司 xAI 去年曾因聊天機械人 Grok 無法準確回答《柏德之門》（Baldur’s Gate）遊戲細節問題，延遲數天推出模型更新。xAI 更緊急抽調多名高級工程師放下手頭項目，專門協助改善 Grok 遊戲知識庫。

工程師臨時被抽調遊戲問題觸發內部混亂

Business Insider 深度調查報道披露，Elon Musk 對 Grok 回答《柏德之門 3》（Baldur’s Gate 3）細節問題表現強烈不滿，下令延遲推出相關模型更新。他要求高級工程師放下手頭項目，轉而處理遊戲知識不足問題。部分前 xAI 員工形容公司工作氛圍猶如無休止消防演習。xAI 位於帕洛阿爾托（Palo Alto）總部設有多個作戰室，隨時應對各種緊急情況。Elon Musk 對遊戲知識執著程度不止於此。他同時要求工程師提升 Grok 在《英雄聯盟》（League of Legends）遊戲能力，目標更是達到最高挑戰者（Challenger）段位。

Larian Studios 開發《柏德之門 3》，以龍與地下城（Dungeons & Dragons）為背景。遊戲劇情複雜且機制豐富，廣受 RPG 玩家好評。由於網上有大量相關攻略可供參考，業界對 Grok 當時連這款遊戲細節問題也答錯感到相當意外。

Grok 成績大翻身準確率現達 92%

事發後 Grok 於《柏德之門》相關知識表現明顯改善。TechCrunch 於 2026 年 2 月報道，Grok 現時已能準確回答《柏德之門》相關問題。有測試機構以 BaldurBench 為名，向 Grok、ChatGPT、Claude 及 Gemini 各提出 5 條《柏德之門》相關問題進行比較。結果顯示 Grok 整體勝任，準確率據報達 92% 。

四大 AI 風格各異

測試結果顯示各 AI 回答遊戲問題時風格截然不同。Grok 偏好以表格形式呈現資料，並大量使用 save-scumming 及 DPS 等玩家術語，不熟悉遊戲用戶較難理解。ChatGPT 傾向以重點列表簡潔作答。Gemini 著重以粗體標示關鍵詞。Claude 則對劇透極為謹慎，建議玩家自行探索遊戲。由於各 AI 大多從相同網上攻略資源汲取知識，回答風格差異比內容差異更為明顯。

今次事件突顯 xAI 內部管理混亂。這同時反映 Elon Musk 對 Grok 能力有極高要求，最終令 Grok 遊戲知識領域能力得到大幅提升。

資料來源：Kotaku、TechCrunch、The Gamer

熱爆娛樂 +

網頁

2026年2月26日星期四

Elon Musk 嫌 Grok 答錯《柏德之門》押後模型更新並緊急抽調工程師補救 #Elon Musk

工程師臨時被抽調遊戲問題觸發內部混亂

Grok 成績大翻身準確率現達 92%

四大 AI 風格各異

分享到 :

最新影片

Follow 我們 :

網頁

2026年2月26日 星期四

Elon Musk 嫌 Grok 答錯《柏德之門》 押後模型更新並緊急抽調工程師補救 #Elon Musk

工程師臨時被抽調 遊戲問題觸發內部混亂

Grok 成績大翻身 準確率現達 92%

四大 AI 風格各異

分享到 :

最新影片

Follow 我們 :

2026年2月26日星期四

Elon Musk 嫌 Grok 答錯《柏德之門》押後模型更新並緊急抽調工程師補救 #Elon Musk

工程師臨時被抽調遊戲問題觸發內部混亂

Grok 成績大翻身準確率現達 92%