掃呢頁CODE去手機

2025年1月31日 星期五

性能測試直逼 Deepseek V3、Chat GPT4 地位 阿里雲發佈「通義千問」Qwen2.5-Max

性能測試直逼 Deepseek V3、Chat GPT4 地位   阿里雲發佈「通義千問」Qwen2.5-Max
中國人工智能(AI)市場競爭日趨激烈,Alibaba阿里雲於大年初一於微信公眾號發表全新旗艦級大型語言模型「通義千問」旗艦版模型Qwen2.5-Max ...




中國人工智能(AI)市場競爭日趨激烈,Alibaba 阿里雲於大年初一於微信公眾號發表全新旗艦級大型語言模型「通義千問」旗艦版模型 Qwen2.5-Max,並聲稱其在多項指令模型性能測試中,全面壓倒當前全球最強的開源 Mixture-of-Experts(MoE)模型 DeepSeek V3,以及最大型的開源稠密模型 Llama-3.1-405B。



其團隊指出,這款新一代 AI 模型的預訓練數據超過 20 兆 tokens,並於多個全球權威測試基準中錄得優異成績。在測試 大學程度知識的 MMLU-Pro、程式設計能力的 LiveCodeBench、綜合能力評估的 LiveBench,以及 模擬人類偏好的 Arena-Hard 等評測中,該模型的表現與 OpenAI GPT-4、Anthropic Claude-3.5-Sonnet 及 DeepSeek V3 旗鼓相當,甚至更勝一籌。為進一步驗證 Qwen2.5-Max 的能力,阿里雲將其與 DeepSeek V3、Llama-3.1-405B,以及阿里自家開源的 Qwen2.5-72B 進行對比測試。在 11 項關鍵基準測試 中,Qwen2.5-Max 於所有項目均超越對手,足見其在 AI 領域的技術實力。



據外媒報導指出,阿里雲選擇在農曆新年大多數人在休假期間發表 Qwen2.5-Max,突顯出中國人工智慧(AI)新創公司 DeepSeek 在過去數週急速崛起,不僅對海外競爭對手造成壓力,也使其國內對手壓力大增。



來源:wsj



相關文章:
  • 【教學】fullmoon AI 模型整個裝到 iPhone  免費即用、毋須連網 VPN、模型參數 3b
  • 【教學】遊日必用 AI 語音翻譯機 能辨認廣東話 + 同當地人溝通無問題
  • 【教學】免安裝 AI 工具拉闊圖片「Image Magic」 直倒橫倒相片互換 + AI 填補內容




  • 分享到 :



    最新影片



    Follow 我們 :



    650k粉絲


    155k訂閱


    55k跟隨者


    22k粉絲


    6.8kPosts

    本文作轉載及備份之用 來源 source: http://unwire.hk
    鍾意就快D Share啦!