Greenmaple

阿里巴巴發表通義千問旗艦版AI模型 號稱贏過DeepSeek V3

阿里巴巴

中國阿里巴巴旗下的雲端運算服務科技公司阿里雲,週三(1月29日)發布最新「通義千問」旗艦版人工智慧(AI)模型「Qwen2.5-Max」,號稱表現優於最近爆紅全球的深度求索(DeepSeek)推出的「DeepSeek-V3」模型。

綜合媒體報導,阿里雲在官方微信公告中表示,「通義千問 2.5-Max 幾乎在所有測試中表現優於 GPT-4o、DeepSeek-V3 及 Llama-3.1-405B」。其中,GPT-4o 和 Llama-3.1-405B 分別是 OpenAI 和 Meta 最新的開源AI模型。

據了解,Qwen 2.5-Max使用超過 20 兆token(AI模型處理的資料單位)的預訓練資料及精心設計的後訓練方案進行訓練。阿里雲表示,用戶不必進行繁瑣的文檔分割,該模型可記住更長的對話歷史紀錄,實現更連貫、更自然的交互體驗,也可更佳理解代碼、複雜推理、多輪對話等。

延伸閱讀|中國AI新星DeepSeek震撼矽谷 「80後」創始人梁文峰是何方神聖?

值得一提的是,Qwen2.5-Max的發布時機不同尋常,恰逢農曆大年初一,大多數中國人正在放假與家人團聚,顯示出DeepSeek在過去三週內的快速崛起,不僅對國際競爭對手構成壓力,也迫使國內競爭對手加速升級自身技術。

在DeepSeek於1月20日推出「R1」模型的2天後,TikTok母公司字節跳動公布其旗艦AI模型的更新,並聲稱表現優於OpenAI的「o1」模型。

相關標籤
Facebook

熱門話題

推薦閱讀
搜尋
A white pill on a blue background
VOCO 提供您語音新聞的新選擇,同時賺取金幣、兌換商品

© 2022 VOCO Media – All Rights Reserved.

A white pill on a blue background
VOCO 提供您語音新聞的新選擇,同時賺取金幣、兌換商品

VOCO News 向世界傳播各種新聞,包括時事、體育、娛樂、社區新聞和專業出版物,觀眾可以通過他們的視角更好地了解世界。

Newsletter

Sign up to our newsletter