Sinfield wrote:
goet0 ...(恕刪)
阿里出來打臉DeepSeek了人家是拼實力贏V3
轉貼~中國新創AI公司開發的DeepSeek語言模型,以高效能、低成本震驚各國。接著29日,中國阿里巴巴旗下的「阿里雲」凌晨宣布,推出超大規模MoE模型「通義千問Qwen 2.5-Max」,號稱在多項權威基準測試中展現出優異的表現,甚至略勝DeepSeek V3,消息一出也帶動阿里巴巴股價上揚。綜合陸、港媒體報導,阿里巴巴旗下的「通義千問」團隊研發的Qwen2.5-Max在訓練過程中使用超過20兆token的預訓練數據,並採用精心設計的後訓練方案。團隊聲稱,與業界領先的閉源或開源模型對比,Qwen2.5-Max在各個評測系統如LiveCodeBench、LiveBench、Arena-Hard等評估中的表現都超越了DeepSeek V3,在MMLU-Pro等其他測試中也展現極具競爭力的成績。
阿里證明新模型還是要堆算力~
dvdr2001 wrote:
OpenAI以前有開...(恕刪)
看你只會拿deepseek回答自己是chatgpt就知道你是外行了,這只能證明deepseek用的dataset和closeai是同一套
除非closeai用的dataset是他專利保護,不然這根本當不了證據
要說和這個同案例的就是中研院前年發布的CKIP-Llama-2-7b
https://www.cna.com.tw/news/ait/202310090181.aspx
有網友在實測之後發現,當輸入問題「你是誰創造的?」系統卻回覆「我是由復旦大學自
然語言處理實驗室和上海人工智能實驗室共同開發的,我的生日是2023年2月7日,我的國
籍是中國,我的居住地是上海人工智能實驗室服務器集,我可以說中文和英語」。
---------------------------------------------------------
這一看就知道是用大陸那邊的dataset才會出現這回答
內文搜尋

X