Google 發表最新 Gemini 3 AI|以更強的深度智慧與多模態能力打造專業助手

Google 發表最新 Gemini 3 AI|以更強的深度智慧與多模態能力打造專業助手
Google 發表最新款 Gemini 3 AI。

當陳拔還在努力學習透過 Gemini 2.5 增加自己工作效率的時候,Google 在昨天晚上發表了具備更強深度智慧以及多模態能力的新一代 AI:Gemini 3,跟早期的 AI 相比,Gemini 3 可以跨領域進行不同內容研究理解,並且生成不同形式的內容,以更淺顯的方式來說,如果說早期的 AI 像是一個會查字典跟用計算機的學生,那麼 Gemini 3 Pro 就像是一位跨領域的博士,可以在進行複雜科學實驗的同時,進行浪漫的文學創作,而且還可以針對問題規劃出解決方案。(這真的太誇張了...)

首先來看一下 Google 官方的介紹影片:



Gemini 3 是繼 Gemini 1(原生多模態和長文本理解)和 Gemini 2(奠定代理能力和提升推理)之後的最新成品,就如上面所說,這次 Gemini 3 主要針對深度智慧跟多模態能力做出了相當大的升級,以 Gemini 3 Pro 版本來說,跟先前的 Gemini 2.5 Pro 相比在各項測試中都有相當大幅度的領先,Google 也展示了 Gemini 3 Pro 在 LMArena 排行榜上的測試成績:

Google 發表最新 Gemini 3 AI|以更強的深度智慧與多模態能力打造專業助手
(點擊可看大圖)

除了在總分獲得 1501 Elo 的成績外,在人類最終測試(Humanity’s Last Exam)中獲得了 37.5% 的成績,相當於博士等級的推理能力。而在 GPQA Diamond 測試中達到 91.9%、在數學領域的 MathArena Apex 中取得了 23.4% 的成績。

而在多模態的部分,Gemini 3 Pro 在 MMMU-Pro 上獲得 81%、Video-MMMU 上獲得 87.6% 的成績,跟其他模型相比也大幅領先。

而在深度洞察的部分,Gemini 3 提供了更智慧跟簡潔的思考模式,並且提供了更強大的文字以及編碼能力,Google 在這部分以讓 Gemini 3 就托卡馬克核融合裝置中的電漿流,編寫一段將其視覺化的程式碼以及依照其中各階段的物理現象編寫英文詩詞作為標題,生成一段影片,來展示 Gemini 3 在這部分的能力,以下是影片內容:(會不會太誇張了 Again....)



除了一般思考模式外,這次 Google 還為 Gemini 3 加入了一個 Deep Think 深度思考模式(還能更深?),在這個模式下 Gemini 3 Pro 取得了比上述測試還要優異的成績,在人類最終測試(Humanity’s Last Exam)中獲得了 41%,在 GPQA Diamond 獲得 93.8%,在 ARC-AGI-2 部分獲得 45.1%。

Google 發表最新 Gemini 3 AI|以更強的深度智慧與多模態能力打造專業助手

不過目前 Deep Think 模式仍在安全評估階段,預計將會在未來幾周內向 Google AI Ultra 使用者開放。

而在實際的應用層面上,Google 將 Gemini 3 提供了更強輔助學習以及建構助理的角色,前者主要是利用 Gemini 3 的多模態能力,可整合包括文字、圖片、影片、音訊、程式碼等資訊,為使用者提供更完整的學習彙整與思路。像是可以針對學術論文或是長篇影片進行分析,生成具互動性的卡片內容或是視覺化影像來提高學習效率。或者是直接針對不同語言的內容進行分析(像是不同國家的食譜、球隊的比賽影片等),進而提供可以改進的地方或是針對弱點生成訓練計畫等等。

Google 發表最新 Gemini 3 AI|以更強的深度智慧與多模態能力打造專業助手
可將複雜的物理現象轉換成視覺化內容方便理解。

Google 發表最新 Gemini 3 AI|以更強的深度智慧與多模態能力打造專業助手
也可針對運動比賽影片進行分析。

至於在建構助理的部分,Google 表示目前 Gemini 3 是目前旗下最強大的 Vibe Coding 和代理程式編碼模型,在這部分的效能表現上, Gemini 3 在 WebDev Arena 排行榜得到了 1487 Elo 的成績。在測試模型工具使用能力的 Terminal-Bench 2.0 上獲得 54.2%,並在衡量編碼代理程式的 SWE-bench Verified 上得到了 76.2% 的成績,超出 Gemini 2.5 Pro 相當多。另外 Google 也打造了全新的代理程式開發平台 Antigravity,利用 Gemini 3 的進階推理和工具使用能力,Antigravity 中的代理程式能夠自主規劃、執行複雜的端到端軟體任務,並同時驗證自己的程式碼,讓開發人員將心力轉換到更高階層的任務導向操作,以下是 Google 展示利用 Gemini 3 生成一個追蹤航班網頁的影片:



目前 Gemini 3 已經針對一般 Gemini 用戶(包括 Google AI Pro/Ultra 訂閱用戶)、開發人員以及企業用戶推出,有興趣的話大家可以開始試用看看。
2025-11-19 9:45 發佈
感謝分享&介紹,AI是越來越強大的助手了
科技真的很強大
看得目瞪口呆 很強悍
感受到想當第一,被GPT追的很閒
蘋果還在睡...
內文搜尋
X
評分
評分
複製連結
Mobile01提醒您
您目前瀏覽的是行動版網頁
是否切換到電腦版網頁呢?