xAI發布Grok 4.1!性能「打趴Gemini」登頂榜首:跟前一代差在哪?為何幻覺更少了?
重點一:xAI 推出 Grok 4.1 與 Grok 4.1 Thinking,免費開放且宣稱大幅降低幻覺。
重點二:依 LMArena Text Arena 榜單,Grok 4.1 Thinking 榜首(1510 分),Grok 4.1 排第 19(1437 分)。
重點三:付費用戶可獲較少限制;xAI稱 Grok 4.1 較前版幻覺率降至三分之一。
Elon Musk 旗下 xAI 宣布推出兩款模型:Grok 4.1 與 Grok 4.1 Thinking(思考版),並以免費形式開放使用,付費用戶則享有較低使用限制。
官方強調,此次升級在品質與速度均有進展,其中最重要的指標是「降低幻覺」:xAI 表示 Grok 4.1 相較前代模型,產生錯誤內容的機率下降至約三分之一,為近期最具代表性的版本之一。
雖然頁面以「顯著降低」描述成果,但尚未同步公開具體數值、區間、或統計顯著性檢定方法。整體訊息傳達方向是:在非推理(fast)模型加入搜尋工具、並透過後訓練,能提升面向事實的回答穩定度,降低重大與次要錯誤的出現機率。
至於新模型表現如何?
根據 lmarena.ai(LMSYS Chatbot Arena)在 X 公布最新「Text Arena」排行榜,Grok 4.1(thinking)以總分1483 登上榜首;在難度更高的「Arena Expert」榜單,該版本同樣以總分1510 奪冠,顯示其於綜合語言理解、推理與生成品質的競爭力。
同系列的 Grok 4.1(一般版)在「Text Arena」位居第2、總分1465,「Expert」榜第19、總分1437。
lmarena.ai 並指出,相較兩個月前進入 Arena 的 Grok 4 fast,最新成績「提升超過 40 分」,意味模型在對話穩定性、指令遵循與高難度提示(Hard Prompts)等面向有明顯躍升。
lmarena.ai補充,Grok 4.1(thinking)在「高難度提示詞、編碼、指令執行、創意寫作」等概覽類別表現亮眼,且在「職業排行榜」多數職業領域顯示強勢,
Grok 4.1為何幻覺更少了?
頁面明確交代評測框架:採用「非推理模型+網路搜尋工具」進行回答,並以「幻覺率」作為核心品質指標。
白話來說,就是讓「不做深度推理的快速模型」搭配「網路搜尋工具」去回答問題,然後把回答裡每一句可被查證的小事實(原子主張)逐一比對,看有沒有重大或次要錯誤,最後把各題的錯誤比例平均,這個平均值就是「幻覺率」。
此做法符合目前檢核事實一致性的主流思路,但細節如原子主張切分準則、標註者一致性(IAA)、與錯誤分級標準,頁面未見公開;因此,外界暫時只能根據定義理解方向,尚無法重現驗證。
強敵環伺!Gemini 3.0成關注焦點
此次雙版本免費釋出,明確強化 xAI 在用戶擴張上的策略,為開發者與一般用戶提供入門門檻更低的使用選項;同時透過付費方案降低頻率與容量限制,維持商業化的可持續性。
從產品訊息來看,Grok 4.1 的訴求為「更可靠、更快速」,核心賣點鎖定降低幻覺與整體表現提升。「Thinking」版則展現更高階的推理與對話品質,反映出 xAI 對多場景推理能力的重視。
另一方面,競品壓力不減:OpenAI 持續迭代至 GPT 5.1,Google 亦可能以 Gemini 3.0 再度抬高性能天花板。對使用者而言,短期可將 Grok 4.1 視為一個在可靠性上有所強化、且擁有可觀基準成績的免費選項;中期則關注其在更廣泛任務中的真實表現與資源限制的影響。
延伸閱讀:馬斯克又出手!SpaceX豪擲20億美元投資xAI,估值衝上3.3兆元
「地表最強模型」來了!Grok-3挾3種模式發布,馬斯克:你100%會愛上它
資料來源:xAI、LMarena、Bleep Computer
本文初稿為AI編撰,整理.編輯/ 李先泰
更多報導
貝佐斯參戰!出任AI新創「普羅米修斯計畫」CEO:自掏腰包投資62億美元,全為了「實體任務」?
加入黃仁勳麾下!台積電前副總李文如傳11/18降落輝達:她有何資歷?為何蘋果、高通⋯都要延攬她?
其他人也在看

輪椅不是限制而是力量!台灣自辦輪椅技巧障礙挑戰賽登國際舞台,吸引多國選手越洋參賽
由民間自籌自辦的「輪椅技巧障礙挑戰賽」,今年將於11/29-30再度登場。藉由鼓勵輪椅人走出家門、嘗試不可能挑戰的精神,第二屆「輪椅技巧障礙挑戰賽」甚至還受到國際輪椅人的矚目,來自馬來西亞、香港等團隊組隊共12位輪椅人跨海前來參加,即將藉由活動展開無礙外交。
今周刊 ・ 12 小時前
NVIDIA親兒子也救不了! CoreWeave成AI修正代表作
AI基礎建設投資持續升溫的背景下,市場情緒卻悄悄出現變化。資金依然湧向AI,但投資人開始重新評估哪些企業真正能在這場競賽中活下來。擁有強勁資產負債表與穩定現金流的大型科技公司股價再創新高,反之,高負債、尚未獲利、靠題材拉動股價的企業,正面臨更嚴格的審視。近期暴跌的CoreWeave(CRWV-US)便成為這波AI修正潮的指標案例。
理財周刊 ・ 14 小時前
赴美留學免托福!教育部攜手美國4所名校試辦,修EMI全英課程可讀頂尖高校…創非英語母語國家首例
教育部17日舉辦「大專校院學生雙語化學習計畫」記者會,宣布啟動「EMI 免試托福試辦計畫」。未來學生在臺灣修習一定比例的全英語授課(EMI)課程後,申請至合作美國大學就學,即可豁免托福成績,使臺灣成為全球第一個非英語母語國家獲美國頂尖大學正式採認EMI修課成果的國家。 此突破打破美國大學過往僅對英語系國家或新加坡提供豁免的慣例,象徵臺灣EMI教學品質與雙語教育推動五年的成果已獲國際信任,對提升臺灣高教的能見度與國際連結具有重大意義。
今周刊 ・ 12 小時前
台幣後續怎麼走?中信金高麗雪:年底前在30元上下震盪,中長期仍偏升值趨勢
近日因為台美匯率聯合聲明、《經濟學人》雜誌指出台灣出現「台灣病」等議題,讓新台幣走勢再度成為市場熱議話題。由於匯率走勢對金控業與壽險業來說,是相當重要的影響因素,在週一(11/17)舉行的中信金法說會上,中信金控總經理高麗雪分享集團內的看法表示,預估年底前新台幣將在30元上下震盪,惟中長期仍偏升值趨勢。
今周刊 ・ 12 小時前
生成式AI年會策展人李慕約 拆解企業導入AI三大關卡
「AI 本質上就是電腦 2.0!」在百億 CEO 班的 AI 系列彩蛋課程中,講師李慕約分享企業導入 AI 的實務案例時,特別引用了簡立峰老師的這句話作為破題,引導大家重新理解 AI 的角色與影響力。他接著解釋,電腦1.0其實只是「計算機」,有了AI,才真正稱得上有「腦」。今天我們在微軟辦公軟體上完...
商業周刊 ・ 14 小時前
Anthropic最新報告:史上首次!中國以 AI 發動的大規模網路間諜攻擊曝光
Anthropic指出,中國支持的駭客透過Claude AI 完成自動化高達 80%–90% 的網路攻擊。
數位時代 ・ 17 小時前
景氣不可只看台積電、漲幅集中特定類股不會變!資深投資人的年末提醒
行情的確已步入大幅震盪階段,市場上對AI是否泡沫化的疑慮愈發高調,加上聯準會的降息看法出現分歧。 AI類股或龍頭股的漲幅過大,而漲多就是最大的利空,其餘因素多半只是附帶反應。市場遲早須面對過度龐大的獲利回吐賣壓。猶如堰塞湖,若能提前釋放水量反而是好事。 從近期大型避險基金與主動式基金揭露的持倉變化來...
商業周刊 ・ 16 小時前
鴻海科技日揭AI藍圖!台廠加入AI永動機行列? 輝達公布最強財報,人工智慧還能飆多高?|今周重磅
鴻海科技日本周五登場,此前,鴻海董事長劉揚偉預告,將會在當天公開與OpenAI的合作細節。近期,許多AI巨頭如輝達、AMD、甲骨文,都紛紛以現金投資或提供股權的方式,與OpenAI換取長期合作,形同「AI永動機」。台廠是否會加入此行列,頗受關注。 此外,AI晶片大廠輝達本周公布上季財報,在Blackwell全面放量,眾家CSP業者紛紛調高資本支出,是否代表輝達將再繳出「歷史最強財報」,驚艷投資人? 1、鴻海科技日揭AI藍圖,如何攜手OpenAI? 2、輝達公布最強財報,Blackwell晶片全面放量 3、我國外銷訂單拚連9紅
今周刊 ・ 21 小時前
錼創、沛爾生醫、愛爾達今起可當沖!創新板獨角獸tibit正式登場,加速推動資本市場變身亞洲那斯達克
臺灣證券交易所於週一(11/17)舉辦「創新板3.0」發表會,董事長林修銘宣布創新板邁入新階段,並正式發表全新象徵角色──臺灣創新板獨角獸「tibit」。 林修銘表示,自2021年創新板成立以來,歷經四年努力,終於迎來「3.0時代」,象徵臺灣新創市場邁向國際的重要里程碑。
今周刊 ・ 21 小時前
輝達財報前 大盤狂殺摜破27000點!巨漢手握85億訂單 逆勢大漲8%
外電報導,從PayPal「教父」到加密行業幕後大玩家的億萬富翁投資人蒂爾(Peter Thiel)旗下Thiel Macro LLC在第三季大幅調整美股持股結構,最受矚目的是完全清倉AI晶片龍頭輝達(Nvidia),並猛砍特斯拉約76%持股,同時新建微軟與蘋果頭寸,整體美股持倉市值從約2.12億美元縮水至7,440萬美元,約減少三分之二,被解讀為對當前AI炒作熱潮投下「風險警示票」。
理財周刊 ・ 14 小時前
遞交投資意向書!輝達副總裁今拜會蔣萬安 相約農曆年前完成簽約
輝達海外總部終於出現重大進展,執行長黃仁勳今年5月宣布海外總部將落腳台北市的北投士林科技園區,歷經漫長的地點選址,終於落腳T17及T18。對此,台北市政府今天(11/18)指出,輝達公司全球不動產副總裁Scott Ekman一行人今天下午正式拜會台北市長蔣萬安,並代表黃仁勳親向市長遞交營運總部選定T17及T18用地之書面投資意向,象徵輝達落地台北的踏出關鍵一步。
太報 ・ 5 小時前因應美國關稅跨部會聯合說明會 台中登場
經濟部今(18)日於台中軟體園區舉辦「因應美國關稅我國出口供應鏈支持措施聯合說明會」,並由經濟部次長何晉滄出席致詞,本場次邀集經濟部、財政部、勞動部等單位共同說明各項支持方案措施,現場超過200位業者及公協會代表與會。經濟部表示,未來預計11至12月在台北、台南、宜蘭等地舉辦說明會。
中時財經即時 ・ 5 小時前
輝達拜會蔣萬安!拍板農曆年前簽約 雙方互贈禮
輝達台灣總部希望落腳北士科T17、T18,今(18)日輝達公司全球不動產副總裁拜會台北市長蔣萬安,並遞交投資意向書。畫面中是雙方這次會面互相贈送的禮物,左邊是北市府準備的「T17、T18土地權狀造型悠...
華視 ・ 5 小時前
台生材Q3營運大躍進! 高毛利耗材與新產品進入成長快車道
台生材(6649)參加櫃買市場舉辦業績發表會,第三季交出亮眼成績單,不僅單季營收較上一季翻倍成長,本業獲利更大增四倍,成功轉虧為盈。隨著第二代周邊血栓耗材開始放量、人工腦膜產品逐步進入更多醫院,加上新導絲產品預計明年起開始出貨,台生材已進入全新的成長周期。
理財周刊 ・ 8 小時前
輝達副總裁拜會北市府 遞交投資意向書「農曆年前完成簽約」
輝達公司(NVIDIA)執行長黃仁勳於今年5月Computex Taipei期間宣布,將在北士科設置海外企業總部,引起國內外產業界高度關注。輝達公司全球不動產副總裁Scott Ekman一行人今(18日)正式拜會台北市長蔣萬安,並代表黃仁勳遞交營運總部選定T17及T18用地之書面投資意向,象徵輝達落地台北的踏出關鍵一步。
鏡報 ・ 3 小時前黃仁勳也投資它!AI製藥新創Iambic 亞洲醫療科技創新論壇分享獨門技術
輝達創辦人黃仁勳日前宣布入股OpenAI,引發全球熱議,事實上,輝達投資AI發展遠不只在科技業,還進入醫藥領域。一家專注打造AI新藥研發平台的新創Iambic Therapeutics,就是被黃仁勳看好的標的之一。
中時財經即時 ・ 5 小時前
鄭麗君忙關稅談判 還有空參加新北營隊?藍粉專抓包蘇巧慧刪文
行政院副院長鄭麗君多次赴美處理關稅談判問題,不過卻被發現正在備戰新北市長的民進立委蘇巧慧,發布了鄭麗君明年1月將參加新北民主培力營活動,被藍青年粉專批評「有時間參加營隊,沒時間解決對美關稅?」蘇巧慧目前將該貼文移除。
中時新聞網 ・ 3 小時前
可寧衛*分割後市場不買單? 撿便宜關鍵在這裡
廢棄物處理大廠可寧衛*先前宣布將原本每股面額10元變更為一元,並於昨(17)日新股重新上市買賣,而今日股價不漲反跌,截至盤中下跌幅度達9.92%%,股價來到今日跌停價22.25元。
理財周刊 ・ 15 小時前
黃董又贏?記憶體供貨吃緊 SanDisk點名外包給力積電
力積電(6770)已非吳下阿蒙了嗎?黃董的秘密武器已經慢慢亮出!又是市場消息,美國大廠SanDisk在日前大幅調漲NAND報價逾五成後,正積極尋求外包產能,並點名與台廠力積電(6770)合作。消息指出,SanDisk將自備機台、進駐力積電銅鑼新廠,由力積電代工生產NAND晶片,最快於明年上半年正式啟動。
理財周刊 ・ 14 小時前
曾創千萬年營收!台灣知名服飾「NineTheory」宣布熄燈全館拍賣出清
歌手陳零九在今年五月因捲入「閃兵」事件而全面暫停演藝工作,他所投資經營多年的潮牌服飾無預警宣告將結束營運。歌手陳零九今年5月因「閃兵事件」個人形象與事業接連受到衝擊,演藝工作全面暫停。他近日無預警宣布,所投資經營多年的潮牌服飾將結束營運,並於社群發布感性聲明,表示品牌同步推出全館出清活動,所有庫存售
遠見雜誌 ・ 1 天前