Meta開源Omnilingual ASR語音基座模型,支援超過1600種語言、導入70億規模參數語音編碼器
Meta AI FAIR團隊稍早發表其在自動語音辨識 (ASR) 領域的最新重大成果:「Omnilingual ASR」。這是一套號稱能為超過1600種語言提供自動語音辨識能力的模型套件,其規模與品質均達業界新高。
Meta強調,此舉將透過一個通用的轉錄系統,解決ASR技術與資源過度集中在少數高資源語言的問題,讓高品質的語音轉文字技術能惠及代表性不足的語言社群,打破數位鴻溝。
導入70億規模參數wav2vec 2.0,同步開源模型與資料集
配合此次發表,Meta同步開源了一系列相關的關鍵資產 (均在Apache 2.0許可下發布),包含:
• Omnilingual ASR模型家族: 提供多種尺寸,從專為低功耗裝置設計的3億組參數的輕量級版本,到提供頂級精度的70億組參數模型。
• Omnilingual wav2vec 2.0 基礎模型: 一個擴展至70億組參數的大規模多語言語音表徵模型 (Speech Representation Model),可作為ASR之外其他語音任務的基座。
• Omnilingual ASR Corpus (語料庫): 一個大型資料集 (CC-BY 許可),包含了350種服務欠缺 (under-served) 語言的轉錄語音。
LLM-ASR架構達成最先進模型,78%語言錯誤率低於10%
為解決ASR擴展的技術瓶頸,Omnilingual ASR引入了兩種架構。首先,團隊將其wav2vec 2.0語音編碼器 (encoder) 首次擴展至70億組參數,從大量未轉錄的語音中生成豐富的多語言語義表徵。
接著,團隊建構了兩種解碼器 (decoder) 變體:一種是傳統的CTC (連接時序分類Connectionist Temporal Classification);另一種則是利用了 Transformer解碼器,稱為「LLM-ASR」。
根據Meta公布研究論文,採用LLM-ASR方法的70億組參數系統,在超過1600種語言上達到了最先進模型效能 (SOTA,State-of-the-Art),其中78%的語言其字符錯誤率 (CER) 低於10%。
導入「自帶語言」(Bring Your Own Language) 概念
此次Omnilingual ASR最大的突破之一,在於改變了新增語言的傳統範式 (paradigm),引入了「自帶語言」 (Bring Your Own Language)的概念。這得益於其受LLM啟發的系統,導入了強大的「上下文學習能力」 (in-context learning)。
實務上,這意味著使用一種目前不被支援語言的用戶,僅需提供少數幾個成對的音訊-文本樣本 (audio-text samples),AI 就能透過這些上下文範例,獲得可用的轉錄品質,而無需進行大規模的模型微調 (fine-tuning)、專業知識或高階運算資源。此舉被視為能讓「社群驅動」 (community-driven) 的語言擴展成為可能。
攜手在地夥伴,收集350種低資源語言
為覆蓋那些幾乎沒有數位足跡的語言,團隊除了整合公開資料集,也與在地組織合作 (例如Mozilla基金會的Common Voice、Lanfrica/NaijaVoices等),直接與當地社群協作,招募並補償母語者提供語音紀錄。
這部分委託收集的語料庫作為Omnilingual ASR Corpus發布,是目前針對超低資源 (ultra-low-resource) 自然語音ASR所組建的最大資料集之一。
目前,相關的模型、資料集、轉錄工具Demo與語言探索Demo,都已透過GitHub、Hugging Face與Meta AI網站等管道對外釋出。
更多Mashdigi.com報導:
西門子於新加坡首秀「Signaling X」地鐵解決方案,透過標準IT硬體運行列車控制、號稱節能30%
其他人也在看

館長遭3元老毀滅式爆料「逼員工上館嫂」 神隱20小時回應了
網紅「館長」陳之漢14日晚間,遭3名元老級員工「大師兄」李慶元、特助「小偉」、「總監」吳明鑒聯合毀滅式爆料,稱館嫂是館長介入別人感情搶來的,還邀請小偉來和他一起「3P」、抹黑威脅店家等指控。對此館長神隱20小時候本人回應,否認所有指控,更心疼老婆無故被牽連。
中時新聞網 ・ 1 天前
館長對決大師兄「過一天風向變了?」 鄉民揭他1敗筆:根本豬隊友
「館長」陳之漢近日遭元老級員工「大師兄」李慶元、高階主管小偉毀滅式爆料,稱館長曾要求小偉陪睡老婆館嫂,以及投資內幕等。一名網友表示,一開始不少人都在嘲笑館長,感覺對方聲勢應該會下跌,沒想到才過一天風向竟然180度轉變,好奇其中原因,掀起眾人熱議。
三立新聞網 setn.com ・ 19 小時前
《百萬小學堂》小西瓜長大了!近照曝光變正妹中醫師 網驚呼:門診要爆了
「選我!選我!選我!選我!」綜藝節目《百萬小學堂》昔日人氣「小學生智囊團」成員小西瓜(廖書嫺),在節目播畢後一路專注課業,如今已經是林口長庚中醫師。她的近照今(16日)曝光,網友看了驚呼「門診要爆了」!
鏡週刊Mirror Media ・ 19 小時前跌到被熔斷、臨床二期未達標 安成生技股價暴跌逾六成 宣告今日暫停交易
興櫃公司安成生技(6610)16日召開重大訊息說明會,曝現仍在開發中、用於治療中樞神經疾病含產後憂鬱症(postpartum depression, PPD)及重度憂鬱症(MDD)的新藥NORA520之美國第二期臨床試驗,取得主要療效指標之統計數據,然因給藥組與安慰劑組之間的差異並未達到統計學顯著意義,致臨床二期未達標,利空飛來,引爆安成生技跌勢,跌幅一度放大至逾六成,因跌幅太重,一度觸發暫停交易機制。
中時財經即時 ・ 2 小時前
館長遭兄弟「毀滅式爆料」!8大惡行全曝光 專家傻眼:到底做人多差?
館長(陳之漢)昨(14)日被昔日戰友、成吉思汗健身俱樂部元老級員工「大師兄」李慶元與高階主管小偉開直播「毀滅式爆料」,李慶元公布錄音檔稱館長不僅介入人家感情,還要求小偉傳私密照,暗示要「三人行」。對此,科技專家許美華表示,其實在正常情況下,兄弟圈是講求江湖道義的,好奇「館長做人是做到多差?對待兄弟是有多不夠意思?昔日跟他稱兄道弟的哥們才會這樣出來爆料?」
三立新聞網 setn.com ・ 1 天前
收入不輸台積電上班!3男吃住家裡 老父開一條件、賺錢全得上繳「國庫」
三個兒子踏入社會前,他就建議及要求他們將每月薪水,除了生活開銷外全數繳入「國庫」(由母親代為儲蓄)。因為孩子住家裡、吃家裡,這樣的強制儲蓄是為未來打下基礎。直到他們結婚,他就會兌現承諾:本利歸還,並加贈房子當新房。
三立新聞網 setn.com ・ 1 天前
獨家/「不想再被勒索」 館長首曝3員工最高「月領45萬元」
網紅館長陳之漢,被前員工指控收受大陸資金與性醜聞,今天(16),館長也接受《TVBS》獨家訪問。他嚴正駁斥,並強調自己之所以主動爆料,就是因為「大師兄」等前員工,不斷用勒索的方式,跟他借錢,還爆料「大師兄」財務狀況不佳,這個月才跟他借款100萬元,還不願在借據上簽名。
TVBS新聞網 ・ 15 小時前
男子獨居山洞逾20年!他拒絕現代生活「無電無網」 靠訪客接濟與雨水生存
畫面中可見,山洞內堆滿了他從村莊購得的日常用品,以及許多用於儲水的瓶罐,但完全沒有水電與網路設施,整體環境簡陋。根據《INews Jatim》報導,這起事件因一段TikTok帳號@doraemonjowo05上傳的影片曝光而受到關注。影片拍攝者表示,他們攀登將近兩小時山路,才抵達蘇達爾...
CTWANT ・ 13 小時前
義大利披薩老闆公審台人!驚動市長出面 同團網紅曝現況:升格外交等級
台灣旅行團近日在義大利用餐時遭披薩店老闆拍片公審,表示16人只點5份披薩、3杯啤酒,更以「中國人」、「日本人」戲謔,一群不知情的台灣遊客被羞辱,還一起對著鏡頭比讚合照。同團裡有一名網紅部落客透露,導遊事前已說明原因,也老闆同意少點餐。該團還在義大利遊玩,現況曝光。
三立新聞網 setn.com ・ 5 小時前
台灣人注意!醫勸「市場超夯3種魚」別吃了 曝1關鍵:恐加速失智、罹癌
台灣四面環海,海鮮「尚青」又肥美好吃,成為不少家庭和外食族的心頭好。不過小心別亂吃太多,尤其不少飲食含有重金屬,會讓身體受損。有醫師警告,台灣人喜歡的3種魚「鮪魚、鯊魚肉、旗魚」等深海魚類因為重金屬成分含量高,需要盡量避免,否則可能會加速失智,還會增加罹癌風險!
三立新聞網 setn.com ・ 1 天前
館長遭爆「逼員工拍鳥照」滿足館嫂慾望! 律師:恐面臨5年刑罰
[FTNN新聞網]娛樂中心/綜合報導網紅館長近來爭議不斷,昔日元老級員工「大師兄」李慶元與高階主管小偉昨(14)日開直播爆料,指控館長因性功能不佳,逼迫小...
FTNN新聞網 ・ 1 天前
大氣系雞排之亂!2自稱「原PO」道歉、「老爸」要發小禮物
近日「鳳凰」颱風來襲時,北市有位自稱「台大大氣系學生」的男子,匿名上網發文,表示若北市沒放2天颱風假,就要發雞排跟珍奶,結果大批民眾昨(16日)撲個空,昨天下午開始共有2位自稱原po的網友貼文道歉,被質疑也是假的。
中天新聞網 ・ 1 小時前
棒球》日本強化試合傳捷報! 日本武士隊11比4力退強敵韓國
2025日本武士強化試合今天(15日)在東京巨蛋熱烈開打,日本隊中繼投手森浦大輔雖遭到韓國連續2支全壘打的重擊,讓對手先馳得點,但有著打線全場12支安打、海灌11分的援護,最終日本隊以11比4取得強化試合的首場勝利。
Yahoo奇摩運動 ・ 1 天前
明天出關先亮燈!記憶體爆單會燒到2026?「這大廠」奔漲停檔不住又炸破2萬張
[FTNN新聞網]記者蕭廷芬/綜合報導受惠AI與記憶體題材持續加溫,華邦電(2344)股價持續狂飆,在4日被打入處置股,預計將在明天解除禁閉。今(17)日一開盤就...
FTNN新聞網 ・ 58 分鐘前
每天都在餵養癌細胞?避開「4種毒」可降50%罹癌風險
台灣每2人就有1人一生中會罹癌,每3人中有1人因癌症過世。腫瘤科醫師廖繼鼎強調,防癌關鍵不在於亂補,而是避開癌細胞最喜愛的4種養分:糖毒、油毒、氧化毒與腸毒,如此可降低一半罹癌風險。
中天新聞網 ・ 39 分鐘前
館長遭毀滅式爆料「不只小偉館嫂」!她揪這段對話驚:國安局應介入調查
網紅館長陳之漢14日被元老級員工「大師兄」李慶元「毀滅式爆料」,除了特助小偉與館嫂一事外,爆料中館長還被質疑收受中國資金,根據曝光的對話紀錄,館長坦言此前「誤判情勢」,並計畫前往中國尋找機會。對此,媒體人吳靜怡就直言,館長事件分成私人和可能涉及國安反滲透法的問題,呼籲「國安局應該要啟動介入關心」。
三立新聞網 setn.com ・ 1 天前
以為普通感冒!大叔發燒送醫「雙眼化膿」失明 醫示警:1個月已5例
綜合陸媒報導,55歲的陳叔(化名)來自茂名,身體一向良好,沒有慢性疾病,上月出現喉嚨痛、發燒,以為是普通感冒,自行服用退燒藥,未及時就醫。豈料病情急轉直下,他開始氣促、意識模糊,後被診斷為化膿性腦膜炎,於10月4日轉入深圳三院ICU,入院時已昏迷,完全依賴呼吸機...
CTWANT ・ 16 小時前
強冷空氣南下「雲街」現蹤!北台灣率先轉濕冷 低溫下探16℃
各地天氣轉涼了!天氣風險分析師林孝儒表示,今起一波東北季風正逐漸南下增強,北台灣率先感受到天氣轉濕轉涼;同時前氣象署長鄭明典也分享衛星雲圖上已出現代表冷空氣南下的「雲街」跡象,顯示冷空氣影響正逐步擴大。
三立新聞網 setn.com ・ 2 小時前
中風不是突然發生!「5大前兆」身體早就警告你 醫:這些症狀出現1分鐘都不能等
很多人以為中風是「說來就來」的事,但其實身體早就偷偷發出警告。只要你懂得觀察,就能提早預防、避免遺憾。 中風常見5大前兆 1、臉歪嘴斜:表情忽然不對稱,一邊臉垮下來2、單側無力:一隻手或腳沒力、舉不起來或感覺怪怪的3、說話含糊:講話變慢、咬字不清楚、甚至講不出話4、視力模糊:一邊眼睛看不清楚,或突然出現視線黑影5、頭暈嘔吐:突如其來的劇烈頭痛、暈眩或噁心感 ▲如果你或家人出現這些症狀,不要再等!馬上送醫才是關鍵。 日常這樣做 中風風險自然降 中醫體系醫療長周宗翰醫師指出,中醫預防中風,重點在「養氣活血、穩定血流」。這幾點,記下來照做最實在: 1、早睡早起、避開熬夜:睡不好=血管壓力大,容易血液黏稠2、定時喝水,不要等口渴:尤其是早上起床與睡前2小時,要補充水分幫助血液流動3、多按太陽穴、風池穴、合谷穴:放鬆頭頸壓力、幫助循環穩定 4、煮湯放點天麻+山藥:天麻可助腦部循環,山藥養脾胃、護血管彈性5、壓力大就用拳頭按摩耳上方筋膜:筋膜放鬆,腦壓就不會一直處在臨界點 (記者吳珮均、圖片來源:Dreamstime/典匠影像)延伸閱讀: ·醫警告:「起床後這4個動作」恐害你中風與心梗! 排便最好
常春月刊 ・ 1 天前
艾蜜莉布朗回憶19歲首次試鏡「被嚇壞」坦言人生因《穿著Prada的惡魔》而改變!
全球影迷引頸期盼的《穿著Prada的惡魔2》終於在相隔近20年後正式宣布推出續集,讓粉絲激動不已。片中飾演關鍵角色「艾蜜莉」的艾蜜莉布朗(Emily Blunt)近日接受《Elle》雜誌專訪時,也難掩興奮之情,直呼重返這部作品讓她格外感動,因為這部電影徹底改變了她的人生。訪談中更罕見回憶起19歲首次試鏡的慘烈經驗,坦言當年真的被導演的「特殊情境」嚇壞!
Yahoo奇摩電影戲劇編輯部 ・ 12 小時前