Paza: Introducing automatic speech recognition benchmarks and models for low resource languages
Microsoft Research
Microsoft Research unveils Paza, a human-centered speech pipeline, and PazaBench, the first leaderboard for low-resource languages. It covers 39 African languages and 52 models and is tested with communities in real settings. The post Paza: Introducing automatic speech recognition benchmarks and models for low resource languages appeared first on Microsoft Research .
首創的 ASR 排行榜,從非洲語言開始: PazaBench 是首個針對低資源語言的自動語音辨識(ASR)排行榜。首發涵蓋 39 種非洲語言與 51 個尖端模型,追蹤領先的公共與社群數據集中的三項關鍵指標。
以人為本的 Paza ASR 模型: 這些微調後的 ASR 模型僅需極少數據,並與農民合作在日常行動裝置上進行現實世界測試,涵蓋六種肯亞語言:斯瓦希里語(Swahili)、多盧羅語(Dholuo)、卡倫金語(Kalenjin)、吉庫尤語(Kikuyu)、馬賽語(Maasai)和索馬利亞語(Somali)。
根據 2025 年 ,全球約有六分之一的人使用過生成式 AI 產品。然而,對於數十億人來說,語音互動的承諾仍未實現,儘管 AI 正變得日益多語言化,一個關鍵問題依然存在:這些模型是否真的適用於所有語言以及依賴這些語言的人們? 這是我們在 中首次面臨的挑戰——這是微軟研究院與 的一項合作,非洲和印度的現場團隊專注於為農民構建可用的 AI 工具。
Gecko 揭示了語音系統在現實、低資源環境中失效的頻率——在這些環境中,許多語言無法被辨識,非西方口音也經常被誤解。然而,語音仍是全球主要的溝通媒介。對於肯亞、非洲及其他地區的社群而言,這種不匹配造成了連鎖挑戰:如果沒有代表其語言和文化的基礎數據,創新就會停滯,數位與 AI 鴻溝也會隨之擴大。
除了構建具成本效益且適應性強的 AI 系統外,Project Gecko 廣泛的實地工作凸顯了一個重要教訓:在低資源環境中構建可用的語音模型不僅是數據問題,也是設計與評估問題。 為了讓 AI 系統發揮作用,它們必須支援當地語言,支援透過語音、文字和影片進行免持互動,並以符合現實環境的格式提供資訊,即在低頻寬行動裝置、嘈雜環境以及不同識字水平的情況下皆可使用。
圖 8:基礎模型與微調後的 Paza 模型在六種語言中的詞錯誤率 (WER) 比較。較低的 WER 表示轉錄性能較好。
我們將走向何方
AI 正在重塑世界的溝通方式。與人共同設計,而不僅僅是為人設計,意味著要關注那些尚未得到良好服務的語言。我們計劃將 PazaBench 擴展到非洲語言之外,並在全球更多低資源語言中評估尖端 ASR 模型。Paza ASR 模型只是初步的一步;要真正支持小型和代表性不足的語言,需要專門的數據集、強大的在地合作夥伴關係和嚴格的評估。有意義的進展取決於與使用這些語言的社群進行持續合作,而負責任的擴張意味著優先考慮深度和品質,而非廣泛但淺薄的覆蓋。
隨著我們繼續這項工作,我們正將我們的方法提煉成即將發布的指南手冊,以幫助更廣泛的生態系統策劃數據集、負責任地進行微調,並在現實條件下評估模型。我們不會止步於語音——額外的指南手冊將指導團隊為多語言、多文化背景構建 AI 工具和應用程式,並為他們提供在不同社群部署的實務建議。
這些指南基於技術進步和社群驅動的設計,共同分享我們的經驗,幫助研究人員、工程師和設計師構建更多以人為本的 AI 系統。
致謝
以下研究人員在工作中發揮了不可或缺的作用:Najeeb Abdulhamid, Felermino Ali, Liz Ankrah, Kevin Chege, Ogbemi Ekwejunor-Etchie, Ignatius Ezeani, Tanuja Ganu, Antonis Krasakis, Mercy Kwambai, Samuel Maina, Muchai Mercy, Danlami Mohammed, Nick Mumero, Martin Mwiti, Stephanie Nyairo, Millicent Ochieng 與 Jacki O’Neill。
我們要感謝 團隊——Rikin Gandhi, Alex Mwaura, Jacqueline Wang’ombe, Kevin Mugambi, Lorraine Nyambura, Juan Pablo, Nereah Okanga, Ramaskanda R.S, Vineet Singh, Nafhtari Wanjiku, Kista Ogot, Samuel Owinya 以及肯亞 Nyeri 和 Nandi 的社群評估員——感謝他們對這項工作的寶貴貢獻。