WAXAL:非洲語言語音技術的大規模開放資源
WAXAL:非洲語言語音技術的大規模開放資源
2026 年 3 月 6 日
Google Research 資深產品經理 Tavonga Siyavora 與專案經理 Abdoulaye Diack
WAXAL 為非洲語音技術提供了關鍵的開放獲取基礎。WAXAL 包含 27 種本土語言的大規模 ASR(自動語音辨識)和 TTS(文字轉語音)數據語料庫,並採用高度寬鬆的授權協議,賦予非洲 AI 生態系統建立強大語音系統的能力,以更好地反映該地區獨特的語言多樣性。
快速連結
語音驅動技術(如虛擬助理和自動轉錄)改變了我們與電腦互動的方式。然而,這些技術的益處不成比例地向少數高資源語言傾斜。這種鴻溝導致數億人——特別是在擁有 2,000 多種不同語言的撒哈拉以南非洲地區——無法使用母語獲取必要的技術。幾年前,Google Research 團隊開始致力於協助解決這個問題。
觀看影片
Youtube 影片連結
為了應對這一關鍵需求,我們推出了 WAXAL:一個大規模、開放獲取的語音數據集,初步涵蓋了撒哈拉以南非洲地區 27 種語言,這些語言在 26 個以上的國家擁有超過 1 億名使用者。WAXAL 自 2021 年起與非洲學術界和社群組織合作,經過多年努力開發而成,提供了建立強大語音系統所需的高質量、寬鬆授權數據。作為一個基礎性的里程碑,此次初始發布包含約 1,846 小時用於自動語音辨識 (ASR) 的轉錄自然語音,以及超過 565 小時用於文字轉語音 (TTS) 的高保真錄音。我們以創用 CC 授權 (CC-BY-4.0) 發布這些資源,旨在催化研究並實現針對非洲大陸獨特語言特徵量身定制的包容性語音技術。我們希望 WAXAL 集合能不斷演進和擴展,納入更多語言,作為我們彌合數位鴻溝持續努力的一部分。
WAXAL 介紹
透過解決超過 1 億使用者面臨的關鍵數據稀缺問題,WAXAL 旨在賦能區域 AI 研究生態系統。為了支持強大語音技術的開發,該語料庫整合了兩個專門的數據集,旨在全面覆蓋語音辨識和合成任務。
來自 Google Open Images 的示例,用作引導 ASR 數據集產生自然語音的提示。
迦納大學的 TTS 錄音室。
WAXAL 語料庫同時關注非腳本 ASR 數據和高保真 TTS 音訊,旨在支持全雙工對話系統的開發。具體而言,ASR 部分有助於對現實場景中典型的多樣化、自發性語音輸入進行建模,而高質量的 TTS 部分則提供了生成清晰、自然輸出所需的乾淨參考數據。下表列出了數據集中目前包含的 27 種語言:
目前 WAXAL 數據集的細分,顯示了首批 27 種撒哈拉以南非洲語言以及每種語言 ASR 和 TTS 數據的可用性。
植根於非洲 AI 生態系統
WAXAL 專案的關鍵在於我們致力於與非洲 AI 生態系統合作並直接對其做出貢獻。數據收集工作完全由非洲學術和社群組織領導,並由 Google 專家指導世界級的數據收集實踐。這種協作方法確保了語料庫是由其服務的社群所建立,並為該社群所用;透過共享的方法論,每個合作夥伴專注於特定的語言子集。我們的合作夥伴包括馬凱雷雷大學(負責收集九種不同語言的 ASR 和/或 TTS 數據),以及迦納大學(專注於八種語言,使用上述 ASR 圖像提示數據收集方法)。其他關鍵合作夥伴包括 Digital Umuganda 與阿迪斯阿貝巴大學合作,他們在領導多種區域語言的 ASR 收集方面發揮了重要作用。對於高品質的錄音室錄音,Media Trust、Loud n Clear 和塞內加爾非洲數學科學研究所帶領了多種區域語言的 TTS 錄音工作。
這一框架從根本上植根於一個原則:我們的合作夥伴保留所收集數據的所有權,並共同承諾將所有數據集公開給更廣泛的社群使用。這種深度的協作和開放獲取理念已經促成了顯著的衍生研究和出版物。
結論與未來方向
WAXAL 代表了彌合數位鴻溝的一個重要里程碑,為 27 種撒哈拉以南非洲語言提供了高品質、開放獲取的語音資源。透過與非洲學術和社群組織的深度合作,這項倡議賦能了非洲大陸的 AI 生態系統並保護了語言多樣性。我們希望 WAXAL 能繼續作為非洲語言數位保存的重要資源,並成為未來創新的基礎。Google 仍致力於這項努力,並計劃持續擴展 WAXAL 數據集。
致謝
我們感謝馬凱雷雷大學、迦納大學、Digital Umuganda、阿迪斯阿貝巴大學、塞內加爾非洲數學科學研究所、Media Trust 以及 Loud and Clear Communications Ltd 的合作夥伴,感謝他們在縮小語言差距並為非洲大陸數百萬使用者建立更具包容性的數位未來方面所做出的重要貢獻。
快速連結
其他感興趣的文章
2026 年 3 月 6 日
2026 年 3 月 4 日
2026 年 2 月 17 日
