語音識別、用人越声音機器翻譯等人工智能技術,工智構建了一套複雜而精確的术跨手語翻譯引擎,可實現由文字及音視頻內容到手語的障碍翻譯,再通過專門為手語優化研發的用人越声音自然動作引擎,進行虛擬形象的工智驅動。這些技術使得AI手語主播具備高可懂度的术跨手語表達能力和精準連貫的手語呈現效果。
◎記者華淩
令人翹首期盼的障碍2022年北京冬奧會即將舉行。在關注冬奧會的用人越声音人群中,有一個特殊的工智群體,他們雖然聽不到賽場的术跨聲音,但也希望能了解比賽動態,障碍渴望感受比賽的用人越声音激情。據統計,工智全球約有4.3億人患中度及以上程度的术跨聽力障礙,根據全國第二次殘疾人抽樣調查數據,中國約有聽障人士2780萬人。
“我們用技術跨越聲音的障礙。”11月24日,央視新聞聯合百度智能雲推出的央視總台首個AI手語主播正式亮相——她有著真人般的皮膚、頭發、眼睛,形象親切自然,氣質優雅獨特。從北京冬奧會開始,她將全年無休用AI智慧為聽障用戶提供手語服務,讓他們快捷的獲取比賽資訊。
可提供專業、準確的手語解說
據悉,9月24日,曾在2021中關村論壇上亮相的冬奧手語播報數字人係統是由北京市科委、北京市殘聯發起,科技冬奧專項支持,北京智譜AI、淩雲光與北京廣播電視台聯合打造。項目還得到了北京市殘聯聾人協會的大力支持。係統依托智譜AI打造的數據與知識雙輪驅動的智能平台,旨在實現冬奧會期間賽事新聞的實時手語翻譯播報。
而此次央視新聞與百度智能雲聯合打造的央視總台首個AI手語主播,從表情、口型、毛發、服飾身形五大維度打造3D高精超寫實的數字人AI模型,讓AI驅動的數字人表情則更加親切自然。
據介紹,百度智能雲采用語音識別、機器翻譯等人工智能技術,構建了一套複雜而精確的手語翻譯引擎,可實現由文字及音視頻內容到手語的翻譯,再通過專門為手語優化研發的自然動作引擎,進行虛擬形象的驅動。這些技術使得AI手語主播具備高可懂度的手語表達能力和精準連貫的手語呈現效果。
冬奧AI手語主播掌握的手語詞匯規範都來自《國家通用手語詞典》,經過長時間的智能學習,能夠為觀眾提供專業、準確的手語解說。
AI手語主播的工作空間或將更大
據介紹,百度智能雲的數字明星運營平台為AI手語主播提供了技術支持和服務。
目前,數字明星運營平台支持二次元、2D、3D高精多種數字人風格;同時,在內容生產維度支持真人驅動、AI驅動、融合驅動等多種直播方式;基於領先的跨模態技術,口型合成準確性達98.5%。
“隨著AI技術的更迭和進化,3D虛擬場景不斷拓展,冬奧AI手語主播的工作空間會更大。也許不久AI主播會走出演播室,在不同場景中更好地滿足新聞呈現多樣化的需求。”相關項目負責人表示。
這個冬奧會,也將通過冬奧AI手語主播,讓更多的殘障人士酣暢淋漓地感受冰雪運動的激情與榮耀。