媒體聚焦 來源:鈦媒體日期:2017-12-28瀏覽次數:9935

國際口語機器翻譯評測比賽(International Workshop on Spoken Language Translation,簡稱IWSLT)是國際上最具影響力的口語機器翻譯評測比賽,每年舉辦一次,至今已經舉辦了14 屆。
在今年12月15號結束的2017 年IWSLT 大賽中,首次參賽的一家中國公司——中譯語通科技股份有限公司(以下簡稱中譯語通),取得了16 個語言方向平均分第一名的成績。而此前,科大訊飛曾經在2014 年獲得中英和英中兩個語言方向第一。

賽后接受媒體采訪時,中譯語通CEO于洋說:“我們的技術能力是領先的、更是全面的。在跨語言及多語言翻譯層面,大賽比拼了在限定數據范圍內英、德、意、荷、羅馬尼亞五個語種,共20 個語言方向互譯。同時還比較了在缺少德語與荷蘭語以及意大利語與羅馬尼亞語雙語平行語料的情況下翻譯引擎對該四個語言方向解碼的效果。在除去沒有平行雙語語料的其他16個語言方向中,我們取得了平均分第一名的好成績,并且這個成績甚至超過了使用全部20個語言方向的小數據集和更大數據集的所有參賽隊伍在該16 個語言方向的平均得分。”
2017 年IWSLT 大賽吸引了世界各地多所機器翻譯領域的知名大學及研究所參加,包括英國愛丁堡大學(University of Edinburgh)、意大利Bruno Kessler 基金會(FBK)、德國卡爾斯魯厄理工學院(KIT)、日本京都大學(Kyoto University)、德國萊茵-威斯特法倫理工大學(RWTH)、薩爾大學以及德國人工智能德國研究中心(UDSDFK)等。
本次比賽的訓練集和評測集都是主辦方提供的,所有參賽團隊在相同的數據基礎上比拼技術,同時技術難度較往年也有較大提升,打破了以往一個模型解析1 個語言對的規則,需要用一個模型解析5個語種,20個語言方向。

口語機器翻譯評測結果
公開資料顯示,中譯語通成立于2013 年,是全球領先的大數據和人工智能企業。以“語言連接世界,數據驅動未來”為目標,中譯語通自主研發了覆蓋機器翻譯、語音識別、圖像識別、語義搜索、知識圖譜、大數據分析、大數據可視化等領域的先進技術,構建起“譯云”語言科技生態與“譯見”大數據生態。
自2013年至2016 年三年間,中譯語通在機器翻譯和大數據研發方面投入很大,機器翻譯研發累計投入已經超過2億元,在大數據分析方面每年投入研發資金超過1 億元。目前,中譯語通的神經網絡機器翻譯已經實現了37個語種的翻譯,約1332 個語言方向,建立了50 億+句對超大規模平行語料庫。其中中俄、中韓、中西、中葡等十余個語言的機器翻譯已經達到世界領先水平,并且在該領域已經實現規模化的垂直領域機器翻譯的場景化應用。