媒體聚焦 來源:中國經營網日期:2017-08-15瀏覽次數:9885
當大數據對企業決策的重要性日益突顯,當經濟一體化、技術全球化越來越深入,如何打通跨語言體系,在全球的框架下進行決策就顯得格外重要。
換句話說,百度、Google提供了搜索平臺,但如何克服語言障礙,將散落一地的信息以更加清晰的結構化形式呈現出來,這其中蘊含著巨大的市場機會。
作為中國對外翻譯有限公司控股子公司, 中譯語通科技(北京)有限公司(以下簡稱中譯語通)抓住了這一機會。在7月29日舉辦的“幻化·中譯語通2017戰略發布會”上,展示了中譯語通獨特的大數據驅動下的AI美學,并發布了基于譯見大數據技術生態的多款新應用和最新技術成果。“未來,中譯語通將依托龐大的技術體系,構建大數據生態,在神經網絡機器翻譯、多語言自然語言理解、語義搜索等最新技術成果的基礎上,為各領域提供專業、精準、定制化的大數據服務。” 中譯語通CEO于洋表示。
構建跨語言大數據生態
在于洋看來,過去的五年,是中譯語通 “不循規蹈矩”成長的五年。從最初不著邊際的“黑腦洞”到其變為現實,中譯語通將“數據地圖”到“數據心電圖”再到“技術生命曲線”做成了一幅幅清晰直觀的數據圖譜,實現了大數據驅動下的智能化直觀應用工具。
目前,在跨語言大數據領域,中譯語通已經擁有了大數據挖掘、治理、分析、呈現等多方面的成果,形成了成熟的大數據技術生態。以面向海外發布的金融大數據平臺JOVEBIRD為例,該平臺通過內置百種數據模型及算法和獨特的跨語言文本分析算法,對金融數據進行智能化分析,并以“數據心電圖”的形式清晰的呈現分析結果。目前,JOVEBIRD預測的數據曲線與上市公司股價變化的擬合度準確率超過了65%,這對于金融領域而言,無疑將帶來巨大的研判價值。
于洋介紹說:“這一切,是基于龐大的、高質量的語言數據,也基于我們在語言科技、語言生態當中的積累。”中譯語通擁有每天全球海量的結構化與非結構化數據解析,加上傳統語言服務的積淀,使得中譯語通在語言大數據的積累方面有著得天獨厚的優勢,體量之大讓人難以想象。
打造大數據技術生態主引擎
中譯語通大數據生態的構建,離不開龐大的技術體系。近幾年,中譯語通加大了對機器翻譯和大數據方面的研發投入,并且取得了許多重大的技術研究成果。
從2014年起,中譯語通投入機器翻譯研發,并陸續打造出系列場景應用工具,繼而形成了今天完善的機器翻譯生態。如今中譯語通機器翻譯日訪問量已超過1.5億次,相當于每天的翻譯超過30億字。公開信息顯示,由最新第三方機構對谷歌、微軟、百度和中譯語通四家目前市場上規模化商用的機器翻譯的中文-英文雙方向(應用規模最大的語言方向)進行的機器評測與人工評測的最終結果顯示:中譯語通在兩個語言方向上的綜合得分名列第一,超過谷歌、微軟和百度,并在垂直領域的機器翻譯引擎擁有優勢。
中譯語通CTO程國艮告訴記者,中譯語通的譯見大數據平臺解構后包括挖掘平臺、治理平臺、分析平臺、數據平臺、管理平臺、數據地圖等6大子系統,覆蓋大數據分析的全生命周期,為各個行業提供“一站式”大數據解決方案,通過對海量數據進行深度挖掘,實現對數據價值的喚醒。
目前,基于譯見大數據技術生態,中譯語通發布了Insider DI 、Insider BUZZ 、Insider LITE三款面向不同用戶需求的大數據應用,為各行業提供全面且個性化的大數據應用服務。
大數據平臺作為譯見大數據技術生態的核心,將為各行業打造更加智能的大數據平臺,突破無監督學習、綜合深度推理等數據算法、分析難點問題,建立數據驅動、以自然語言理解為核心的認知計算模型,形成從大數據到知識、從知識到決策的能力升級。大數據發展的未來,必定是開放與共融的,這也同樣是中譯語通將其龐大復雜的技術體系高度集成,以技術成果的形式開放給全行業的初衷。