中科院自动化所机器翻译技术获得重大突破 接近人工翻译水平

   日期:2005-09-08     来源:中华工控网    评论:0    
在刚刚结束的“国际口语翻译研究联盟(C-STAR III)”组织的国际机器翻译核心技术评测中,我所“网络内容管理与信息服务”团队提交的中-英翻译系统取得了BLEU得分0.528,NIST得分10.25的最好成绩。C-STAR是国际上最早从事口语翻译的国际性组织,这次中-英翻译评测吸引了包括美国IBM公司、CMU计算机系、日本ATR、德国亚琛大学、意大利ITC、日本NTT等12个著名研究机构参加。据研究,中文到英文人工翻译句子的BLEU得分一般在0.5~0.6,这说明我所翻译技术在评测应用场景下的翻译结果已经接近人工翻译的质量。这是团队不断进行战略方向研究和人才建设所取得的又一成果。
从2003年起,由高创中心和模式识别实验室相关人员组成的团队明确认识到目标凝练和队伍建设对于创新事业发展的决定作用。结合国家重大战略需求,深入研究本学科方向应用的新特点和趋势,以语音语言技术为核心,逐步确定了网络内容管理、媒体内容管理和通用领域机器翻译三大战略方向,并整合相关资源,完善团队建设。在机器翻译方面,适时地实现了从限定领域口语翻译向通用领域文本翻译的转变,提升了技术的完备性和可扩充性。同时团队把机器翻译作为团队国际合作和基础理论创新的重要窗口。这次参加评测的系统是团队集成了研究组多年的技术以及双语语料库的积累,抓住机器翻译理论发生重大转折的机遇,通过组织和引进优秀青年人才,在短短不到一年的时间里面取得的阶段性成果。同时团队还在机器翻译理论上积极创新,在近一年的时间里,论文 “An Approach to Automatic Acquisition of Translation Templates Based on Phrase Structure ExtractionAlignment” 被国际核心期刊 IEEE Transaction on SpeechAudio Processing 录用,论文 “Toward Practical Spoken Language Translation” 被国际机器翻译领域权威杂志 Machine Translation 录用,从而结束了我所自然语言处理研究只有高水平的技术和系统,没有国际一流学术期刊论文的历史。
目前团队还在加紧攻关,通过不断提高统计翻译技术的泛化性能提升系统的翻译性能。机器翻译技术通过与语音识别等技术的结合,可形成可靠的口语翻译装置和翻译服务,同时也必将进一步扩展网络内容管理的语种范畴。
 
  
  
  
  
 
更多>同类资讯
0相关评论
 
全年征稿 / 资讯合作
 
 
 
推荐资讯
可能喜欢