未来的人工速记这个工作恐怕要消失了,近日,在科大讯飞题为“A.I.复始,万物更新的2015年年度发布会上就出现了这一幕:在500多人的大型会场中,科大讯飞的语音识别技术直接将演讲者的语音同步转换成文字播放在大屏幕中显示,除了个别语速较快的字词和口语外,所有中文语音转换不论是速度还是准率都能达到了令人满意的效果。
成立于1999年的科大讯飞,从语音识别起家,近年来开始尝试切入新场景:包括智能客服、智能硬件和车载等。眼下,公司希望同时在“To C”和“To B”两个方向切入,找到面向企业级用户和个人消费者用户的平衡点。此次会议上,科大讯飞发布了三款新品,包括录音宝、录音笔和讯飞听见网。此外,公司还发布了集成双全工技术、麦克风阵列技术、声纹识别技术等技术服务在内的人工智能操作界面“AIUI”,该界面建设在全新语音交互技术基础上。同时,在在产品发布环节,科大讯飞董事长刘庆峰还定义了认知智能的三大核心支撑能力:人机交互、知识管理与推理学习
刘庆峰介绍,1956年的达特茅斯会议是人工智能研究的历史起点,至今正好是一个60年甲子。在这60年的发展过程中,伴随着计算机技术和民用科技突飞猛进的发展,人工智能研究本身经历了两次波峰与波谷,而从2006年起始至今愈发升温的人工智能热,是第三次人工智能浪潮,而60年甲子的当下,正处于人工智能爆发的前夜。在这第三次浪潮中,中国、美国和欧洲,不约而同地将人类大脑研究上升为国家战略科研高度。
刘庆峰表示,人工智能未来会像水和电一样无所不在。而在人工智能的三个层次——计算智能、感知智能和认知智能之中,前两者机器的能力已经超越人类,让机器实现认知智能是目前人工智能科研的焦点,这也是人区别于动物的最本质能力。而从人类自身的发展来看,产生认知智能的标志是语言的广泛使用。所以,在第三次人工智能浪潮中,世界上众多的科学家都不约而同地从“自然语言理解”这个研究方向上,寻找人工智能的突破口,亦即从语音与语言入手实现机器的认知革命。