仿佛一夜之间,人工智能(AI)就在各个领域“安营扎寨”。从手机助手到下棋机器人,从自动驾驶汽车到工业机器人,从医生助理到家庭生活服务助手等等,我们正进入一个新的AI时代。
人工智能时代的来临给创新带来什么样的变革?我们应该如何来进行创新?如何避免AI带来的“机器误导”?哪些是AI领域的难点?日前记者采访了微软亚洲研究院副院长张益肇博士。
AI和“隐形革命”
“说说看,你最喜欢的技术是什么?在你每天的工作和娱乐中都要用到的,并且在你生活中几乎不可或缺的技术是什么?如果你认真地思考一下,很多你最心怡的技术没准已经不再是由塑料、金属和玻璃制成的实体了。”张益肇引用同事Allison Linn的话开场。
人们最心怡的技术已经从手中握着的实体变成赖以生存的、无处不在的隐形服务。张益肇说,我们正进入一个“隐形革命”时代。当感应器越来越便宜,即使你感受不到它的存在,它也可以收集大量数据,并通过分析了解很多信息,提供如影随形的服务。很多创新我们感受到的不是机器的“物理”变化,而是机器的“智能”变化。比如,对于一个骑自行车的人,它会提示你何时有可能发生意外,并杜绝意外的发生;再如,一个居住在北京的市民很容易知道几天之后是不是会有雾霾,几公里之外有没有污染源;又如,一个医生需要学习几年的医学知识,它可能只需要几分钟就能读完,并给出你诊疗建议;再比如,一个盲人,它能够告诉你周边路况,应该如何通过马路。
张益肇认为,下一代开天辟地、改变生活的技术创新,一定会远远超越键盘、屏幕、手机、相机、手表等硬件的范畴,而是更多地从云中获得计算能力——成千上万的计算机在云系统内运转,让律师很容易找到案件的问题所在,让科学家能够预测下一次致命疾病的爆发、甚至田间农作物的收成。
在张益肇看来,“隐形革命”依赖于机器学习等人工智能技术,随着计算机掌握的数据越来越多,它能够把事情做得越来越好。隐形革命有三个关键支撑:算法、数据和计算能力。AI并不是今天才存在,之所以能够在今天这样的节点迅速兴起,开始渗透到各个领域,有几个重要的因素。
一方面,机器学习的技术越来越成熟。作为机器学习的新领域,深度学习的进展来自于计算能力的提高。虽然基础算法没有巨大改变,但是由于结构过于复杂,以前的计算能力无法对神经网络进行训练;而最新的系统可以计算出更加复杂的深度神经网络。比如,用深度学习做计算机视觉训练,从原来二十几层左右已经可以做到一百五十二层,甚至在微软亚洲研究院内部已经开始了上千层的学习和训练。
另一方面,除了机器学习的算法和基础设备越做越强之外,更重要的是数据源越来越丰富和多元化,从而可以做更多分析。过去研究人员要进行分析,寻找数据源需要大量的时间,有很多的障碍,现在数据已经越来越丰富。
好的体验需要软硬结合
在采访张益肇之前,记者还了解到很多微软正在研发的“黑科技”,包括“全息瞬移”(Holoportation)、“触前传感”(Pre-TouchSensing)等,这些前沿技术能够让人们在虚拟与现实之间来回“穿越”,无需触碰屏幕,手指手势就可以实现人机交互。
一方面,微软在强调创新变得越来越“隐形”,更多是借助云计算、数据、算法的能力进行相对“后台”、“后端”服务的创新;另一方面又在进行大量传感器、全息系统等这些相对“前端”的研发。这透露着什么样的信息?
“事实上,我们今天的感知系统还远远没有达到精准描述和再现这个世界的程度。”张益肇说,从数据收集和感知维度上看,我们现在依然缺乏很多维度的“触角”,而往往感受世界的视角不同决定和影响了我们对世界的判断。正因为如此,微软会投入大量的精力来进行“前端”传感的研究,包括前面提及的“全息瞬移”、“触前传感”等。好的体验需要“软件和硬件”紧密结合,专注于传感技术的传感器公司可能无法涵盖广泛的体验,这就需要我们彼此的深入合作。而且作为一个提供平台的公司,微软很想把人工智能的技术以平台的方式让更多人使用。如果我们不做全息眼镜Holo Lens,我们的平台就很难更好地理解前端的变化。
张益肇拉开袖口露出手环说:“我这个手环上有超过10个感应器,包括GPS(定位)、加速器(感知动作)、陀螺仪(Gyroscope,感知更加细微的动作)、皮肤电反应(GSR,GalvaNIc Skin Response,感应皮肤湿度)、温度计、蓝牙等,通过收集我的数据与云上数据、模型算法的分析判断,远远胜过医生在见面五分钟内对我的了解。”我们希望以后可以将这些信息规范化,为医生提供参考,与医院进行配合。目前微软已经在和美国一家很大的医院进行合作,研究如何把云上的智能和医生、护士相配合,帮助他们更好地维护病人的健康。
目前许多业界巨头包括IBM、微软、谷歌等都加大了对AI的推动力度。微软去年宣布了“微软牛津计划”,后升级为“微软认知服务”,开放其AI技术平台,开发者们就算没有人工智能的知识背景也能轻松开发出属于自己的智能应用。这套认知服务包括视觉、语音、语言、知识和搜索五大类共二十一项API。有了这些API之后,开发者不需要自己再花很多时间去开发这个技术,直接用几行CODe就可以调用技术并生成App。张益肇说:“我们不可能想出世界上所有应用场景的可能性,所以最好的办法就是把它平台化,做成服务,希望大家给我们更多的反馈。”
智能手环
未来的世界是AI+HI
业内正积极推动AI技术发展、扫清应用障碍。张益肇认为,数据的来源依然是很大的难题,无论是数据质量还是数据数量以及收集数据的成本,都面临很多挑战。以手写体的识别为例,需要去找很多人提供白板上的图片,才可以慢慢学习每个人的笔迹,相对简单但工作量很大。而医疗数据因为涉及个人隐私,进行数据共享和开放也面临一定的难度。尽管已经有很多对数据进行匿名和保护的技术,但是开放数据更多的挑战还在于观念和管理层面。
从AI应用推动的角度来看,张益肇认为,AI的应用非常广泛,涵盖了各种不同的领域。在中国其实有很多的机会,比如目前中国在医疗健康、辅助功能等领域就有很大的AI需求。他举了“Seeing AI”项目研究的例子,这个项目可以通过计算机视觉技术将图像转换成文字描述,再将文字转化成语音,就可以帮助盲人“看”世界。此外,张益肇基于自己正在做的医疗研究的AI应用表示,在中国有很多胃癌患者,一方面是治疗需求比较大,另一方面数据也比较多,所以通过AI技术可以推动这个领域的研究。
另外,能源利用和环境保护也对AI有很大的需求。目前中国是世界第一的能源使用大国。如何有效减碳、增进能源使用率越来越重要,因为中国城市化很快,尤其是个人的住宅,能源的使用很难控制,经常造成能源浪费,用智能判断的方法来进行楼宇的能源控制、住宅的隔热与温控等,都能大幅提高效率。
此外,空气污染也是一大挑战。微软创投加速器最近孵化的一家公司专门做远距离的感应器,通过无人机的方式来感应污染、监测煤气泄露等。过去煤气公司探测煤气泄漏,需要派人到现场,通过感应器感应哪一户的厨房在漏气,很危险。现在用无人机的方式就变得更安全,也更高效。
当人工智能的应用越来越普遍,人们的决策越来越依赖机器智慧,一旦机器预测发生错误,是否会将人类带到更大的“灾难深渊”?
在张益肇看来,人工智能犯错与人也会犯错误一样,人类通常避免犯错误的方法是多人合作来降低错误的几率。例如美国的太空梭,他们的做法是同时有三个完全独立的电脑做判断,理想状况是三台电脑做出一模一样的决定;如果没有三个相同的决定,就选择两个投票的决定。因为这三台电脑的算法都是由不同的团队开发的,相对而言同时出错的几率就比较小,在未来也可以用这个方法降低AI应用的错误率。未来人工智能将通过“AI”和“HI”(人类智能)结合、搭配,彼此取长补短来更好地发挥AI的作用,就像《星际大战》里小机器人主要做辅助和繁琐的事情,但最终决定还是由人来决策一样。以后AI发展应该往这个方向来做。