创新工场CEO李开复7月16日在2016硅谷高科技创新·创业峰会上表示,创新工场正对人工智能进行非常大的布局,到今天已经投资了接近1亿美金,接近25家公司。
他谈到,人工智能之所以强大的原因在于,“今天人类做的大部分工作是重复性的,是基于一个有限的领域的,是基于可以客观思考甚至穷举的。这些工作在未来的十年都会被人工智能取代。”
同时,李开复列举了十个有可能在未来十年被机器人取代的职业:包括翻译、记者、助理、保安、司机、销售、客服、交易员、会计、保姆,他认为,这些职业中的90%的从业者将会被机器人取代。
李开复表示,在这些领域里,人工智能不是模仿人类,也不仅仅是取代人类,所谓的人工智能就是用特别巨大的数据集看到一个人一生,甚至一百个人一生,也不能看到那么多的数据,然后用数据推算出逻辑、判断和推测,来做比人好的判断。
以下是创新工场CEO李开复演讲实录:
我们今天管理大约12亿美金的基金,投了接近300个项目,包括好几家独角兽。但是今天我想特别讲的是我们投资的一个专门的方向和趋势。
创新工场的特色是做技术型的投资。我们自认为最专长的是看到一个趋势的崛起,并对这个趋势做深度的分析,而且非常早期的布局。
比如说在2009年我们对移动互联网的投资,在2011年左右我们对娱乐内容的投资,而我们今天正在对人工智能做一个非常大的布局。到今天已经投资了接近1亿美金,接近了25家公司。
我们今天想分享一下为什么我们会特别的看重这个领域?
最近人工智能得到全球关注主要是因为阿尔法狗击败了李世石。在很多的世界媒体上我们看到的,就是机器是否会取代人脑?我个人认为没有足够的科学根据,让我们想那么多,担心那么多。
而短期让我们更应该关注的是怎么用人工智能,我们的工具,我们的奴隶来为社会创造价值,来为创业者创造机会。
为什么人工智能会这么强大呢?就是因为今天人类做的大部分工作是重复性的,是基于一个有限的领域的,是基于可以客观思考甚至穷举的。这些工作在未来的十年都会被人工智能取代。
这些工作我这里列了一些,如果你们不太相信的话,我们可以举几个例子。今天美国的美联社90%的稿件已经是机器人取代了。
在过去的十年华尔街交易员已经一半下岗离职了。未来我们肯定会看到无人驾驶的车,当这一天来到的时候,世界上大约9%的人他们部分或者全部的工作就即将被取代。当然无人驾驶可能还需要十年的时间,但是十年不是很久。
怎么能做到呢?其实在这些领域里,人工智能不是模仿人类,也不仅仅是取代人类,所谓的人工智能就是用特别巨大的数据集看到一个人一生,甚至一百个人一生,也不能看到那么多的数据,然后用数个数据推算出逻辑、判断和推测,来做比人好的判断。阿尔法狗就是研究了几百万的棋谱和花无数小时的时间来打败人类专家的。
有人说这个公平,一个棋手不可能花一百万个小时研究棋谱。这不是公平不公平的问题,而是我们如何用人工智能做出人不能做的的。最近特斯拉出了一个问题,大家可以想想它有几亿小时在车的进行中,这些数据来难道不会做比人更好的司机吗?这一天还没有到,但是如果有一个司机做十亿小时的练习,哪怕他开始像个孩子,学完以后难道不会超过人类吗?
我们可以想像,如果有一个人脸识别的机器,它把全世界罪犯的脸都背下来了,有人能够做到这一点吗?所以从这个例子可以看到,我们不用丝毫的怀疑人工智能会全方面的超越人类。
但是这不是在所有的领域里,是在一些领域可以穷举的领域,或者可以客观分析的领域,或者有正确答案的领域,有大数据的领域,而且是有专家参与的领域,所以它会逐渐的发生,不会一次到位的发生。
我个人有幸在三十年前开始做人工智能,但是可惜的是当时数据不够,所以并没有做太多超越人类的事情。所以各方面我们可以看到对弈只是游戏的领域,它本身并不带来巨大的商业价值。
更多我们在业界会看到的可能是感知,就是用算法,人工智能来做判断或者反馈,这个时候机器就要动起来了。
我们可以看到过去七八年来有特别大的进步,这是为什么呢?这是因为在机器学习的领域有一套技术叫做深度学习。它是带来了巨大的变革,今天可能没有时间太解释这套算法。但是简单来说,就是过去人是需要一步一步地告诉电脑你该怎么走,该怎么做,之后人可能说我一步一步来教你可能会犯错,可能不全面,可能也不适合计算机的结构,更适合人脑的结构。
但是是不是就是人来说,就先对人脸找眼睛、找鼻子、找耳朵,但是这个大概是所谓的专家系统,就是人告诉机器一切,然后机器来计算,这个大概是三十年前的技术。
大概十五年前的技术是人落找特征,机器学参数。这里就是人告诉他识别人的时候找眼睛、嘴巴,然后你再来计算。这个有一个提升,这是人机结合的学习。
深度学习的技术应该算是最近五年推出的技术,这个技术几乎人都不参与了,特别神奇的地方,给看一亿张脸,你自己看,该学习眼睛、嘴巴,还是别的事情,也许法令纹更重要,也许耳朵的大小更重要。我们不要假设人比机器更重要,我就把大量数据给你,让你收取你认为重要的特征。
而且这些特征只有机器懂,人都听不懂的。这就是阿尔法狗战李达以后世石的时候,下出了人类顶尖棋手都没有办法看懂的步骤。这就是深度学习,它能自我学习,抽象的概念。
而且这个抽象概念超越了人类的想象,因为它用的数据集比人更大。它就像一个孩子,能够自我学习,而且数据量够大的时候,什么都学的会。所以这大概解释了什么是深度学习。
深度学习,这是一个识别物体的领域,而且是有人标注的数据库。我们可以看到大概仅仅在五年前,一个机器跟人的差别还是一个74%对94%的差别。如果算错误率的话,可能是六七倍的差别了,所以不太能够用到实际的场景里。但是每一年都在快速的进步着,我们可以看到在2014、2015年的时候已经超越人类,而且差距越来越大。
就是说当机器识别人脸,比人更厉害的时候,那些以识别人脸工作的人就要下岗了。同样的,识别也超过了人,语音识别超过了人,像客服,比如每天打电话卖房地产产品的人,以后打电话的不是人了,因为机器比人更听的懂。
所以当每个技术超越人的时候,它带来的机会是巨大的。所以我们要认为下一个阶段,未来的五年什么东西产生巨大的价值,可能有这些领域,当然这些领域包括了高科技,用麦克风,用摄像头等等的,这些会产生很大的价值。但是还有另外一个领域,就是如果一个领域有特别大的数据了,只是这个数据没做挖掘,没有产生价值。
比如说商业化的流程,比如说互联网的数据。所以今天谁最适合做大数据人工智能呢,其实就是BAT,在美国就是Google、微软和FB,因为他们已经有互联网大数据。这些怎么做到呢?
像百度搜索的十个结果,我一个都没有点,这暗示这十个都不好,但是这不是绝对的暗示,但是数据足够多,是可以充分的学习。其实这些BAT走在使用,滴滴、美团都在使用,只是在创业领域大家还没有足够的机会。
这个世界上还是Google做的最好,因为它有世界最大的数据集,它使世界上做人工智能做的最早,然后再加上Google多年累计了大浪的技术人才,还有特别快的机器。
所以为什么Google做出来阿尔法狗,而不是BAT,美团和小米。但是Google的野心不仅仅是阿尔法狗。前几年我们看到Google自我命名为Alphabet,是互联网的一家公司,它可能还有做医学的公司,可能还要做基因检测的公司,可能做汽车等等领域。
Google做智能产品的过程中发展了一套Google大脑。其实Google里有两套大脑,这个可以用到各个领域。发现这个大脑,其实才是它的最大价值。在其他的领域,只要有数据就可以启动。
所以Google拥有了巨大的数据量,它们启动了数十个不同的项目。在美国有一些机构,比如OpenAI,也担心,Google如果这么多数据,还有没有机会跟它竞争,它归不会人类知道的太多了。
我觉得这类的问题对Google,对FB,BAT,我们作为消费者和媒体都要担心他们。当然的最好的办法是让更多的人参与到这个领域来创业,这样就不会被某一个垄断了。
Google有这么大的野心,我们怎么知道是深度学习呢?这是Google用深度学习的数量,在过去的三年可以一看到深度学习的数量和应用的领域在大大提升。所以刚才讲的并不是空穴来风。
这么好的机会我们怎么捕捉这个机会呢?讲了这么多乐观的事情,我要稍微保守地告诉大家说,这并不是人人能做,做起来也不是很简单的。
第一,有些领域是要平台。
比如开发一个苹果APP,或者安卓的APP,使要有平台的。你只要是计算机程序员就可以学会开发一个安卓APP。但是你即便是一个优秀的程序员也没法儿用深度学习,因为这个还没有平台化,你还要知道进去很多微调的东西。这方面的专家可能只有几百个人,所以这样的人才很稀缺。
第二,需要海量的数据。
说一千万的数据就是大数据,其实那是小数据。真的要机器学习要用用武之地,要有更巨大的量。这些数据储存,还有存储量。我们都认为这个超越人了,可以倒过来解释给我们听,但是机器学习没有办法告诉你怎么决定的,你要相信就相信,按照结果说话,回来说怎么打赢李世石的,说不出来。
怎么做呢?买这个数据,标注这个数据,不要浪费钱,GPU可能比CPU好用。
第三,找专家,这样的专家真的不多。
Google已经开出九位数的代价挖这样的专家。这是我们过去不能够想象的,在国内我们也看到,比如说看到投资的Face++,最近也是努力挖到了华人在深度学习的研究员,这些人才的价值使特别巨大的,因为非常稀缺。
但是话说回来,这个稀缺也是未来两三年的现象,之后我觉得会有很多聪明人,尤其在中国会涌入这个领域。因为重赏之下必有勇夫。
最后,是学怎么调这些参数了。但是有这些东西还不够,深度学习说实在的还会有一些挑战,最后贴贴补补还不能完成你的应用该怎么办呢?就要用巧妙的,非技术的方法,就是不要取代人,而是辅助人就好了。
比如做安防的人,他不一定带着枪的机器人,他只要带着摄像头,拍出来的东西告诉人,这边动静,那边的窗子坏了,其实就够了,所以辅助人就够了。还有辅助医学,我们不是说取代医生,但是可以给医生做一些工具是完全可以的。第二,我们有容错的界面,其实搜索引擎就是容错的界面,界面设计的好也能弥补人工智能的不足。
第三,怎么用草船借箭的方法,从用户那边拿多数据。我没有数据,就像当年孔明没有箭就是借来的。所以不一定是要买或者数据在有些例子是可以创造的。
最后,我们不要解决最大的AI问题,而是我们是不是能局限于领域一领域和场景?比如为什么要全天候无人驾驶,为什么在可控的领域做好无人驾驶呢?
现在特斯拉的车,我们看到这次出车祸,就是它分不清巨大的卡车和天空的颜色。我们就找一个领域不会有巨大卡车出。而且阿尔法狗怕的是天黑、下大雪,我们就找一个不一样的场景。像在智能仓储里做一个插车机器人,这个仓库里灯光和环境是可控的,这里不会下雨和夏雪,不会有卡车出来。所以用一个聪明的局限领域来创造价值。
这是今天一张重要的PPT,但是我也能保证这张是有错的,因为没有人可以预测未来。我们相当看好大数据,尤其是刚才谈的金融领域,因为它有最大的黑盒,能够产生最大的效应,也能吸引最大的应用。在感知方面有一个误解,就是自然语言理解。就是听到语音了,变成字了,我就懂了。
因为人是很容易懂的。但是听,识别你讲的字,和懂你的意思还是有一个特别大的鸿沟。这点我觉得至少五年,甚至十年的时间才能突破。
人方面都想做家庭机器人,我们认可是有商业价值,能挣钱,省钱的,而不是家里有两条腿、两个手的人在家里跟你打打招呼的,这样是不能满足家庭期望值的,这个在日本可能是可以的,但是我不认为有一定的代表性。
这样的机器人好玩儿,可以做老人陪伴,可以做小孩的玩偶,但是就是这么多了。要期待它帮你炒菜、扫地,成为家庭主妇,或者家庭的新的一员或者新的电器,这个还是一个天方夜谭。当然你很聪明的把这个机器人做成了一个音响,或者做成了陪伴老人的小机器,像我们投资的小鱼在家,当然也是可以做的。
但是我们人所想象的机器人一定会先在商业领域出现,之后才会在家庭有希望。
最后关于无人驾驶,就是怎么样去应用我们的约束,让它在有些场景可以有用,先帮助人,人帮助它,最后才是无人,而是这还是在十年以后。
创新工场过去两三年在悄悄的耕耘这个领域,因为有些领域投资一对外公布,这个领域很快就被玩坏了,现在我们投资了20家公司,我们愿意和大家分享投资的两家公司,就是Face++,还有驾势科技,这两个项目应该在国际上达到了很高的知名度。
除此之外,我们还投了很多公司,像地平线机器人,它是硬件平台来打通这个领域,而且它会用大家电来做它的第一步的切入。
或者我们投的第四范式,它在银行和保险业做了非常大的突破。我们将在下个礼拜做非常大的发布会,让大家知道它做的事情,怎么改变了中国的金融领域。还有很多中国和美国的投资。
因为深度学习需要非常大的数据量。我们跟像富士康这样的公司有很深度的合作。所以这个领域我们是特别特别的看好,希望今天的演讲对大家有些启发。