继今年9月政治局常委集体学习,大数据作为前沿性课题引起我国最高决策层关注以来,工业界、学术界都迅速掀起一波研究和利用大数据的热潮。
近日,北京交通大学宣布加入百度开放研究计划,双方将在交通领域开展深度合作,借助“大数据智能”服务于我国轨道交通和综合交通的可持续发展。中国工程院院士邬贺铨、胡启恒、孙家广、李京文、沈昌祥,以及北京交通大学校长宁滨、百度副总裁朱光、王海峰等专家围绕交通领域的大数据创新进行了充分探讨。
据宁滨介绍,该校经过十年时间,搭建起轨道交通基础整合及信息服务平台,其交通数据库包含我国铁路运营的各类基础数据,以及城市轨道交通基础数据。下一步,将探索如何从基础数据库中挖据出有价值的信息,借助数据挖掘研究解决交通难题,这正与百度的业务优势和战略方向不谋而合。
抓住技术弯道赶超的机会
百度创始人李彦宏在向中央政治局常委集体汇报“大数据技术与战略”时指出,大数据将在“加快经济转型升级”和“带动社会管理创新”两方面发挥重要作用。而交通作为与社会民生关系密切的公共行业,遭遇的发展不均衡的状况亟待用大数据的全新思维和方式来提供科学的解决方案。
比如,如何在物联网收集海量数据的前提下,对高铁运行进行科学预警,做到维修养护合理化,既保证安全,又提高效率。再以城市交通为例,北京交通拥堵给民众工作生活造成负担,并且加剧空气质量恶化,如何明确城市拥堵机理,对交通状况改善进行整体设计,大数据挖掘都有望发挥重要作用。
共同目标和优势互补构成了百度与北京交通大学的合作基础。北京交通大学拥有官方交通数据,并在交通领域拥有较强的基础理论研究能力;百度作为大数据公司,则不仅通过LBS业务获得了海量用户交通数据,可以帮助完善城市交通数据,更是拥有极其雄厚的大数据技术实力,以及通过大数据挖掘提供服务的经验。邬贺铨院士认为,双方以交通为大数据合作的切入点,既有利于北京交大发挥专长,也利于百度行业实战,进入交通数据分析领域。
在交通大数据的获取来源上,除原有途径以和争取获得政府部门开放交通数据之外,邬贺铨和胡启恒两位院士都把切入点指向了手机。胡启恒院士指出,现在谈到挖掘大数据,多是以人为中心的数据。“我国手机保有量大,渗透率在全球范围内看都比较高,大城市的比例就更高了。通过将手机的位置信息和流量数据映射到人和车,可以实时掌握客流,给司机提供实时、动态的服务,便于随时调整路线,至少在大城市可以做一些试点。”胡启恒院士认为,“以人为中心,以手机为手段,挖掘大数据提供交通信息服务在我国非常有条件,就看用不用,能不能用好。”
大数据发展应紧密结合行业
大数据利用的方向是什么?孙家广院士指出,当前最重要的是应用方向。“数据究竟为谁服务?怎么增值?大数据一定要和行业紧密结合,才能产生价值。”
在孙家广看来,大数据是未来实实在在的发展方向,肯定不是泡沫。但成功的关键是要做到接地气。“从北京交大的专业特色来说,要把交通的路、车产生的数据跟应用紧密结合,就可以把信息变成智能,对中国经济社会产生价值。但究竟怎么做?百度已经有了一个大平台。”
此前百度正是基于自身积累的大数据,在一系列紧贴行业的尝试中尝到了甜头。比如,百度通过挖掘网民搜索大数据和用户自创内容,帮助汽车企业和保险企业设计更符合民众期望的新车型、新险种;百度还可以通过提前预测景区客流量,联动旅游局调配资源,甚至联合科研机构提前分析预测我国艾滋病流行情况,等等。事实证明,与行业紧密结合,成果更容易有效且直接地服务于公众和社会。而垂直行业如此众多,只要拥有数据,机会就是无穷的。
胡启恒院士提出,除了在交通领域,医疗也是大数据能发挥重要作用的领域之一,只要结合了历史信息和当下信息的数据量足够丰富,借助人工智能技术,完全可以研制出非常实用的诊所一级的机器医生,对病人进行初步诊断,以减轻大医院的就医压力。
李京文院士则认为,大数据对制造业、服务业也会有深远影响。他提出,粗放式发展的传统制造行业应该积极利用大数据来研究未来发展道路,发展新能源、新材料和新装备制造;而对于服务业,完全可以通过大数据发现新的市场需求,优化现有服务业,使其更加符合社会需求。
大数据人才培养的“百度模式”
发展大数据,归根到底,还是要依靠一大批自主创新人才。“将来大数据产业发展起来,如果都是外行在搞,一定搞不好。”李京文院士呼吁,教育部应该组织大学把产学研结合起来,注重大数据人才的培养。
在这方面,百度已经走在了前面。百度副总裁朱光分享了从学生阶段开始培养大数据人才的实践经验――最好是高校和企业结合起来,借助企业的力量培养。“高校有方法论,企业把拥有的大数据和课题开放出来给高校师生。结合优势,联合培养的效果比单纯依靠高校力量培养要显著得多。”
百度信奉,一定要找到最聪明的大脑,一起做最有价值的研究。除了将具有雄厚技术实力的高校纳入开放研究计划,共享百度技术和数据资源之外,百度多名高级技术专家还走进校园,亲临教学一线教授学生。百度副总裁、基础技术首席科学家王海峰担任北京大学语言信息工程系主任,百度大数据首席架构师林仕鼎也在北京航空航天大学担任大数据专业学术主任……百度的跨界培养机制迅速赢得了高校师生的普遍欢迎。
“百度这样的‘兼职’导师机制很好,学校可以通过人才与企业建立起很好的桥梁,了解很多现实需求,也能获得很多科研资源。”邬贺铨院士对这样的灵活机制表示肯定。“这样一来,企业也在高校建设了研究堡垒,合作研究而不是收归己有,多元的研究文化交流,创造性可能会更高。”胡启恒院士说。
百度加快占据大数据战略制高点
在大数据时代,百度自身的企业属性越来越明显表现出“大数据”的特征,其业务进展围绕大数据的实践也密集增多。
据百度大数据首席架构师林仕鼎介绍,拥有互联网大数据的百度已经成功建设起完全自主技术的大数据软硬件基础设施。在数据管理和处理方面,百度拥有业界领先的海量数据处理和挖掘技术,尤其是开展“深度学习”前沿技术研究以来,互联网大数据的挖掘利用更是步入了快车道。“百度将把数据进行存储、计算和加工,生成有价值的数据会反馈到各个应用和服务当中。”林仕鼎说。
邬贺铨院士认为,未来百度会从搜索引擎公司发展成为大数据服务企业。
“一方面,百度可以利用搜索以及各种方式获取大数据,服务于网民、社会和企业自身;另一方面,百度还可以提供大数据解决方案,帮助其他机构解决大数据问题,包括提供技术解决方案,甚至是挖掘分析、提供决策和支撑。这就需要百度考虑如何扩展大数据来源,并且进一步加强大数据技术研发。”
百度选择集聚顶尖的学术力量,共谋发展大数据。就在11月11日,中国互联网行业首个院士专家工作站在百度揭牌成立,明确宣布将围绕大数据、云计算等重点领域展开研究。百度正在投入战略级资源,加快占据大数据的战略制高点。
正如李京文院士所言,“与过去不同的是,工业社会最重要的资源是材料,现在最重要的资源是数据。谁掌握信息,谁就会赢得主动。”中国最具创新的力量正在通过自主研究合作,让大数据成为驱动发展的重要战略资源。