上个世纪九十年代,科学家们在进行气象地图分析、大物理仿真计算、基因图谱分析等基础科学研究时提出了“大数据”这个概念。进入21世纪,互联网、电子商务、移动互联网、社交网络、物联网等技术蓬勃发展,大数据成为这些新一代信息技术发展的必然产物。大数据具有数据量大、数据类型复杂、数据处理实时性要求高等特点,大数据分析在互联网和电子商务领域的广泛应用产生了巨大的商业价值,得到世界各国的高度重视。全球著名战略咨询公司麦肯锡认为,大数据是创新、竞争和生产力的下一个领域。
工业大数据也是一个全新的概念,从字面上理解,工业大数据是指在工业领域信息化应用中所产生的大数据。随着信息化与工业化的深度融合,信息技术渗透到了工业企业产业链的各个环节,条形码、二维码、RFID、工业传感器、工业自动控制系统、工业物联网、ERP、CAD/CAM/CAE/CAI等技术在工业企业中得到广泛应用,尤其是互联网、移动互联网、物联网等新一代信息技术在工业领域的应用,工业企业也进入了互联网工业的新的发展阶段,工业企业所拥有的数据也日益丰富。工业企业中生产线处于高速运转,由工业设备所产生、采集和处理的数据量远大于企业中计算机和人工产生的数据,从数据类型看也多是非结构化数据,生产线的高速运转则对数据的实时性要求也更高。因此,工业大数据应用所面临的问题和挑战并不比互联网行业的大数据应用少,某些情况下甚至更为复杂。
工业大数据应用将带来工业企业创新和变革的新时代。通过互联网、移动物联网等带来的低成本感知、高速移动连接、分布式计算和高级分析,信息技术和全球工业系统正在深入融合,给全球工业带来深刻的变革,创新企业的研发、生产、运营、营销和管理方式。这些创新不同行业的工业企业带来了更快的速度、更高的效率和更高的洞察力。工业大数据的典型应用包括产品创新、产品故障诊断与预测、工业生产线物联网分析、工业企业供应链优化和产品精准营销等各个方面。
首先看产品创新的应用。
客户与工业企业之间的交互和交易行为将产生大量数据,挖掘和分析这些客户动态数据,能够帮助客户参与到产品的需求分析和产品设计等创新活动中,为产品创新作出贡献。福特公司是这方面的表率,他们将大数据技术应用到了福特福克斯电动车的产品创新和优化中,这款车成为了一款名副其实的“大数据电动车”。第一代福特福克斯电动车在驾驶和停车时产生大量数据。在行驶中,司机持续地更新车辆的加速度、刹车、电池充电和位置信息。这对于司机很有用,但数据也传回福特工程师那里,以了解客户的驾驶习惯,包括如何、何时以及何处充电。即使车辆处于静止状态,它也会持续将车辆胎压和电池系统的数据传送给最近的智能电话。这种以客户为中心的大数据应用场景具有多方面的好处,因为大数据实现了宝贵的新型产品创新和协作方式。司机获得有用的最新信息,而位于底特律的工程师汇总关于驾驶行为的信息,以了解客户,制订产品改进计划,并实施新产品创新。而且,电力公司和其他第三方供应商也可以分析数百万英里的驾驶数据,以决定在何处建立新的充电站,以及如何防止脆弱的电网超负荷运转。
第二个典型应用是产品故障诊断与预测,这可以被用于产品售后服务与产品改进。
无所不在的传感器、互联网技术的引入使得产品故障实时诊断变为现实,大数据应用、建模与仿真技术则使得预测动态性成为可能。在马航MH370失联客机搜寻过程中,波音公司获取的发动机运转数据对于确定飞机的失联路径起到了关键作用。我们就拿波音公司飞机系统作为案例,看看大数据应用在产品故障诊断中如何发挥作用。在波音的飞机上,发动机、燃油系统、液压和电力系统等数以百计的变量组成了在航状态,这些数据不到几微秒就被测量和发送一次。以波音737为例,发动机在飞行中每30分钟就能产生10TB数据。这些数据不仅仅是未来某个时间点能够分析的工程遥测数据,而且还促进了实时自适应控制、燃油使用、零件故障预测和飞行员通报,能有效实现故障诊断和预测。再看一个通用电气(GE)的例子,位于美国亚特兰大的GE能源监测和诊断(M&D)中心,收集全球50多个国家上千台GE燃气轮机的数据,每天就能为客户收集10G的数据,通过分析来自系统内的传感器振动和温度信号的恒定大数据流,这些大数据分析将为GE公司对燃气轮机故障诊断和预警提供支撑。风力涡轮机制造商Vestas也通过对天气数据及期涡轮仪表数据进行交叉分析,从而对风力涡轮机布局进行改善,由此增加了风力涡轮机的电力输出水平并延长了服务寿命。
第三个典型应用是工业物联网生产线的大数据应用。
现代化工业制造生产线安装有数以千计的小型传感器,来探测温度、压力、热能、振动和噪声。因为每隔几秒就收集一次数据,利用这些数据可以实现很多形式的分析,包括设备诊断、用电量分析、能耗分析、质量事故分析(包括违反生产规定、零部件故障)等。首先,在生产工艺改进方面,在生产过程中使用这些大数据,就能分析整个生产流程,了解每个环节是如何执行的。一旦有某个流程偏离了标准工艺,就会产生一个报警信号,能更快速地发现错误或者瓶颈所在,也就能更容易解决问题。利用大数据技术,还可以对工业产品的生产过程建立虚拟模型,仿真并优化生产流程,当所有流程和绩效数据都能在系统中重建时,这种透明度将有助于制造商改进其生产流程。再如,在能耗分析方面,在设备生产过程中利用传感器集中监控所有的生产流程,能够发现能耗的异常或峰值情形,由此便可在生产过程中优化能源的消耗,对所有流程进行分析将会大大降低能耗。
第四个典型应用是工业供应链的分析和优化。
当前,大数据分析已经是很多电子商务企业提升供应链竞争力的重要手段。例如,电子商务企业京东商城,通过大数据提前分析和预测各地商品需求量,从而提高配送和仓储的效能,保证了次日货到的客户体验。RFID等产品电子标识技术、物联网技术以及移动互联网技术能帮助工业企业获得完整的产品供应链的大数据,利用这些数据进行分析,将带来仓储、配送、销售效率的大幅提升和成本的大幅下降。以海尔公司为例,海尔公司供应链体系很完善,它以市场链为纽带,以订单信息流为中心,带动物流和资金流的运动,整合全球供应链资源和全球用户资源。在海尔供应链的各个环节,客户数据、企业内部数据、供应商数据被汇总到供应链体系中,通过供应链上的大数据采集和分析,海尔公司能够持续进行供应链改进和优化,保证了海尔对客户的敏捷响应。美国较大的OEM供应商超过千家,为制造企业提供超过1万种不同的产品,每家厂商都依靠市场预测和其他不同的变量,如销售数据、市场信息、展会、新闻、竞争对手的数据,甚至天气预报等来销售自己的产品。利用销售数据、产品的传感器数据和出自供应商数据库的数据,工业制造企业便可准确地预测全球不同区域的需求。由于可以跟踪库存和销售价格,可以在价格下跌时买进,所以制造企业便可节约大量的成本。如果再利用产品中传感器所产生的数据,知道产品出了什么故障,哪里需要配件,他们还可以预测何处以及何时需要零件。这将会极大地减少库存,优化供应链。
工业大数据应用的价值潜力巨大。但是,实现这些价值还有很多工作要做。一个是大数据意识建立的问题。过去,也有这些大数据,但由于没有大数据的意识,数据分析手段也不足,很多实时数据被丢弃或束之高阁,大量数据的潜在价值被埋没。还有一个重要问题是数据孤岛的问题。很多工业企业的数据分布于企业中的各个孤岛中,特别是在大型跨国公司内,要想在整个企业内提取这些数据相当困难。因此,工业大数据应用一个重要议题是集成应用。
2013年9月5日,工业和信息化部正式发布《信息化和工业化深度融合专项行动计划(2013~2018年)》,在其中的互联网与工业融合创新行动中明确提出要促进工业大数据集成应用。随着互联网与工业融合创新,工业大数据集成应用将成为工业互联网应用的核心。据了解,专项行动计划把工业大数据集成应用分为三个层面,分别对应骨干企业大数据应用、中小企业大数据应用和行业大数据应用。一是,对骨干企业具备条件建设大数据应用系统,行动计划支持和鼓励典型行业骨干企业在工业生产经营过程中应用大数据技术,提升生产制造、供应链管理、产品营销及服务等环节的智能决策水平和经营效率。这是突出大数据技术自主应用,对骨干企业内外部数据进行分析。二是,支持建设第三方大数据平台建设,面向中小制造企业提供精准营销、互联网金融等生产性服务。这是突出大数据的第三方专业化商业服务,为中小企业提供工业大数据云服务。三是,推动大数据在工业行业管理和经济运行中的应用,形成行业大数据平台,促进信息共享和数据开放,实现产品、市场和经济运行的动态监控、预测预警,提高行业管理、决策与服务水平。这是政府参与的行业大数据云平台建设,服务行业指导和科学决策。
从技术层面看,工业大数据集成应用将基于Hadoop的分布式计算平台、内存计算平台和实时的流计算平台来整合搭建。工业物联网中存在多种传感器,存在多种通讯协议和数据格式,各种工业数据的采集和解析将比其他行业更为复杂,要求工业大数据采集总线具有更好的集成性。工业数据处理要求从实时、准实时到离线,Hadoop平台解决的是大数据离线批处理计算的需求,内存计算解决的是大数据准实时迭代分析的需求,流计算平台解决的是生产线实时数据分析的需求。工业大数据的数据挖掘与可视化也要符合工业生产的具体要求,建立工业生产领域的优化、运筹、决策分析模型。工业大数据的安全事关生产质量和安全生产,数据分析的准确性显得更为重要。
总之,无论从应用和技术角度看,工业大数据集成应用将成为两化深度融合的重点任务,成为建立互联网工业和智慧工业的基石。