半导体产业应如何在大数据中淘金?

   日期:2017-08-14     来源:EEFOCUS    评论:0    
核心提示:形形色色设备产生的数据量时刻不停地飞速增长,如何利用每天产生的天文数字量级数据,成为科技业面临的一道难题。

形形色色设备产生的数据量时刻不停地飞速增长,如何利用每天产生的天文数字量级数据,成为科技业面临的一道难题。

根据思科的数据,全球互联网吞吐量在2016年为1.2ZB(1ZB相当于10亿TB或1万亿GB),预计到2021年将增长到3.3ZB每年。汹涌上涨的数据洪流,波峰越来越高,在2016年,每天数据流量同比增长了32%,而流量最高的1小时数据吞吐量同比增长了51%。

数据源于思科

当上述统计也不完整,实际上没有人知道全球每天产生多少数据,因为并不是所有设备的数据都会连入互联网。

数据量本身意义不大,如何量化数据的价值才是关键所在,但在如何应用数据,以实现其价值方面,当前还没有行之有效的方法。

想挖掘数据的真正价值,就要对天量数字与模拟数据进行过滤,并充分考虑应用场景,这就像沙里淘金,大多数可能无功而返。不过,随着计算力的提高以及大规模并行计算工具的成熟,数据过滤分析--即找到更好的应用数据方法--已经能够创造出颇具市场前景的商业模式。

“众多行业人士指出,不同数据应用方法与其器件和商业模式相互关联,并对其商业、市场以及商业模式产生影响,”Synopsys董事长兼共同CEO Aart de Geus说道,“如果你能够从中找到捷径,提升效率,或者全新的商业模式,那就会是非常大的影响。 ”这也意味着高利润的可能,“你会看到,所有从事数据处理的人都在仔细聆听,以解码市场未来需求,或者自行判断当前市场需求,”de Geus继续说道,“或者更进一步,他们准备置身于数据通路之中,从而最靠近数据商业化的中心。”

这正是资本疯狂涌入的原因,从数据挖掘到云端服务,从机器学习到工业物联网,每一个数据应用场景都战况激烈。

“谁拥有数据,具备数据分析及处理能力,谁就能把所有钱都赚走,”西门子Mentor事业部总裁兼CEO Wally Rhines这样表示。

现在还难说数据应用是一个胜者通吃的游戏,不过确实有不少科技巨头在这个领域跑马圈地,奋勇争先,例如亚马逊、谷歌、微软、Facebook和IBM等掰着手指头就可以输出来的大家伙。

“收集上来的物联网数据中,包含了设备大量的性能、行为及应用数据,”IBM美洲区销售主管Christophe Begue说道,“我们接下来会把收集到的数据丢给Watson(IBM人工智能平台)去分析。”

现在的大问题是如何将这些数据变现,有哪些人愿意为数据付费。要将数据变现,首先要做到如下几点:第一,行业里的公司要真正懂数据的价值;其次,公司要能够快速应对数据变化,只要比别人快百分之一秒,券商就能够以此牟利,但现在大公司应对数据变化的反应时间通常是几天甚至几周;第三,变现数据的价格要有竞争力,不能波动太大。

IBM正准备将全球供应链的数据商业化。“供应链数据分为两层,”Begue说道,“第一层是零售与快速消费品(CPG)等数据,就是那些可能会影响到食品与饮料等销售的数据。你可以在附近的一个商店收集天气、交通或运动赛事等相关信息,并通过交通模式追踪它。我们用Metro Pulse平台来做数据分析,该平台会覆盖500个数据元素,用户既可以购买数据用于深度学习或机器学习分析,也可以全部委托IBM来做分析。第二层即我们正在导入市场的概念:供应商风险。IBM将天气与政局变化等诸多因素纳入考虑,从数据中分析供应链的安全程度,并根据分析结果来提升供应链的安全。如果注意到15个因素有风险,那么你就会对这15个因素严密监控。”

IBM的服务并不是值分析已有数据,还会给出建议,洞见未来。“我们收集公开与半公开数据,有些数据只在IBM内部使用,我们建立预测模型。当然,我们也意识到,在计划和反应之间,仍然存在差距,‘决策室’概念有助于缩小计划和行动之间的鸿沟。”

智能制造

并不只外部收集的数据才有用,工业生产中,内部产生的数据就很有价值。事实上,整个智能制造的概念(德国称为工业4.0,也有人称之为工业互联网)就是如何把内部数据利用好。

“一言以蔽之,工业物联网是为了提升生产效率,”Optimal+市场副总裁David Park说,“现在这些公司都偏爱流程分析和无库存生产,但它们真正需要的是预测性分析。预测性分析可以让工厂受益,不过受益最多的是品牌商,品牌商和工厂可不一定是一回事。”

风险在于,数据不一定都是正确的。基于错误数据而做出的决定,将导致结果难以预期。

“如果数据没问题,那么可以把良率提高2%到3%,非常显著的提高,”Park说道,“供应链上通过检测的任何元器件的所有时间段数据都会被收集。当你拿到一些有划痕的晶圆,根据数据就能查出在哪一个环节晶圆被划破,你也可以查看元器件在现场的老化过程。如果汽车配备了预测性维护服务,那么你就能看到汽车在路上的相关数据。金融业同样会受益,如果你手上有数十万张发票,靠人工是捋不清发票之间的相互关系的。”

这种数据分析对于复杂供应链特别重要,半导体制造本身在数据分析与应用上先进,但整个半导体供应链对数据的应用,并不都能达到制造环节的水平。

“有效利用数据是智能制造顾问委员会(隶属于SEMI)的一大主题,”SEMI协作技术平台副总裁Tom Salmon说道,“获取数据很重要,但现在问题不是我们获取的数据量不够,而是因为数据利用率只有10%左右。真正的挑战在于我们应该问什么样的问题,如何把数据应用于制造。所以可能会有可靠性问题,但不会有制程问题。”

机器学习

找到关键数据,在预设参数下利用机器对数据规律进行外推,这就是机器学习的基础。这种方法已经应用于汽车自动驾驶领域,机器学习系统将辅助并最终取代人类去驾驶汽车,自动驾驶系统做决策时,需要根据行驶场景给出多种预案。

在半导体设计与制造中,也会利用机器学习来提高质量、可靠性及良率。

“采用合适的比例来抽取数据做分析,就能应用于未来的设计,”eSilicon市场副总裁Mike Gianfagna说道,“如何将机器学习算法应用于新领域是关键,在过去7年中,我们在这方面积累了很多经验,我们知道如何挖掘开发数据的价值。当你拥有大量数据时,怎么去抽取分析这些数据?如果抽取数据比例太高,你会迷失在大量数据中,如果抽取数据比例过低,又可能得不出结论。”

Gianfagna表示,在降低风险与增加效率的基础上,实现数据变现是机器学习的目标。“要做到这一点,你需要从全局上来看待大数据分析。”

与很多由大云端服务商提供服务的大数据分析相比,半导体设计和测试行业产生的数据量很少,不过半导体设计与测试数据可能更复杂。

“当前主要任务是收集数据,”NI解决方案市场总监George Zafiropoulos说道,“下一阶段的目标是通过数据分析来给出改进方法。无须刻意寻找,你就能发现数据中的价值吗?你要找的,是数据的趋势和相关性,可以将机器学习应用于任何环节。如果软件提示,本周四产线产出较低,为什么会产出低?或者特定温度与特定电压对产品性能的影响。(这些都可以用数据分析来指导)”

Zafiropoulos指出,可以将更好的芯片设计作为目标。“作为工程师,我们围绕设计来制定规则,但如果你想面面俱到,那么效率就不会高。如果在保证可靠性与性能基础上,可以减少保护规则,那将会有很大价值。很多大数据分析都是针对多个数据采集点,一座城市可能有一万个传感器,每天产生大量数据,而亚马逊的订单更是数不胜数。半导体数据比个人能处理的数据显然要多,但也远达不到亚马逊交易数据这个量级。”

然而,系统数据可能就比设计数据高几个数量级了,特别是涉及多物理层仿真时。“我们认为,7纳米将是首次导入机器学习和大数据分析的节点,数据量将会膨胀,处理速度也需要增加。” ANSYS总经理兼副总裁John Lee说道,“你需要做同步热分析。热效应影响系统的可靠性,但如果数据量增大到当前技术无法解决,那么就要引入新的方法,所以我们需要大数据技术。最新的GPU有210亿个晶体管,而且可应用于汽车,但这种规模的芯片发热量巨大,(如果散热设计不好),发热时会增加对电路板的压力,并可能导致板子弯曲,但要知道,车用芯片使用寿命长达十年。”

总结

大数据分析在半导体产业应用还处于中段(发展期)。一方面,为提高芯片的性能、效率和可靠性,半导体产业的数据量在增长,数据分析任务在增加;另一方面,半导体产业也在发展各种技术,以充分挖掘数据用途。

这为产业带来了新的增长机会。Cadence 总裁兼CEO 陈立武表示,2015年全球联网汽车市场规模为240亿美元,到2020年,将发展到370亿美元,与之相应,深度学习市场规模2020年将达100亿美元(2015年为6亿美元),云和数据中心市场规模将达800亿美元(2015年650亿美元)。“这将给半导体产业带来机会,”他说道,“从优化物联网到云端,都将给半导体带来很大的机会。”

现在的问题是,围绕这些数据还能做些什么,以及到底如何去实现。这将是半导体产业的一个全新机会,也许会推动半导体产业发展登上一个新台阶。

 
  
  
  
  
 
更多>同类资讯
0相关评论
 
全年征稿 / 资讯合作
 
 
 
推荐资讯
可能喜欢