如何使用FPGA加速机器学习算法？

日期：2016-05-25

核心提示：当前，AI因为其CNN(卷积神经网络)算法出色的表现在图像识别领域占有举足轻重的地位。基本的CNN算法需要大量的计算和数据重用，非常适合使用FPGA来实现。上个月，Ralph Wittig(Xilinx CTO Office的卓越工程师) 在2016年OpenPower峰会上发表了约20分钟时长的演讲并讨论了包括清华大学在内的中国各大学研究CNN的一些成果。

当前，AI因为其CNN(卷积神经网络)算法出色的表现在图像识别领域占有举足轻重的地位。基本的CNN算法需要大量的计算和数据重用，非常适合使用FPGA来实现。上个月，Ralph Wittig(Xilinx CTO Office的卓越工程师) 在2016年OpenPower峰会上发表了约20分钟时长的演讲并讨论了包括清华大学在内的中国各大学研究CNN的一些成果。

在这项研究中出现了一些和CNN算法实现能耗相关的几个有趣的结论：

①限定使用片上Memory;

②使用更小的乘法器;

③进行定点匹配：相对于32位定点或浮点计算，将定点计算结果精度降为16位。如果使用动态量化，8位计算同样能够产生很好的结果。

在演讲中Wittig还提到了CNN相关的两款产品：CAPI-compatible Alpha DataADM-PCIE-8K5 PCIe加速卡和Auviz Systems提供的AuvizDNN(深度神经网络)开发库。

ADM-PCIE-8K5 PCIe加速卡

Alpha DataADM-PCIE-8K5 PCIe加速卡用于X86和IBM Power8/9数据中心和云服务，加速卡基于Xilinx Kintex UltraScale KU115 FPGA，支持Xilinx SDAcess基于OpenCL、C/C++的开发和基于Vivado HLx的HDL、HLS设计流程。

图1 Alpha DataADM-PCIE-8K5 PCIe加速卡

Alpha DataADM-PCIE-8K5 PCIe加速卡片上带32GB DDR4-2400内存(其中16GB含ECC)，双通道SFP+支持双通道10G以太网接入。提供包括高性能PCIe/DMA在内的板级支持包(BSP) 、OpenPOWER架构的CAPI、FPGA参考设计、即插即用的O/S驱动和成熟的API等设计资源。

AuvizDNN开发库

深度学习技术使用大量的已知数据来找出一组权重和偏置值来匹配预期结果。处理被称之为训练，训练的结果是大量的模型，这一事实促使工程师们寻求使用GPU之类的专用硬件来进行训练和分类计算。

随着未来数据量的巨幅增长，机器学习将会搬到云端完成。这样就急需一种既可以加速算法，又不会大规模增加功耗的处理平台，在这种情况下，FPGA开始登场。

随着一些列的先进开发环境投入使用，软件开发工程师将他们的设计在Xilinx FPGA上实现变得更加容易。Auviz Systems开发的AuvizDNN库为用户提供优化的函数接口，用户可以针对不同的应用创建自定义的CNN。这些函数可以方便的通过Xilinx SDAcess这样的集成开发环境调用。在创建对象和数据池后，就会调用函数创建每一个卷积层、然后是致密层，最后是 softmax层，如下图2所示。

图2 实现CNN的函数调用顺序

标签： FPGA 机器学习卷积神经网络 AI

12

更多>同类技术

全年征稿 / 资讯合作

2398080099

联系邮箱：

版权与免责声明

凡本网注明“来源：CK365测控网”的所有作品，均为北京新科时代传媒信息技术有限公司-CK365测控网合法拥有版权或有权使用的作品，未经本网授权不得转载、摘编或利用其它方式使用上述作品。已经本网授权使用作品的，应在授权范围内使用，并注明“来源：CK365测控网”。违反上述声明者，本网将追究其相关法律责任。
本网转载并注明自其它来源的作品，目的在于传递更多信息，并不代表本网赞同其观点或证实其内容的真实性，不承担此类作品侵权行为的直接责任及连带责任。其他媒体、网站或个人从本网转载时，必须保留本网注明的作品来源，并自负版权等法律责任。
如涉及作品内容、版权等问题，请在作品发表之日起一周内与本网联系，否则视为放弃相关权利。

推荐图文

湿气是对PCB电路为何最具破坏性	威达电自动语音系统解决方案
一种用于单片机的红外串行通信接口	一种用于单片机的红外串行通信接口

推荐技术

可能喜欢

• FPGA排序实现方法	• 浪潮推出WebP图像有损压缩FPGA异构加速方案
• FPGA与其它通用逻辑器件究竟不同	• 利用结构化ASIC实现信号处理应用
• 如何利用FPGA进行时序分析设计	• ACTEL FPGA在便携式系统中的应用
• 应用于 FPGA、GPU 和 ASIC 系统的电源管理	• 万能的FPGA都应用在哪？
• 并联ADP1763 LDO稳压器以支持高输出电流应用	• 掌握三大原则，轻松分配FPGA引脚