一站式电子元器件采购平台

华强商城公众号

一站式电子元器件采购平台

元器件移动商城,随时随地采购

华强商城M站

元器件移动商城,随时随地采购

半导体行业观察第一站!

芯八哥公众号

半导体行业观察第一站!

专注电子产业链,坚持深度原创

华强微电子公众号

专注电子产业链,
坚持深度原创

电子元器件原材料采购信息平台

华强电子网公众号

电子元器件原材料采购
信息平台

在使用CNN算法的云数据中心,Altera FPGA实现的加速功能具有优异的每瓦性能

来源:http://news.hqew.com/info-288298.html 发布时间:2015-03-03

摘要: Altera公司今天宣布,微软采用Altera Arria? 10 FPGA (现场可编程门阵列)实现基于CNN (卷积神经网络)算法的数据中心加速功能,其每瓦性能非常优异。这些算法通常用于图像分类、图像识别,以及自然语言处理等。微软研究人员在云技术上不断取得进展,采用Arria 10...

  Altera公司今天宣布,微软采用Altera Arria? 10 FPGA (现场可编程门阵列)实现基于CNN (卷积神经网络)算法的数据中心加速功能,其每瓦性能非常优异。这些算法通常用于图像分类、图像识别,以及自然语言处理等。

 

  微软研究人员在云技术上不断取得进展,采用Arria 10开发套件和Arria 10 FPGA工程样片,展示了每瓦40 GFLOPS的性能——数据中心业界最好的性能水平。而且,与GPGPU相比,在CNN平台上,这一FPGA的性能功耗比是CNN的3倍。之所以能够达到这一性能水平,是由于采用了开放软件开发语言OpenCL,以及VHDL对Arria 10 FPGA及其IEEE754硬核浮点DSP (数字信号处理)模块进行编程。

 

  微软研究院客户和云应用总监Doug Burger评论说:“我们看到,采用了Arria 10工程样片后,CNN性能和功效大幅度提升,硅片中DSP模块的高精度硬核浮点功能是我们取得令人注目的研究成果的主要原因。”

 

  Altera计算和存储业务部总监Michael Strickland说:“FPGA在神经算法上有体系结构方面的优势,能够非常高效的进行卷积和汇集,其灵活的数据通路支持大量的OpenCL内核直接互相传送数据,而不需要使用外部存储器。Arria 10在体系结构上还有更多的优势,乘法和加法都支持硬核浮点——这种硬核浮点功能在逻辑数量和时钟速度上要优于传统的FPGA产品。”

 

  Altera曾宣布微软使用其Stratix V FPGA在创新的Catapult电路板上加速进行搜索,这类电路板于去年年底部署在第一个必应数据中心的服务器中。

    

声明:本文观点仅代表作者本人,不代表华强商城的观点和立场。如有侵权或者其他问题,请联系本站修改或删除。

社群二维码

关注“华强商城“微信公众号

调查问卷

请问您是:

您希望看到什么内容: