一站式电子元器件采购平台

华强商城公众号

一站式电子元器件采购平台

元器件移动商城,随时随地采购

华强商城M站

元器件移动商城,随时随地采购

半导体行业观察第一站!

芯八哥公众号

半导体行业观察第一站!

专注电子产业链,坚持深度原创

华强微电子公众号

专注电子产业链,
坚持深度原创

电子元器件原材料采购信息平台

华强电子网公众号

电子元器件原材料采购
信息平台

NVIDIA针对异质超级运算推出最新版编译器

来源:http://news.hqew.com/info-315042.html 发布时间:2017-09-21

摘要: NVIDIA (辉达) 今天宣布推出 17.7 版 PGI 2017 编译器与工具,协助高效能运算系统开发者针对搭载多核 CPU 与异质化 GPU 加速器的系统,开发出效能更高的软体,同时大幅简化程式设计流程。即日释出的 PGI 17.7 编译器与工具的关键特点包括: 支援Tesla V100 G...

  NVIDIA (辉达) 今天宣布推出 17.7 版 PGI 2017 编译器与工具,协助高效能运算系统开发者针对搭载多核 CPU 与异质化 GPU 加速器的系统,开发出效能更高的软体,同时大幅简化程式设计流程。

  即日释出的 PGI 17.7 编译器与工具的关键特点包括:

   支援Tesla V100 GPU: PGI OpenACC 与CUDA Fortran现已支援新款NVIDIA Volta GV100 GPU,提供更多记忆体频宽、串流多重处理器、新一代NVIDIA NVLink以及全新微架构功能,堆砌出更好的效能与可编程功能。

   OpenACC支援CUDA整合记忆体:PGI 17.7 版编译器能利用 CUDA 整合记忆体,简化针对 GPU 加速系统程式的编译流程。藉由开启简易编译器选项,OpenACC 即可在 CUDA 整合记忆体中配置资料的存放位置,而不需撰写资料移动程式码或指令。

   支援多核 CPU 的 OpenMP 4.5 :初始针对 OpenMP 4.5 语法与功能的支援,即可针对大多数运行于多核CPU系统中的 OpenMP 4.5 平行处理进行编程。程式中的目标区块(TARGET)在预设支援条件设定后,会将多核系统当成目标,而PARALLEL 以及DISTRIBUTE等程式迴圈则能分散到所有OpenMP执行绪进行平行处理。

   对Fortran语法的衍生类别进行深层复製: 透过 OpenACC 指令能在CPU主控端与GPU元件记忆体之间搬移匯整或深层巢状Fortran资料物件,包括指标型物件的巡行与管理作业。

   C++ 语言方面的改良:PGI 17.7 C++ 编译器内含许多逐次扩增的 C++17 功能,并将其汇整到 CUDA 9.0 NVCC 主编译器的支援範围内。在 LCALS 迴圈处理性能量测指标中效能平均提升了20%。

   在 OpenACC 程式区段中使用 C++14 Lambdas 函数:C++ 语言的lambdas函数,能在匿名函式物件被唿叫或是以参数形态被传递时,提供一种便利的方法来定义其物件。从 PGI 17.7 版开始,C++语言撰写程式的 OpenACC 运算区段都支援 lambdas 函数,包括针对不同编程模型或平台生成对应的程式码。 C++14 则引进更多lambdas函数用法,尤其是多类型的 lambdas函数。上述这些功能都可运用在 OpenACC 程式中。

   与cuSOLVER 函式库互通:透过使用 PGI 提供的介面模组与 PGI 17.7 内建的 PGI 版 cuSOLVER 函式库,即可唿叫包括 CUDA Fortran、OpenACC Fortran、C 以及 C++ 等语言的最佳化 cuSolverDN 函式。

   支援 NVIDIA Tesla GPU与多核 CPU 处理的 PGI Unified Binary:使用 OpenACC 编译出的程式不仅支援 GPU 加速,还能在多核CPU上支援平行处理。在搭载GPU的系统上运行时, OpenACC 支援区段分载以及在GPU上执行程式。当在没有安装GPU的系统上运行时,OpenACC 的程式区段能分散到系统中所有CPU核心上同步处理。

   全新分析功能支援 CUDA 整合记忆体与OpenACC :PGI 17.7 Profiler现已加入多项全新 OpenACC 分析功能,包括支援有连结 GPU 与无连结 GPU 的两种多核 CPU 平台,另外还新增全新的摘要(summary)检视功能,能显示处理每种 OpenACC 程式码结构所耗费的执行时间。新增的 CUDA 统合记忆体功能,能追踪出每项 CPU 分页错误对应到哪些程式码,以及这些程式码所涉及的资料所在位置,并支援全新 CUDA 整合记忆体分页频繁的置换、节流、远端对应事件、NVLink以及其他诸多功能。

  PGI 17.7的其他功能与改良包括所有支援全方位平台环境模组、预製热门开源函式库与程式,以及新推出的《运用 OpenACC 执行平行运算》的教学系列影片 。



声明:本文观点仅代表作者本人,不代表华强商城的观点和立场。如有侵权或者其他问题,请联系本站修改或删除。

社群二维码

关注“华强商城“微信公众号

调查问卷

请问您是:

您希望看到什么内容: