【热门】全球最新TOP500超算榜单出炉！揭秘英伟达雄霸三分之二版图的扩张之路-中华财会网

原标题:世界最新top500超计算排行榜出炉了！暴露英伟达雄霸三分之二版图的扩张之路！资料来源:墨记

6月22日，在国际超计算大会( isc )期间，发表了最新的top500超级计算机排名。这个排名显示了世界现代科学计算的整体情况，引人注目的是前10位的超级计算机中有8台使用nvidia技术的top500排行榜的全部系统中，有三分之二的系统( 333套)是nvidia

【热门】全球最新TOP500超算榜单出炉！揭秘英伟达雄霸三分之二版图的扩张之路

除了当前产品和技术水平的广泛复盖外，nvidia还在推动数据观察、模拟、可视化、边缘流、ai和云技术的应用，以应对当前和将来的挑战。英伟达超越江湖地位再次更新

top500排行榜每年更新两次。根据这个最新排名，世界排名前十位的超级计算机中有八台使用nvidiagpu、infiniband互联网技术或两种技术。这包括美国、欧洲和中国最强大的超级计算机系统。

在top500排行榜的所有系统中，三分之二的系统( 333套)使用nvidia (包括收购的mellanox )增强力量。在2005年6月公布的排行榜中，使用两个企业的系统比例合计不足一半( 203套)。

目前，约四分之三( 3(74% )的新infiniband系统使用nvidiamellanoxhdr 200 ginfiniband，标志着这种智能高速数据互联技术的迅速普及。自2019年11月以来，采用hdr infiniband的top500系统的数量几乎增加了一倍。 141台超级计算机采用infiniband，自2019年6月以来增加了12%。

【热门】全球最新TOP500超算榜单出炉！揭秘英伟达雄霸三分之二版图的扩张之路

在top500超级计算机中，305台系统采用nvidia mellanox infiniband和以太网( 61% )，所有141台infiniband系统和164台( 63% )以太网

更多的top500系统使用nvidia gpu、mellanox互联网技术

或者用了这两种技术。

top500排名前25的超级计算机中有20台系统选择使用nvidia gpu。为什么？能源效率是第一个原因。如下图所示，采用nvidia gpu的系统与不使用nvidia gpu的系统相比，能效( gigaflops/watt单位)平均高2.8倍。

四周构建顶级超级计算机，每秒100亿次ai计算能力！

top500和green500排行榜的主要参考依据之一是linpack benchmark的性能标准。在计算系统中，每瓦性能( gfloat/watts )是测量特定计算机体系结构或计算机硬件能效的度量。实际上，它测量了计算机每单位功耗可以消耗的计算速度。另外，green500比top500更重视计算速度，还重视超计算的能源消耗问题。

【热门】全球最新TOP500超算榜单出炉！揭秘英伟达雄霸三分之二版图的扩张之路

nvidia内部研究集群的新成员selene能够充分说明nvidia gpu的能效表现。在linpack基准测试中，selene以27.5petaflops的性能，在最新的green500排行榜上排名第二，在top500排行榜上排名第七。

selene的耗电量为20.5 gigaflops/watt，与green500排行榜的第一名的差距很小，但第一名的系统体积很小，其性能表现仅为第394名。

也就是说，selene是前100名系统中唯一突破20 gigaflops/watt能效的系统，是世界上性能第二的产业用超级计算机，是意大利能源巨头eni s.p.a .的no. 6系统

在能效方面，selene的能效是其他不使用nvidia gpu的top500系统的平均能效性能的6.8倍。

nvidia加速计算产品管理总监paresh kharya表示，除了能效性能外，selene的另一个精彩之处是在不到4周内构建的系统，每套14个 selene是280台dgx a100系统、2240台nvidia a100 gpu、494台nvidiamellanoxquantum 200 Ginfiniband交换机、56 tb/s互联网体系结构、7pb高性能

【热门】全球最新TOP500超算榜单出炉！揭秘英伟达雄霸三分之二版图的扩张之路

selene最重要的性能规格之一是可以提供超过1 exaflops的ai性能。此外，tpcx-bb的重要数据观察基准仅采用16台dgx a100系统即可记录新记录，性能是其他系统的20倍。

现在ai和分解是科学计算中的新诉求。因为这些结果也特别重要。在世界各地，研究者利用深入的学习和数据观察来预测各种最有潜力的行业，并进行实验。这种方法有助于研究者减少昂贵、耗时的实验量，加快取得科学成果的速度。

【热门】全球最新TOP500超算榜单出炉！揭秘英伟达雄霸三分之二版图的扩张之路

按a100HPC和ai融合的快进按钮

通过将gpu设为“大”，a100就像大型反应堆。从年的p100到年的a100，性能提高了9倍以上。黄仁勋上个月从自家烤箱里拿出的“世界上最大的显卡”dgx a100是杰作之一，最新发表的selene进一步论证了其“恐怖”。

根据今年gtc上黄仁勋的发布，a100tensor core的一大创新点是引入fp32动态范围和fp16精度相结合的tensorfloat-32(tf32 )来加速fp32的运算。据说在hpc的线性动力学场景中性能提高了4倍，在单精度训练中性能提高了5倍。总之，第三代tensor core的核心可以为以前传递的64位数学模拟和精度较低的ai业务提供加速。

【热门】全球最新TOP500超算榜单出炉！揭秘英伟达雄霸三分之二版图的扩张之路

hpc和ai的融合，nvidia按下快进按钮，ai、数据科学和科学计算融合的新时代似乎开始风靡一时。

目前，世界一流的供应商有华硕、atos、思科、dell technologies、富士通、技嘉技术、hpe、浪潮、联想、one stop systems、quanta/qct、SuperCiment

这些服务的发售时期各不相同，今年夏天将发售30种系统，预计年底前将发售20种以上的系统。

据悉，此次top500排行榜中现在没有出现的6台建设中系统也使用了a100 gpu。结合硬件和软件制作大数据，观察新的基准

现在大企业采用ai获得生产力和先进的洞察。

tpcx-bb是企业用于实际etl (提取、转换、加载)和机器学习业务流程的大数据标准测试。该基准的30个查询项目包括各种大型数据观察用例，包括库存管理、价格分解、销售分解、推荐系统、客户细分和情感分解。

迄今为止，该基准仅在cpu系统上运行。分布式计算系统正在稳步改善，但执行这样大的数据业务负载存在瓶颈。 nvidia通过rapids软件生态系统和dgx a100系统，以19.5倍的tpcx-bb性能打破记录，确立了大数据观察的新标杆。

该基准测试使用rapids开源数据科学软件库工具包，采用由16台nvidia dgx a100系统组成的群集，nvidia在14.5分钟内完成了基准测试，迄今为止，cpu系统该dgx a100集群系统总共构成128个nvidia a100 gpu，配备了nvidia mellanox互联网功能。这个硬件和软件相结合的系统可以加快计算、通信、互联网和存储基础架构。

【热门】全球最新TOP500超算榜单出炉！揭秘英伟达雄霸三分之二版图的扩张之路

30个tpcx bb基准的查询结果

rapids在16个dgx a100系统上运行，为每个10tb测试查询提供上述相对性能提高。与以前上传和采用cpu的方案相比，rapids和dgx a100系统的价格是1/7，功耗是1/3。

此外，nvidia与开源社区合作，为apache spark 3.0带来了端到端gpu加速，支持重要而耗时的机器学习解决方案前端。

ai模型培训可以在同一spark群集上解决业务负载，而不是作为单独的进程在单独的基础架构上运行。这样，可以高性能地观察整个数据科学解决过程，从数据湖迅速制作与模型训练相关的数十甚至数千tb的数据。此外，无需更改应用于本地和云spark应用程序的现有代码。

【热门】全球最新TOP500超算榜单出炉！揭秘英伟达雄霸三分之二版图的扩张之路

收购mellanox得到的增益大幅度浮现

nvidia在超算这一尖端行业攻城掠夺地的大规模扩张也与mellanox的贡献密切相关，重新验证了这一收购的战术观点。产品线与nvidia互补，凭借mellanox的infiniband、以太网等技术，nvidia具有更强的互联网服务和云功能，形成了更强大的整体处理能力。

【热门】全球最新TOP500超算榜单出炉！揭秘英伟达雄霸三分之二版图的扩张之路

根据这次top500的排名，infiniband是排名前十的超级计算机中的7台高速化，包括中国、欧洲和美国性能最高的系统。

我知道infiniband的设计是基于四个基本的基础。是可以运行所有互联网引擎的智能端点设计。扩展设计的软件定义交换互联网一站式控制和操作的集中管理开放源代码技术和开放api是确保和支持正向和反向兼容性的标准技术。

这些基本上有助于infiniband实现高互联网性能、低延迟、高速新闻收发。作为目前市场上唯一的200gb/s高速互联产品，infiniband通过端到端自适应路由、拥塞控制和服务质量提供了高互联网效率。

除了高效的互联网外，我们也不能忽视数据中心停机造成的价格损失。根据itic的研究，一小时停止造成的价格损失一般在30万美元以上。 nvidia推出了最新的ufm cyber-ai平台，以最大限度地减少数据中心停机造成的损失。 ufm平台产品系列对infiniband系统进行了近十年的管理，此次扩展使用ai从实时和历史的遥测和业务负荷数据中学习数据中心的运营节奏和互联网的业务负荷模型因此，根据此标准跟踪系统运行状况和互联网篡改，检测性能下降、招聘状况和配置文件更改。

【热门】全球最新TOP500超算榜单出炉！揭秘英伟达雄霸三分之二版图的扩张之路