原标题:世界最新top500超计算排行榜出炉了! 暴露英伟达雄霸三分之二版图的扩张之路! 资料来源:墨记
6月22日,在国际超计算大会( isc )期间,发表了最新的top500超级计算机排名。 这个排名显示了世界现代科学计算的整体情况,引人注目的是前10位的超级计算机中有8台使用nvidia技术的top500排行榜的全部系统中,有三分之二的系统( 333套)是nvidia
除了当前产品和技术水平的广泛复盖外,nvidia还在推动数据观察、模拟、可视化、边缘流、ai和云技术的应用,以应对当前和将来的挑战。 英伟达超越江湖地位再次更新
top500排行榜每年更新两次。 根据这个最新排名,世界排名前十位的超级计算机中有八台使用nvidiagpu、infiniband互联网技术或两种技术。 这包括美国、欧洲和中国最强大的超级计算机系统。
在top500排行榜的所有系统中,三分之二的系统( 333套)使用nvidia (包括收购的mellanox )增强力量。 在2005年6月公布的排行榜中,使用两个企业的系统比例合计不足一半( 203套)。
目前,约四分之三( 3(74% )的新infiniband系统使用nvidiamellanoxhdr 200 ginfiniband,标志着这种智能高速数据互联技术的迅速普及。 自2019年11月以来,采用hdr infiniband的top500系统的数量几乎增加了一倍。 141台超级计算机采用infiniband,自2019年6月以来增加了12%。
在top500超级计算机中,305台系统采用nvidia mellanox infiniband和以太网( 61% ),所有141台infiniband系统和164台( 63% )以太网
更多的top500系统使用nvidia gpu、mellanox互联网技术
或者用了这两种技术。
top500排名前25的超级计算机中有20台系统选择使用nvidia gpu。 为什么? 能源效率是第一个原因。 如下图所示,采用nvidia gpu的系统与不使用nvidia gpu的系统相比,能效( gigaflops/watt单位)平均高2.8倍。
四周构建顶级超级计算机,每秒100亿次ai计算能力!
top500和green500排行榜的主要参考依据之一是linpack benchmark的性能标准。 在计算系统中,每瓦性能( gfloat/watts )是测量特定计算机体系结构或计算机硬件能效的度量。 实际上,它测量了计算机每单位功耗可以消耗的计算速度。 另外,green500比top500更重视计算速度,还重视超计算的能源消耗问题。
nvidia内部研究集群的新成员selene能够充分说明nvidia gpu的能效表现。 在linpack基准测试中,selene以27.5petaflops的性能,在最新的green500排行榜上排名第二,在top500排行榜上排名第七。
selene的耗电量为20.5 gigaflops/watt,与green500排行榜的第一名的差距很小,但第一名的系统体积很小,其性能表现仅为第394名。
也就是说,selene是前100名系统中唯一突破20 gigaflops/watt能效的系统,是世界上性能第二的产业用超级计算机,是意大利能源巨头eni s.p.a .的no. 6系统
在能效方面,selene的能效是其他不使用nvidia gpu的top500系统的平均能效性能的6.8倍。
nvidia加速计算产品管理总监paresh kharya表示,除了能效性能外,selene的另一个精彩之处是在不到4周内构建的系统,每套14个 selene是280台dgx a100系统、2240台nvidia a100 gpu、494台nvidiamellanoxquantum 200 Ginfiniband交换机、56 tb/s互联网体系结构、7pb高性能
selene最重要的性能规格之一是可以提供超过1 exaflops的ai性能。 此外,tpcx-bb的重要数据观察基准仅采用16台dgx a100系统即可记录新记录,性能是其他系统的20倍。
现在ai和分解是科学计算中的新诉求。 因为这些结果也特别重要。 在世界各地,研究者利用深入的学习和数据观察来预测各种最有潜力的行业,并进行实验。 这种方法有助于研究者减少昂贵、耗时的实验量,加快取得科学成果的速度。
按a100HPC和ai融合的快进按钮
通过将gpu设为“大”,a100就像大型反应堆。 从年的p100到年的a100,性能提高了9倍以上。 黄仁勋上个月从自家烤箱里拿出的“世界上最大的显卡”dgx a100是杰作之一,最新发表的selene进一步论证了其“恐怖”。
根据今年gtc上黄仁勋的发布,a100tensor core的一大创新点是引入fp32动态范围和fp16精度相结合的tensorfloat-32(tf32 )来加速fp32的运算。 据说在hpc的线性动力学场景中性能提高了4倍,在单精度训练中性能提高了5倍。 总之,第三代tensor core的核心可以为以前传递的64位数学模拟和精度较低的ai业务提供加速。
hpc和ai的融合,nvidia按下快进按钮,ai、数据科学和科学计算融合的新时代似乎开始风靡一时。
目前,世界一流的供应商有华硕、atos、思科、dell technologies、富士通、技嘉技术、hpe、浪潮、联想、one stop systems、quanta/qct、SuperCiment
这些服务的发售时期各不相同,今年夏天将发售30种系统,预计年底前将发售20种以上的系统。
据悉,此次top500排行榜中现在没有出现的6台建设中系统也使用了a100 gpu。 结合硬件和软件制作大数据,观察新的基准
现在大企业采用ai获得生产力和先进的洞察。
tpcx-bb是企业用于实际etl (提取、转换、加载)和机器学习业务流程的大数据标准测试。 该基准的30个查询项目包括各种大型数据观察用例,包括库存管理、价格分解、销售分解、推荐系统、客户细分和情感分解。
迄今为止,该基准仅在cpu系统上运行。 分布式计算系统正在稳步改善,但执行这样大的数据业务负载存在瓶颈。 nvidia通过rapids软件生态系统和dgx a100系统,以19.5倍的tpcx-bb性能打破记录,确立了大数据观察的新标杆。
该基准测试使用rapids开源数据科学软件库工具包,采用由16台nvidia dgx a100系统组成的群集,nvidia在14.5分钟内完成了基准测试,迄今为止,cpu系统 该dgx a100集群系统总共构成128个nvidia a100 gpu,配备了nvidia mellanox互联网功能。 这个硬件和软件相结合的系统可以加快计算、通信、互联网和存储基础架构。
30个tpcx bb基准的查询结果
rapids在16个dgx a100系统上运行,为每个10tb测试查询提供上述相对性能提高。 与以前上传和采用cpu的方案相比,rapids和dgx a100系统的价格是1/7,功耗是1/3。
此外,nvidia与开源社区合作,为apache spark 3.0带来了端到端gpu加速,支持重要而耗时的机器学习解决方案前端。
ai模型培训可以在同一spark群集上解决业务负载,而不是作为单独的进程在单独的基础架构上运行。 这样,可以高性能地观察整个数据科学解决过程,从数据湖迅速制作与模型训练相关的数十甚至数千tb的数据。 此外,无需更改应用于本地和云spark应用程序的现有代码。
收购mellanox得到的增益大幅度浮现
nvidia在超算这一尖端行业攻城掠夺地的大规模扩张也与mellanox的贡献密切相关,重新验证了这一收购的战术观点。 产品线与nvidia互补,凭借mellanox的infiniband、以太网等技术,nvidia具有更强的互联网服务和云功能,形成了更强大的整体处理能力。
根据这次top500的排名,infiniband是排名前十的超级计算机中的7台高速化,包括中国、欧洲和美国性能最高的系统。
我知道infiniband的设计是基于四个基本的基础。 是可以运行所有互联网引擎的智能端点设计。 扩展设计的软件定义交换互联网一站式控制和操作的集中管理开放源代码技术和开放api是确保和支持正向和反向兼容性的标准技术。
这些基本上有助于infiniband实现高互联网性能、低延迟、高速新闻收发。 作为目前市场上唯一的200gb/s高速互联产品,infiniband通过端到端自适应路由、拥塞控制和服务质量提供了高互联网效率。
除了高效的互联网外,我们也不能忽视数据中心停机造成的价格损失。 根据itic的研究,一小时停止造成的价格损失一般在30万美元以上。 nvidia推出了最新的ufm cyber-ai平台,以最大限度地减少数据中心停机造成的损失。 ufm平台产品系列对infiniband系统进行了近十年的管理,此次扩展使用ai从实时和历史的遥测和业务负荷数据中学习数据中心的运营节奏和互联网的业务负荷模型 因此,根据此标准跟踪系统运行状况和互联网篡改,检测性能下降、招聘状况和配置文件更改。
nvidia mellanox互联网事业部高级营销副总裁gilad shainer表示,该平台明确了数据中心的独特生命体征,降低了性能、组件故障和异常招聘方式
infiniband成为气候研究和天气预报应用的实际标准。 世界多个气象服务机构选择nvidia mellanox infiniband互联网,以加速西班牙气象局、中国气象局、芬兰气象局、nasa、荷兰皇家气象局等超级计算平台
北京市气象台选择了200千兆位HDR InfiniBand互联技术,加快了超级计算平台。 这个平台用于增强天气预报,改善气候和环境研究,2022年北京冬季奥运会的天气预报。
气象模型和气候模型是计算和数据密集型模型,因此预测质量一般取决于模型的多少、复杂性和高分辨率,分辨率取决于超级计算机的性能,超级计算机的性能是互联技术在计算资源之间迅速有效地同时扩展
天气预报已成为超计算改变的新行业。 nvidia a100 gpu和mellanox hdr infiniband互联网技术带来的超计算风暴不止这些。 正在重新定义加速计算
因为疫情,今年的超算大会对covid-19相关技术和方案也越来越重视。
nvidia科学计算平台所起的作用也给加速计算的未来带来了越来越多的可能性。 从数据观察到模拟和可视化、ai和边缘解决,平台加快了所有行业的方法。
ai .数据观察和边缘流重新定义了科学计算。 随着深入学习和解体的扩展,科学家们运用云计算服务,也运用来自互联网边缘的远程设备的流数据,这些要素共同构成了nvidia加速的科学计算支柱。
加上前面文章多的一点进展,一些前沿的例子值得关注和思考。
在仿真中,在对抗新型冠状病毒的过程中,橡树国家实验室( oak ridge national laboratory )的研究者使用summit超级计算机的内置gpu执行autodock,全年无休,20亿种
在科学的边缘流中,欧洲核研究所( cern )最近宣布,nvidia gpu将把大型强子对撞机内粒子对撞机事件产生的数据量减少500倍。
在可视化中,nvidia的index和magnum io软件有助于增强火星注册者号码的可视化功能,这是世界上最大规模的交互式实时立体可视化项目。
nvidia方面说,最新的top500排行榜以另一种形式证明了nvidia为实现ai和hpc民主化所做的努力。 研究者和公司都强烈要求加快从云到互联网边缘的ai和分解。
为科学计算提供端到端业务流程,采用完全创新战略,加快所有重要的应用行业,是nvidia加快计算行业两大成功的秘诀。
本文由电子发烧友网原创,未经许可禁止转载。 需要转载时,请追加微信号elecfans999
全天候滚动播放最新的财经信息和视频,越来越多的粉丝福利扫描二维码备受关注( finance )。
标题:【热门】全球最新TOP500超算榜单出炉!揭秘英伟达雄霸三分之二版图的扩张之路
地址:http://www.china-huali.com/gphq/2671.html