美国采购网DealABC_工业品给世界动力,艺术品给世界温暖

 找回密码
 立即注册

英伟达又一神作 推最新加速器

2017-7-6 01:19| 发布者: dealabc_admin| 查看: 329| 评论: 0

摘要: 英伟达又一神作 推最新加速器与去年类似,在今年的国际超级计算大会(ISC)上,英伟达(nVIDIA)发布并详细介绍了他们最新的Tesla GPU加速器——基于Volta-based的V100——的PCI Express版本。这次会议在6月19日至22日 ...
英伟达又一神作 推最新加速器
与去年类似,在今年的国际超级计算大会(ISC)上,英伟达nVIDIA)发布并详细介绍了他们最新的Tesla GPU加速器——基于Volta-based的V100——的PCI Express版本。这次会议在6月19日至22日举行,并且有几位来自英伟达的发言人参加了这次大会举行的活动,英伟达将在会上介绍其下一代的高性能计算和深度学习的产品。
Volta讨论和描述他们的GPU技术会议是在5月中旬,英伟达升级了产品的尺寸:V100是815mm采用的是定制的TSMC 12FFN硅,塞满了张量的核心和统一的L1缓存/SM,还有许多更基本的,目前还没有完全显示的microarchitectural变化。
与之前的Pascal迭代一样,特斯拉V100 PCIe提供了一种更传统的形式,而不是类似于NVIDIA的SXM2形式。这使得供应商可以在传统的PCIe系统中放弃特斯拉加速卡,从而让那些不想在英伟达的SXM2连接器或运营商板上构建的服务器制造商更容易获得这些加速卡。PCIe卡有一个更低的250W TDP,它们没有NVLink,而是仅仅依赖于PCIe。

AM9]D%RK2UX27V_V7NAJ11Q.png

在表面上,张量核的增加是最值得注意的变化。概括地说,张量核可以被看作是一系列统一的矩阵,它们可以将两个4x4的FP16矩阵相乘,然后在一个融合的乘法加法操作中,将该产品添加到FP16或FP32 4x4矩阵中,而不是传统的FP32或FP64CUDA核心。最后,这意味着对于非常特定的类型(特别是编程)的工作负载,Volta可以利用英伟达混合中技术加入的100+t。
至于PCIe V100的具体规格,它同样配置了SXM2版本,获得了相同数量的CUDA内核和内存容量,不过与它的250W TDP版本相比,运行速度较低。由于是基于英伟达的吞吐量数据,这使得PCIe卡的boost频率在1370MHz,比SXM2版本慢了85MHz(6%)。
有趣的是,与特斯拉P100家族不同的是,英伟达并没有提供基于回收芯片的二线PCIe卡,因此这代产品与12GB PCIe P100的容量没有太大的区别。英伟达的经验与gp100/interposerhbm2装配以及HBM2的持续生产很可能减少了对内存回收部件的需求。
最终,基于PCIe的特斯拉V100加速器“预计将于今年晚些时候正式推出,将会从英伟达的经销商和制造商那里出售”,其中包括惠普企业,该公司将提供三种不同的PCIe Volta系统。


微信公众号搜索" FuninUSA "加关注,每日滚动更新美国市场讯息:金融、零售、批发。推荐关注!【微信扫描下图可直接关注

美国华人网微信公众号

【COACH美国代购总群】99634155

鲜花

握手

雷人

路过

鸡蛋

相关阅读

关于我们|Archiver|手机版|小黑屋|美国采购网DealABC_工业品给世界动力,艺术品给世界温暖  

GMT+8, 2024-7-6 13:32 , Processed in 0.078514 second(s), 8 queries , Gzip On, Apc On.

Powered by Discuz! X3.1

© 2014-2016 Sky-Express Inc.

返回顶部