重生之AI教父_第320章英伟达帕斯卡降临（合）

也就是说，目前难住孟繁岐的一大瓶颈，是一卡工作八卡围观。

显卡本身的性能甚至都未能成为主要原因，因为交互数据的时候就已经太慢了。

如果10秒钟的时间里，只有2秒钟在进行计算，其余的8秒都在进行数据的等待。那即便你计算速度提升一百倍，也不可能让这个时间少于8秒钟。

必须得要改善设备的吞吐速度，才能解决这样的问题。

而新的帕斯卡架构，将这个数字扩展到了80GB，乃至160GB，因为它支持双向传输。

这就已经是十倍的传输效率提升了。

此外，黄仁勋还实现了大半年前，两人曾经讨论过的半精度支持。

这章没有结束，请点击下一页继续阅读！

孟繁岐当时在上一届GTC大会后建议黄仁勋，未来的人工智能计算，数据和模型过大，很有可能会偏向半精度的数据类型，因为AI计算并不需要精确到小数点后那么多位。

这项后来成为人工智能计算标准的格式，在旧的麦克斯韦框架上并未得到支持。

如今看来，黄仁勋做得还是相当到位的。

孟繁岐的这个建议，单从理论上就已经提供了2倍的计算速度。

如果考虑到各种传输也会因此减少一般的数据体量，以及新显卡计算单元的专门设计，实际效果还会更好一些。

【当然，我们的目标并不仅仅是创造一款强大的硬件产品，而是为用户提供全面的解决方案。P100显卡充分支持英伟达的深度学习库，如CUDA和cuDNN，为研究人员和开发者们提供了更高效、便捷的开发环境。无论是在科研领域还是商业应用中，P100都将成为您的得力助手...】

这款P100产品比前世16年版本在硬件性能上要稍差一些，CUDA核心和频率数量都略有缩减。

不过由于提前一年就与孟繁岐达成合作，英伟达在几个关键路线上少走了很多弯路。

NVLink，半精度计算之类的功能都进行了提前布局。除此之外，还针对特性的算子和计算操作做了专门的优化。

不过这卡...终究也是画饼罢了。

【...第一批的P100显卡，已经有股东订购了大量的订单，以及谷歌、微软、脸书这些大公司。他们将会首先获得这些性能怪兽。】

不仅孟繁岐买了不少，谷歌等大公司也不会吝啬这个钱。

黄仁勋口中的“第一批”恐怕是远远不止一批，没个三五个月几乎不可能交付完成。

数据交互加上半精度的设计，将人工智能的相关训练过程提速十几二十倍，绝非空话。

孟繁岐是大股东没错，黄仁勋也同时需要考虑好几位AI大玩家的需求。

至于稍微小点的公司...从最开始就被剔除在了游戏之外。

他们只能等待英伟达满足了第一批客人之后才有机会购入一部分，那时候可能已经是十个月后，16年的时候才有机会。

这对于正在高速发展期的人工智能领域来说就是垄断式的。

买不到设备，等到孟繁岐今年迟些时候推出30B版本ChatGPT，以及各种绘图改图智能的时候。

都不需要费力气去山寨，就是直接代码送给伱，你也玩不起。

【你买的越多，就省得越多！】

台上，黄仁勋正在激情满满地推销P100。

这句话说得倒也没错，只是当买的多就赚得多的时候，这件事大概率就已经和普通人没什么关系了。

今生的人工智能也将提前进入生成时代，AIGC。