不再靠你买显卡氪金信仰,英伟达已经变了

「皮衣教主」黄仁勋大概睡觉都能笑醒。就在新冠疫情给电子花费、零卖、生产等行业带来「深度没落」时,以数据中间为代表的云计较行业却迎来逆势增进。即日,DIGITIMES 报道,在新冠疫情大盛行时代,数据中间对高性能计较 HPC、AI 应用需要兴旺,英伟达、AMD 服无器芯片销量正在增加。

现实上,以服无器芯片为代表的英伟达数据中间业务,曾经陆续多个季度获取快速增进。从 今年 年财年的 25%,增进到 2020 年财年(停止 2020 年 1 月 26 日)的 27.4%,再到 2021 财年初次季度(停止 4 月 26 日)的 37%。数据中间业务对英伟达整体营收的进献越来越紧张,和英伟达「传统」上风平台游戏板块业务旗敌相当。

而就在一个多月过去的 2020 年 GTC 线上公布会上,英伟达符合时宜地适应了云环境趋势需要激增这一环境趋势趋向。公布会没有发现听说中的 Ampere GeForce RTX 3080 游戏显卡,数据中间产物却成为了「统统主角」,赚足了闪光灯。英伟达推出了第八代 GPU 架构 Ampere 安培,新一代 A100 计较卡,不仅在工艺制程上横跨至 7nm,更在多个环节性能参数指标上呈数倍、甚至数十倍增进。

这是英伟达时隔三年,再度向环境趋势扔出的重磅「核弹」,英伟达的指标很明白,即是 AI 练习兼推理芯片、高性能计较 HPC 平台。固然,英伟达霸占的也不单单是服无器芯片为代表的硬件环境趋势,其非常大的「杀手锏」在于软硬一体的生态结构。

「非常大的敌手是本人」

英伟达 CEO 黄仁勋评价 A100 GPU,「这是英伟达有史以来非常佳的数据中间 GPU 芯片,险些是当今半导体的表面极限,它是英伟达数十年以来数据中间经验的结晶。」

确凿,A100 GPU 惹起了包含亚马逊 AWS、谷歌云、微软 Azure、阿里云、百度云、腾讯云等云巨擘,以及戴尔、海潮、HPE、新华三、思科等体系生产商极大的购买热心。而且,在 A100 GPU 公布以前,就曾经投产,首先慢慢向云厂家们托付。

用黄仁勋的话来形貌即是「空前无后」。

八年过去,黄仁勋统统想不到,英伟达能够 C 端、B 端通吃,踩准了 AI 时代的每个环节节点,为深度学习提供壮大算力,推进图片、语音、自动驾驶、机械人、甚至数据中间的飞速开展。现在,相比于 21 年前刚上市时,英伟达市值已翻了千余倍。

2012 年,ImageNet 大赛上,参赛者因应用英伟达 GPU+CUDA,将深度卷积神经网络 AlexNet 精确率进步 10% 以上,获取头筹,也让英伟达名声大噪。今后,英伟达 GPU 和 CUDA 应用连续主导深度学习环境趋势,险些全部深度学习开辟者离不开英伟达 GPU+CUDA 组合。

包含 2016 年,干脆引爆 AI 第三次海潮的环节事件,AlphaGo 大战李世石,以及亚马逊 AWS、微软,国内的互联网厂家 BAT、美团等 AI 非常新进展均有英伟达 GPU 的底层支持。多个第三方钻研汇报表现,在云端 AI 芯片环境趋势,尤其是云端练习方面,英伟达占有统统主导职位。

云端、企业级数据中间芯片环境趋势,排名前四位的共有云厂家亚马逊 AWS、微软 Azure、谷歌云、阿里云的上万余个实例范例中,惟有很小一片面不基于英伟达 GPU 加快。

但是,这不料味着,英伟达彻底没有潜伏威逼。英伟达角逐敌手大致分为三种:英特尔、AMD 为代表的「老敌手」;亚马逊 AWS、谷歌、阿里巴巴、华为为代表的云巨擘,以及寒武纪、燧原科技为代表的创业型 AI 芯片公司在内的新敌手。

现实上,与其说是新老之争,不如说是 CPU、GPU、ASIC、FPGA 之间的纷争。只管,英特尔 Xeon CPU 曾经安置于全球 99% 的数据中间中,但深度学习、AR/VR、IoT、海量数据处理,推进着数据中间从 CPU 转向 GPU,并成为常态化。

好比,传单位展示、流媒体、电商平台保举引擎体系、智能语音当今均已接纳 GPU 驱动。再如,相像时间周期内芯片性能进步的难易程度不同。今年 年,英伟达推出基于新架构 Volta 的 Tesla V100 芯片,是上一代基于 Pascal 架构的 Tesla P100 练习速率的 12 倍。英伟达在三年以内将 AI 性能进步了 60 多倍,而相像时间内,CPU 只能进步一倍。

难怪,黄仁勋自 今年 年以来,屡次公示揭露摩尔定律已无效。

在云巨擘方面,无论是 AWS Inferentia、谷歌 TPU、阿里巴巴含光 800 均属于 ASIC 芯片,偏重 AI 推理。云巨擘自研云端 AI 芯片背地的逻辑有两点,一方面,低落购置芯片的老本,更好服无于本身业务,另一方面,慢慢削减对英伟达、英特尔芯片的依附,进步本人对云生态体系的掌控才气。

普通来说,ASIC 只针对单纯场景,速率很快,GPU 的性能以面积和功耗为价格,表面上 ASIC 性能优于 GPU。但 ASIC 研发较慢,偶然候赶不上深度学习的开展速率。在费用方面甚至更高昂,谷歌官网表现,应用 TPU 费用为 8 美元 / 时,英伟达芯片则为 2.48 美元 / 小时。

「AI 练习芯片的研起事度更高,当前或是 GPU 占有了很大的上风。要紧是英伟达缠绕本人的 GPU 曾经构建了丰富的应用生态。其余 ASIC 或 FPGA 在硬件指标上大概占有上风,但在生态上比英伟达还掉队许多,这也是为何英伟达一家独大的缘故。」芯谋钻研徐可报告极客公园。

芯片行业的「苹果公司」

黄仁勋曾说过,英伟达是一家 AI 公司,更夸大英伟达是一家应用公司,和苹果相似,经历营销硬件红利的应用公司。

2006 年,英伟达面向开辟者推出 CUDA 通用并行计较平台,经历 CUDA 平台,开辟者能够应用 C 或 C++ 语言编程,来加快计较应用程序,极地面简化了应用开辟历程。英伟达投入大批资金修建 CUDA 生态,经历开设课程、培训,吸引开辟者,分泌至各个环节行业用户,这是角逐敌手 AMD 所不具有的才气。

近三四年,英伟达开辟者数目增进迅猛,仅 今年 年一年,CUDA 平台的下载量就跨越了 500 万次。不仅云云,在 CUDA 平台之上,英伟达还提供 CUDA-X 应用加快库鸠合,此中,CUDA-X AI 席卷了加快深度学习的 cuDNN、加快机械学习算法的 cuML、优化练习模型以进行推理的 TensorRT 等 15 个库,别的,英伟达还推出 RAPIDS 开源应用平台,加快企业数据剖析、机械学习。

昨年年关,黄仁勋在接管 GamesBeat 采访时谈到,英伟达基于 GPU 芯片构建出了很复杂的应用仓库,而应用仓库是角逐敌手不具有的「赛道」。

可见,CUDA 平台在内的应用才气,曾经成为英伟达的「护城河」。好比,今年 年,英伟达推出头向 AI 练习和高性能计较的 Tesla V100 芯片后,长达两年多的时间里,没有新的后续产物推出。应用成为进步 AI 性能的环节,ResNet-50 神经网络在应用的赞助下,AI 练习才气进步了 100%。

在 GPU 硬件方面,英伟达也在稳定、加强固有上风。今年 年,英伟达回收 Mellanox,弥补了英伟达在数据中间低延迟互连及网络方面的短缺,显著加强 NVLink(GPU 与 GPU 互联)和 NVSwitch(整合多个 NVLink)互联的速率与可扩大性。

2016 年,英伟达面向 AI 创业公司,推出初创加快决策,赞助 AI 创业公司加快孵化、商业落地。巨擘角逐的素质是生态上的角逐。

「生态和应用很环节。AI 芯片只是底层的对象,AI 开辟者对 AI 芯片关联生态和应用的选定,决意了芯片的出路。」徐可说。

在历史游戏显卡业务想象力登顶,比特币挖矿机行业「过山车」式的升沉后,英伟达正凭借数据中间业务进阶 B 端。当今看来,英伟达押宝数据中间前景与钱景庞大,数据中间业务与英伟达壮大的应用、生态才气发生的化学反馈,正驱动英伟达在芯片环境趋势讲出一个新的增进故事。

您可能还会对下面的文章感兴趣: