swag 肛交 AI计较爆发！吴泳铭力挺GPU计较，CPU真要沦为副角了？

9 月 19 日swag 肛交，2024 云栖大会中杭州如约召开，当作阿里云的年度重磅举止之一，云栖大会以引颈计较手艺创新为中枢，用功于股东云计较、大数据、东谈主工智能等前沿手艺的发展与应用。

当作善良 AI 硬科技的头部新媒体，雷科技也应邀出席云栖大会，大会的开幕演讲由阿里集团 CEO、阿里智能云董事长兼 CEO 吴泳铭主办，而在总共主旨演讲中，最令东谈主印象深化的莫过于这段话：

生成式 AI 改革计较架构，从 CPU 主导的计较体系到 GPU 主导的 AI 计较搬动。AI 期间将是" GPU 算力为主，CPU 算力为辅"的计较模式。2024 年阛阓新增算力，卓越 50% 的需求 AI 驱动产生，这一趋势将陆续扩大。阿里云投资建树了大齐的 AI 计较基础举止，依然远远无法知足客户需求。

没错，GPU 计较，等于改日。

在昔日几十年里，从云表劳动器到超等计较机，CPU 一直齐充任着计较体系中枢的职守。比如知名的河汉一号，就选定了 14336 个商用处理器、7168 个加快处理器和 2048 个自主飞腾 -1000 处理器，这些处理器基本是「CPU」，也等于"逻辑处理器"。

图源：维基百科

CPU 主要被筹谋用于处理通用计较任务，进行复杂的逻辑运算暖热序运算。你不错将 CPU 看作是一个大学生，他有着弥散的逻辑推算才调来处理各式复杂的任务，然而每次只可处理一个任务，也等于所谓的「单线程」。

天然在后续的 CPU 筹谋中，工程师通过提示集、CPU 架构等状貌，让 CPU 不错同期处理两个使命（双线程），却断然是当下的极限。而且 CPU 在处理任务时，仍然需要先处理完手头的使命，再进入下一个使命历程，也等于「公法推论」。

逻辑运算与公法推论，组成了 CPU 的通用计较基础，只好你输入的身手稳健 CPU 的运算逻辑，那么 CPU 所给出的计较限度齐是一样的，并不会因为你使用的是 AMD，他使用的是英特尔，是以你的 1+1=2，他的 1+1=3。

成绩于刚劲的通用计较才调，CPU 成为东谈主类构建通用型计较中心时的首选，因为计较中心的筹谋初志等于用来推论不同范围的计较任务。而劳动器则是承担着为云表应用提供数据交换和计较等赞助，为了使其好像适当不同类型的应用运算，通用计较才调等于要道。

图源：veer

最近两年，一切齐发生了回山倒海的改革，GPU 成为大多数新数据中心及超等计较机的中枢，GPU 算力的增长速率屡屡冲破历史记录，企业随性采购 GPU 中枢，搭建全新的计较矩阵，而这一切的「元凶」，等于生成式 AI。

当作比年来最受善良、热度最高的前沿范围，生成式 AI 有一个脾性，那等于对算力的恐怖需求，这个需求不仅体当今历练、优化 AI 大模子上，更是跟着用户数目的增长飙升。生成式 AI 不错说是东谈主类少有的，从出现到普及耗时最短的前沿科技，现如今每一个接入互联网的东谈主，齐不错通过看望通义千问等网站来使用生成式 AI。

图源：通义千问

精深的需求催生了数目繁多的数据中心，然而也让一部分东谈主对此产生猜疑：为什么要聘用 GPU 而非 CPU 来搭建 AI 数据中心？

GPU 最初的筹谋用途是图形渲染任务，这决定了其需要更刚劲的并行任务处理才调。以游戏为例，当你在游戏中看到一个箱子，内容上你看到的是一个由大齐三角形组成的 3D 模子，如若你玩过早期的 3D 游戏，那么你细目会对游戏中"棱角分明"的扮装有着深化印象。

图源：推特

内容上，这个问题等于因为早期的 GPU 算力不及，只可进行百位数的三角形运算，无法知足构建「光滑」模子的条款。跟着 GPU 的运算性能加强，当咱们不错在一秒的时候里渲染出千万级的三角形并组成 3D 模子，那么在游戏玩家的眼中，这个模子就有着相当真确的视觉遵循，也等于「拟真级」缜密建模。

因为需要处理的任务简便（生成三角形并着色），然而任务数目却相当多（千万级），导致 GPU 成为一个偏科生。论对单个数据的处理才调，GPU 与 CPU 的对比就像是小婴儿与大学生，离别在于 GPU 是上千万个"小婴儿"的汇集，而 CPU 则是几十个大学生的汇集。

当咱们需要推论一个将 1000 万个"三角形"从左边搬动到右边的任务时，GPU 和 CPU 谁的遵循会更高？GPU 的并行计较才调，亦然其好像处理复杂 3D 模子渲染的要道。

而在生成式 AI 降生后，东谈主们发现 GPU 的并行计较才调，远比 CPU 要更妥贴进行 AI 运算，其中的原因则与 AI 大模子的底层结构关系。天然在咱们的眼中，AI 大模子证实数据集群的不同，不错生成翰墨、丹青、音乐等各式类型的限度，然而在内容运算中，所非常据其实齐以一种款式存在—— Token，也等于「最小语义单位」。

当你输入一段翰墨时，应用身手会将翰墨拆解为更难仆数的 Token，然后再丢到处理中枢中进行计较。这个过程是否很眼熟？没错，总共逻辑与 GPU 渲染一个箱子其实是一样，将一个任务拆分红大齐的小任务，然后证实 AI 模子的逻辑推理来整合限度并输出谜底。

不错说，在 AI 期间的数据中心里，GPU 等于总共 AI 算力矩阵的中枢，其热切性要远远卓越 CPU，而掌执着着手进 GPU 的厂商，将成为半导体范围的无冕之王。

在目前的 AI 阛阓中，大多数东谈主齐认同一个不雅点：英伟达等于 AI 算力的代名词。非论是每秒不错进行数十万亿次浮点运算的 H100，照旧目前最强的糜费级 AI 显卡 RTX 4090，齐让英伟达成为生意范围和糜费范围无可争议的 NO.1。

异常是在糜费范围，英伟达仍是成为个东谈主 AI 计较机的唯独聘用，其背后的原因等于英伟达的「杀手锏」—— CUDA。CUDA 是由 NVIDIA 设备的并行计较平台和编程模子，他的作用是允许设备者利用英伟达 GPU 的刚劲并行计较性能来推论通用计较任务。

图源：英伟达

看完上一章节的一又友，计算会有点蒙，为什么要用 GPU 来推论通用计较任务？这不是 CPU 的使命吗？没错，通用计较任务如实是 CPU 的矍铄，然而俗语说得好：三个臭皮匠，顶个诸葛亮。当 GPU 的并行算力刚劲到一定进程，那么只好有一个不错进行任务调理的模子，就不错将 GPU 算力行使在通用计较任务里。

与此同期，英伟达还为 CUDA 提供了丰富的用具和库，以及各式运算模子，让使用英伟达 GPU 的设备者不错大幅度省俭设备时候，况兼更好地领略 GPU 性能。恰是利用 CUDA 对并行算力的垄断，使得英伟达 GPU 不错在个东谈主电脑里灵验推论各式通用计较任务，为用户提供足以赞助腹地 AI 大模子部署的 AI 算力。

那么 AMD 就莫得雷同的用具吗？其实是有的，名为 ROCm，ROCm 的前身 Radeon Open Compute 其实早在 2016 年就仍是发布，主要用于通用 GPU 计较（GPGPU）、高性能计较（HPC）和异构计较等范围。然而因为短少弥散的赞助，是以生态范围远远无法与 CUDA 比拟，而在生成式 AI 爆火之后，AMD 很快就意志到了 Radeon Open Compute 的热切性，将其改名为 ROCm 并插足大齐的资源进行更新。

图源：AMD

当作一个 AMD 显卡用户，其着实昔日的两年里是不错彰着感受到 AMD 在 AI 范围的最初，也曾只可通过转译状貌启动腹地 AI 模子的 AMD 显卡，如今仍是不错借助 ROCm 的用具，杀青原生腹地 AI 模子部署和运算，遵循和算力齐有着质的变化。

天然还无法与 CUDA 比拟，然而仍是让东谈主看到了几许的但愿，更何况从价钱上来说，性能邻近的 AMD 显卡价钱往往只好英伟达显卡的 80% 致使 70%。这也意味着 AMD 只好不错管理通用计较模子的问题，那么就不错为个东谈主及袖珍企业提供更具性价比的聘用，吃下异常一部分 AI 显卡阛阓。

不外在 ROCm 训诲之前，英伟达齐仍然会是糜费级 AI 阛阓的最好聘用。

与糜费级阛阓不同的是，AMD 在劳动器阛阓的增长却十分迅猛，Data Center Dunamics 的数据裸露，2024 年第一季度，AMD 的数据中心业务创下里面收入的新记载，同比增长达 38%。而在第二季度，AI 劳动器的出货量同比增长 41.5%，占举座出货量的 12.2%。

天然从举座的阛阓份额来看，英伟达仍然占据着 90% 以上的阛阓，然而 AMD 也并非唯独的挑战者。

谷歌前段时候推出的 TPU（Tensor Processing Unit）芯片就特意用于加快机器学习和深度学习任务，选定 Arm 架构筹谋，在性能和能效上齐有出色发达，仍是被行使在谷歌的多项 AI 劳动中。

而英特尔则是通过收购 Habana Labs 拿到了 Gaudi AI 加快器，辘集新一代至强处理器的 AI 加快功能，紧密布局 CPU AI 范围。这个阛阓的范围相通不小，因为并非所非常据中心齐以 AI 为中枢应用，新一代 CPU 数据中心不错更好地兼顾通用型计较任务和 AI 计较任务，减少重叠建树数据中心的资本与珍爱花销。

此外，英特尔也一直在善良搬动 PC 的 AI 需求，这是英伟达目前最为颓势的阛阓，因为英伟达 GPU 天然有着出色的 AI 算力，代价却是极高的功耗，无法知足搬动 PC 的长续航条款，这就为英特尔等厂商留住了可乘之机。

在本年的 IFA 上，英特尔就推出了内置新一代 NPU（AI 加快中枢）的酷睿 Ultra 200v 系列处理器，提供刚劲算力赞助的同期还兼顾了长续航等条款，与高通等新一代 Arm PC 处理器在 AI PC 阛阓张开横暴争夺。

短时候来看，英伟达在 AI 算力阛阓的上风仍然巨大，然而永久来看，群狼环伺之下的 AI 阛阓，英伟达双拳难敌四手。诸如搬动 PC、智能末端等英伟达的颓势阛阓，很快就会被其他厂商均分干净，而要道的劳动器阛阓也并非安枕而卧，AMD 的 MI300 系列 AI 显卡份额增长飞速，仍是弥散引起英伟达的警悟。

不外，竞争所带来的创新与发展，才是科技最初的要道，跟着 AI 范围的竞争加重，内容上也在股东 AI 资本的下落，让 AI 手艺赢得更快、更日常的应用。终末，我思用吴泳铭先生演讲中的一句话来当作收尾：

乱伦图片

AI 驱动的数字寰球贯穿着具备 AI 才调的物理寰球，将会大幅擢升总共寰球的分娩力，对物理寰球的启动遵循产生创新性的影响。

一个新鲜的寰球swag 肛交，近在目前。

上一篇：情欲湿度中好意思俄国度政府债务差距断崖：俄3168亿，好意思35万亿，中国令东说念主有时

下一篇：你好迷人户外胡明轩三分绝杀！媒体东谈主：这即是咱们中国队的新任队长