0
本文作者:仵粱 | 2025-07-04 10:46:46 |
(文/ 吕栋) 。系统论
“芯片问题其实没必要忧虑,芯片用叠加和集群等办法,问题核算成果上与最先进水平是不必适当的 。”近期,忧虑华为总裁任正非的使用一次揭露发声,增强了社会各界对我国AI开展的系统论决心 。
咱们都知道,芯片我国现已形成了“百模千态”的问题大模型工业 ,有多个大模型走在全球前列 。不必但不管AI工业怎么开展 ,忧虑算力都是使用驱动模型演进的底子动力 。跟着外部技能封闭步步紧逼,系统论国产算力能否担任大用?芯片是否只能做推理而不能做杂乱练习?很多人其实心里没底。
“咱们单芯片仍是问题落后美国一代,咱们用数学补物理 ,非摩尔补摩尔 ,用群核算补单芯片,在成果上也能到达有用情况。”任正非的揭露发声,给国内AI工业吃下了一颗“定心丸”。
带着对国产算力开展的关怀 ,与华为2012实验室的技能专家的做了一次交流 ,咱们了解到 ,昇腾算力不只完成推理功能全球抢先,一起体系稳定性也保持在高水平,能高效训出国际一流的万亿参数大模型。特别是CloudMatrix 384超节点技能,以体系补单点,从堆芯片到拼架构,中心目标比肩英伟达 ,成为我国AI开展的坚实算力底座。
芯片问题为何不必忧虑?
在外部制裁围堵下 ,芯片问题就像“达摩克里斯之剑”相同 ,一向悬在我国工业界头上。特别跟着中美AI竞赛益发剧烈 ,美国一方面极力遏止我国先进芯片制作的才能,另一方面又不断收紧对英伟达高端芯片的出口控制,企图让我国AI工业在“算力囚笼”中止步不前 。
但危中也有机 。职业的开展趋势是 ,当Transformer这样的大型神经网络模型横空出世,万亿参数模型开端呈现 ,对算力和显存的需求呈爆破式添加,单个GPU乃至单个服务器都难以招架,集群算力成为大势所趋,这也给我国用体系办法处理算力窘境带来要害。
说起“体系论”,老一辈我国人或许并不生疏 。钱学森的《论体系工程》,中心思维便是把研讨目标看做一个全体而不是孤立的点,经过全体优化补偿单点落后 。
华为制裁中包围,正是遭到体系工程的启示 。技能专家对表明 ,算力根底设施是杂乱的体系,华为把各个部分打通了 ,在内部组织了算力会战,把华为云 、模型、底座、芯片、硬件工程、根底软件的研制力气集结在一起,跨部门作战 ,深度协同。这样的环境和机制 ,能够发生协同效应和体系工程的整合 ,完成了“大杂烩”技能的有用使用和协同立异。
根据体系工程,华为构建了巨型算力根底设施CloudMatrix 384超节点 ,经过全对等高速互联架构,让384张昇腾卡能够像一台核算机相同作业。它的算力总规划达300Pflops ,是英伟达旗舰NVL72的1.7倍;网络互联总带宽达269TB/s,比英伟达NVL72提高107%;内存总带宽达1229TB/s ,比英伟达NVL72提高113% 。更要害的是,它还能扩展为包括数万卡的Atlas 900 SuperCluster超节点集群,未来能够支撑更大规划的模型演进。
“超节点是杂乱体系 ,单卡的技能目标并不代表体系的效能,咱们‘体系工程’,要到达的是体系最佳,而不是单点最强。处理这些超杂乱体系的问题需求懂理论,如体系论