- 集团网站
- 公司介绍、新闻动态、展会活动等信息
- 消费者业务网站
- 手机,PC和平板等智慧生活产品
- 企业业务网站
- 企业商用产品、解决方案和服务
- 运营商业务网站
- 运营商网络解决方案、产品及服务
- 华为云网站
- 华为云服务及解决方案
选择区域/语言
- Australia - English
- Brazil - Português
- Canada - English
- China - 简体中文
- Europe - English
- France - Français
- Germany - Deutsch
- Ireland - English
- Italy - Italiano
- Japan - 日本語
- Kazakhstan - Қазақ тілі
- Kazakhstan - Pусский
- Kenya - English
- Korea - 한국어
- Malaysia - English
- Mexico - Español
- Mongolia - Mонгол
- New Zealand - English
- Netherlands - Nederlands
- Poland - Polski
- Romania - Română
- Russia - Pусский
- Singapore - English
- South Africa - English
- Spain - Español
- Switzerland - Deutsch
- Switzerland - Français
- Switzerland - Italiano
- Switzerland - English
- Thailand - ภาษาไทย
- Turkiye - Türkçe
- Ukraine - Українська
- United Kingdom - English
- Uzbekistan - Pусский
- Uzbekistan - O’zbek
- Vietnam - Tiếng Việt
- Global - English
如何定义一个好的开发者生态?
当高校学生开发者想投身人工智能前沿,却面对复杂的工具链条无从下手;当科研开发者正攻坚世界级课题,却受限于基础算力;当企业开发者面对汹涌的“AI+”浪潮,但随时忧虑可能“断供”的工具链……
曾几何时,“欲渡黄河冰塞川,将登太行雪满山”,正是算力开拓初期的写照。而经一代代人的耕耘,中国算力体系如今已蔚然成型:通用计算领域,鲲鹏专注数据中心、云计算和边缘计算;智能算力领域,昇腾专注深度学习训练与推理。底层基建的技术追赶已破局,下一个关键是构建繁荣的“生态”。
生态资源能否“拿来就用”?能否与生态共同成长?能否基于生态创造未来?这些年,鲲鹏、昇腾致力于回答构建完善生态的“灵魂之问”,也见证了众多开发者与理想相遇,共赴人工智能的星辰大海。
高校学生开发者:让“屠龙技”走出象牙塔
“去年底才接触Ascend C语言,没想到半年后就拿了个金奖。”5月23日,昇腾AI创新大赛-算子挑战赛2024年度冠军赛现场,西安交通大学“LPC9033”队摘得桂冠,面对镜头,队员夏玮钧难掩意外与激动。
时间拉回2024年底,大模型技术盛行。作为高性能计算专业学生,夏玮钧敏锐意识到:AI应用产品日渐火爆正推动底层算力需求激增,而算子开发正是决定AI落地效率的命脉之一。但现实挑战显而易见:算子开发在高校仍属偏冷门学科,缺乏专项完整的培养体系;算力资源匮乏,多数高校教学还停留在单卡或小规模集群,难以提供实战环境。恰在此时,昇腾AI创新大赛-算子挑战赛S3赛季的启动,夏玮钧被其“边学边赛”“以赛促学”的特色赛制所吸引,便和队友便抱着试试看的心态报了名。
起初,团队担心在全新平台上挑战算子开发这样的高门槛领域会难以入手,但赛事方乃至整个昇腾生态的支持都远超预期。他们接触到了覆盖“学、练、训、考、赛”全生命周期体系的昇腾社区——借助社区从基础到高级的线上课程体系,夏玮钧快速实现了从入门到熟练的转变;社区丰富的阶梯式在线实验,又让他能按规划路径稳步提升技能,并通过获取微认证记录学习轨迹。
夏玮钧结合自己在昇腾社区的学习实践体验,深有感触道:
“算子开发比较特殊,有的开发者光有课程没实践,有的学完了没法验证成果,有的干脆连算力环境都不具备,只能停留在理论阶段,而昇腾体系可贵之处,就在于它的‘全’。”
此外,社区定期举办的技术沙龙和直播课程,也让他颇为关注。对于普通高校学生而言,密集接触专家的机会是难得的,而社区直播课的讲解嘉宾均为各行各业的专家学者和产业资深开发者,他们对技术细节的抽丝剥茧和实战经验分享,细致且实用。夏玮钧正是将这一渠道作为更高维度的技术指导,快速熟悉了CANN架构、Ascend C语言和TBE算子开发框架等工具。
掌握了基础知识后,夏玮钧全身心投入赛前集训。通过赛事官网,他系统学习了算子开发的主流解法,借鉴历届成果,持续精进学习、优化技能。同时,昇腾论坛上丰富的讨论话题如同一个大型研讨室,汇聚着众多经验丰富的开发者、布道师甚至从业人员。每当遇到算子开发难题,他总能在这里第一时间获取有效指导。在技术沙龙和直播课程中,和产业一线人员的直接接触,弥补了校园环境下产业启发的不足,助力了他的学习进一步升级。
在夏玮钧看来,自己最大的收获,就是全面接触了以昇腾软硬件为代表的自主创新算力体系,并如愿成为具备算子开发能力的学生开发者,叩开了理想的大门。他透露,获得昇腾体系认证之后,还想接棒成为校园布道师,让更多人掌握这门“赛博手艺”。
青年科学家的“火箭梦”:鲲鹏成为破解航天的最优方程
算力生态进校园,受益的不仅是学生开发者,还有高校科研老师。
近年来,AI for Science蓬勃发展,高校已成为科研创新的重要阵地。科研老师们渴望通过人工智能加速自身研究方向的突破,产出国家级甚至世界级成果,实现“科研报国”的远大理想。随着全国多所高校鲲鹏昇腾科教创新卓越中心与孵化中心的落成,鲲鹏、昇腾算力的支持让多领域科研成果如雨后春笋般涌现。北京大学北京科学智能研究院的陈帜正是其中的受益者,他正马不停蹄的实现着自己的“火箭梦”。
陈帜的研究聚焦流体力学与燃烧动力学,具体应用在航空级发动机领域。他的团队理想是为火箭“心脏”塑形——“从全球视角看,火箭发动机的研发如果能借助工业仿真软件,模拟流体力学、燃烧、传热等一系列物理过程,实际试车次数至少可减少50%。”
陈帜多次强调工业仿真软件对商业航天的重要性:
“马斯克的SpaceX公司为什么能走在世界前列,就是因为背靠美国领先的AI for Science体系,以及对工业仿真软件的深度运用。”
面对指数级增长的计算任务,如纳秒级燃烧模拟、复杂流体/燃烧动力学,传统科研计算已显乏力。而AI技术,尤其是深度学习,正引发科研计算的范式变革。陈帜正是看中了鲲鹏算力体系的高性能集群:它能快速执行分析与模拟,是AI for Science的理想平台。加之航空航天产业对全流程自主算力的固有需求,成为了双方达成合作的关键推力。在鲲鹏处理器的通用计算能力的支持下,陈帜团队的燃烧动力学计算取得了2~3个量级甚至更高的加速,相比传统方案提速1000倍。
除算力外,陈帜还获得了鲲鹏更全面的生态支撑。以团队训练的计算燃烧模拟AI模型为例,因推理效率欠佳,模型需要持续优化——这是一个软硬件结合的复杂工程,过程中需运用人工智能框架、计算稀疏稠密调整、优化高性能计算工具等。依托北京大学鲲鹏昇腾科教创新卓越中心提供的算力环境,以及鲲鹏社区的技术支持,陈帜团队攻克了算力分配、计算效率、算子开发等难题,实现了工业仿真软件模拟流体力学、燃烧与传热的突破。
2025年中关村论坛年会上,北京科学智能研究院正式发布DeepFlame Rocket,这是首个集成AI框架、用于反应流高精度数值模拟的高性能、大规模开源软件平台。它不仅能定位火箭发动机潜在的结构隐患,还能为优化设计提供宝贵建议,性能较传统方案提升数百倍。北京商业航天企业蓝箭航天所研发的朱雀二号遥二火箭,其天鹊发动机的迭代改进便依托于DeepFlame Rocket平台的支撑。DeepFlame V1.6也已完成重要升级:新增了稳态求解器dfSteadyFoam以拓展工程应用场景,显著提升了热力学建模的灵活性,支持显焓计算选项和独立于Cantera的温度求解能力。
而DeepFlame的高效能,离不开鲲鹏平台的深度优化:通过从x86到ARM架构的无缝迁移实现高效适配;借助鲲鹏特有的矩阵加速单元和高带宽内存架构,为核心运算注入硬件级加速;优化多线程任务调度、线程绑核与资源隔离,有效规避核间竞争,最终在神经网络推理和求解器核心计算部分均实现性能跃升,为平台在高性能计算环境中的高效运行提供了强大支撑。
陈帜认为,产学研融合与人工智能的交叉赋能,是AI for Science的必然趋势。完善的鲲鹏生态提供了技术与资源支持,为他的研究方向奠定了坚实基础,让科学智能的理想从探索小径,通向浩瀚宇宙。
从“科研报国”的宏大志向,到“学以致用”的具体目标,勾勒出高校开发者在鲲鹏、昇腾生态体系中追求的理想图景。曾因巨额成本、高技术门槛和资源匮乏而难以落地的人工智能技术,如今在鲲鹏、昇腾生态的支持下,让科研工作者与学生可以跳出实验室,追逐“学有所用”的远大理想。
企业开发者同行:代码为舟,共赴极致性能彼岸
技术的价值,终究要在现实的土壤中扎根生长。
当恒安嘉新的核心研发专家陈国喜第一次望向搭载100G网卡的鲲鹏服务器样机时,他感受到的不仅是高性能计算新纪元的开启,更有技术人骨子里对性能极致追求的兴奋与挑战欲。对于肩负公司核心DPI技术研发的陈国喜而言,将产品从x86平台迁移到鲲鹏架构,只是“万里长征”的第一步。他的目标更纯粹也更“贪婪”:“榨干每一分性能潜力。”
这条优化之路,充满了对细节的较真。他带领团队扎进鲲鹏的架构底层,从NUMA亲和性的精妙调度,到缓存层级的深度理解,再到特定SIMD指令的高效挖掘,如庖丁解牛般剖析着这颗“芯”的潜能。每一次性能瓶颈的定位,都离不开鲲鹏技术支持团队的精诚协助。在华为指导下,团队熟练运用性能分析工具套件精准定位热点。陈国喜说,那种抽丝剥茧、直击要害的感觉,是技术攻坚最纯粹的快乐。从BIOS参数的深度调校,到指令预取的优化,再到内存访问模式的重构,以及编译器选项的精挑细选,一场覆盖硬件、系统、软件的全流程调优战役,早在无声中预言了胜利。
一次深夜的经历,让陈国喜对鲲鹏生态的技术基因有了更深切的体悟。当时鲲鹏生态经理刘继周临时造访,谈及团队正攻坚的哈希性能瓶颈,两人瞬间进入忘我状态:没有寒暄,只有屏幕上滚动的代码行,逐行分析、查看汇编输出、探讨业务场景下的最优解。“刘经理当场就上手写Demo验证想法!”陈国喜的语气中满是敬佩,那句“鲲鹏生态经理必须懂技术、懂代码”,让他看到了华为团队骨子里对技术的敬畏。技术人最幸福的事,大概就是遇到能接住你每个“为什么”的同行者。这种以码为桥、并肩作战的深度交流,令陈国喜笃信:鲲鹏生态背后,正是实打实的技术同行者。这份基于技术实力的信赖,远比任何承诺都来得坚实。
汗水浇灌的种子,终在赛场上绽放硕果。2023年鲲鹏应用创新大赛,陈国喜团队带着深度优化的“鲲鹏一体机”方案出征,一举斩获运营商赛道北京赛区一等奖,并最终问鼎全国总决赛银奖。方案在鲲鹏平台上的高效稳定运行,成为对技术突破最响亮的证明。随后,2024年KADC大会上,陈国喜个人荣膺“企业优秀开发者”称号,其所在公司恒安嘉新也捧回了“最佳应用软件奖”。荣誉接踵而至——2025年,他们凭借鲲鹏平台规模化落地的扎实实践,再获“优秀实践奖”。
回望这段“鲲鹏之旅”,陈国喜的收获远超预期。从2022年主持鲲鹏优化工作起,每一步推进都印证着技术突破的价值:从调优的实践摸索,到深入理解计算机体系结构的精髓,再回归到产品的高效交付,形成了由浅入深、化繁为简的认知闭环,这是技术人真正的成长。而与华为技术、生态、研发团队紧密的协作,亦是攻坚克难的利器,也让他收获了志同道合的伙伴。如今,他期待与鲲鹏基础软件研发团队在前沿领域展开更紧密合作,更愿分享宝贵经验,赋能更多合作伙伴。以技术人的赤诚反哺生态,帮助更多伙伴加速上“鹏”。
技术人之间因纯粹代码与性能追求而产生的共鸣,在鲲鹏、昇腾生态中并非孤例。
在互联网巨头的AI腹地,京东集团股份有限公司推荐训练领域优化专家张晓天,同样在昇腾NPU的算力浪潮中,找到了打破算力边界的最优解:“昇腾NPU的异构算力,让我看到打破传统GPU算力垄断的新可能”。
推荐系统与广告计算是AI算力消耗的大户,性能与效率的平衡如同走钢丝般微妙。2021年,京东启动AI训练基础设施创新时,昇腾NPU强大的异构算力,让张晓天看到了新的可能。然而,将京东核心的CTR框架迁移到昇腾平台,绝非易事。海量的稀疏特征、复杂的模型结构,对算力架构提出了严苛挑战。张晓天的目标清晰而坚定:实现性能无损和简单易用的NPU化迁移。这背后,是对技术自主与业务韧性的双重追求。
以“架构革新突破推荐系统的算力边界”为目标,张晓天团队创新研发了单/双层NPU-PS混合架构——其兼容Remote PS模式,在千亿级参数的场景中将通信开销压缩了40%,一举击破了传统参数服务器在NPU集群的扩展瓶颈。算力边界的突破需要在算子层面精雕细琢。团队研发了NPU高效查表与梯度聚合算子,通过重构内存布局、深度优化通信模式,使稀疏计算效率提升超30%。这每一分提升的背后,都凝结着对昇腾处理器特性理解的深化。坚持“让技术适配业务,而非业务迁就技术”的理念,张晓天团队完成了MMOE、DLRM等10余款主流推荐模型的昇腾适配,支撑了京东在离线全场景分布式训练的需求。
技术攻坚的征途上,同样闪耀着深度协作的火花。一次双塔模型的昇腾化关键优化令张晓天印象深刻。凌晨三点,他与昇腾架构师并肩攻关,眼前铺满性能图表。最终,他们精准锁定瓶颈——NPU片上Uniq算子的执行效率。没有推诿,唯有共赴专注。双方协作改进了执行策略,将其前置并通过流水掩盖技术,巧妙地“藏”起了算子的执行时间。键盘声伴随着思维的碰撞,当训练速度最终追平甚至局部超越了GPU基准时,疲惫已被巨大的成就感取代。技术难题面前,昇腾架构师展现出的专业素养和并肩作战的诚意,是信任的基石,也是成果突破的催化剂。
京东商城部分推荐模型成功迁移至昇腾平台,训练成本显著降低25%。这不仅意味着经济效益,更在算力版图上嵌入了安全可靠的“芯”力量。2025年KADC大会上,张晓天荣膺“优秀开发者奖”,这是对他及团队在昇腾生态中贡献与成就的行业认可。张晓天表示,团队将持续输出京东在推荐领域的NPU优化经验,与华为共建推荐系统NPU化技术标准,推动行业普惠。
以代码为语言,以性能为标尺,张晓天的未来蓝图更加清晰:与昇腾基础软件团队深化合作,探索新一代NPU-NPU直连架构,直击超大规模稀疏模型训练的通信瓶颈;结合昇腾AI异构算力与京东丰富场景,探索生成式架构的超大参数模型训练,打造更精准智能的个性化推荐引擎。
企业开发者是技术价值落地的关键引擎,更是连接创新与产业的中坚力量。在“鲲鹏展翅,昇腾万里”的愿景下,早已涌现出千千万万个“陈国喜”“张晓天”——他们与华为并肩同行,凭借对技术的极致追求,共同在中国计算产业深水区劈波斩浪。
让技术的理想,在产业的土壤里,绽放出最鲜活的花。
开源贡献:起于“一草一木”,共建“热带雨林”
“想在热带雨林摘果子,得先把这片树种起来。开源就像每个人都在深耕自己的一草一木,最后一定是全体受益。”西北工业大学软件学院副教授徐韬如此描述开源的价值。作为很早就意识到人工智能重要地位的高校教研人员,“自主创新”已成为他的内在基因。
他的研究方向是通过AI赋能人机交互和脑机交互,对情感与认知行为进行判断,主要应用于教育、医疗等对人本理解要求极高的领域。徐韬的理想在于攻破大脑的奥秘,推动脑科学研究再上新台阶,同时也把更多人从心理疾病的“黑洞”中解救出来。
但实现该目标,既需要领先的计算性能支撑,又需要更高的能力适配底层平台。这门研究涵盖多传感器信号融合——从脑电、眼动、声音等感知维度,完成从神经到代码的转化这个复杂的过程。徐韬强调:“越复杂的AI系统,越容易受木桶理论影响,出现牵一发而动全身的局面。”
尤其是算子,决定了人工智能模型和应用的效率。徐韬举了个很形象的例子:“算子就像AI引擎中的零部件——优化算子,好比给1.4升的发动机装上了涡轮,既发挥出2.0T的性能,还更省油。”但是早期国内算子开发效率不能满足徐韬的研究需求,加之他始终想拥抱自主创新算力体系以避免断供等风险,昇腾平台“开源共建,汇聚更多开发者共筑国产AI生态根基”的全新理念,恰与徐韬的想法不谋而合。
徐韬在谈及选择昇腾生态的核心考量时坦言:
“很多‘AI+’的研究都对算力底座有高要求,无论是从我的研究方向还是行业长远发展来看,都希望能为它的建设出一份力,加入昇腾生态,是水到渠成的选择。”
从2020年起,徐韬团队开启对算子开发“从0到1”的探索:短时间内自主开发并贡献了近30个高性能算子,成为国内最早向昇腾CANN平台提供多项核心支持的高校团队之一,该成果大幅提升了昇腾处理器在复杂AI任务中的计算效率。团队还在异构优化方面突破算子调度、内存复用等关键技术,成功将语音交互与大模型结合迁移至昇腾低算力平台。相关技术将应用在某重点型号示范项目,同时开源的10个MindStudio教学案例和3个示范应用,获华为“昇腾金质量奖”等多项认证,开创了高校科研力量与科技企业深度合作的新模式。
这些成果迅速反哺徐韬的研究:团队结合底层算子能力与多模态AI方法,开发出智能抑郁症初筛系统。该系统通过眼动追踪、语音识别和文本分析等多维数据,模拟医生诊断逻辑,评估个体潜在抑郁风险,并已在西安交通大学第一附属医院落地应用。
徐韬的故事折射出一个鲜明趋势:开发者正从技术体系的“使用者”转变为AI大生态的“共建者”。他们通过开源生态参与到技术底座的建设,贡献一草一木,形成热带雨林。在实现自给自足正循环的同时,也让自身业务或研究有了坚实支撑,从而走得更快、更稳、更安全。徐韬也期待更多开发者和科研工作者加入,共同投身中国AI的源头创新。
生态赋能:打造计算产业的“飞轮”
目前,鲲鹏和昇腾生态已汇聚超665万开发者、8800余家合作伙伴,完成23900余个解决方案认证。其中,鲲鹏通过硬件开放与软件开源战略,构建了覆盖数据中心到边缘场景的完整生态,并正式发布面向AI时代的“鲲鹏AI+解决方案”;昇腾则形成从底层架构到行业落地的全链条革新,让算子开发更简单、应用部署更便捷、模型训练和推理更高效。生态的持续繁荣,让开发者日益成为时代发展的决定性力量。
回到最初的问题——一个好的开发者生态究竟是怎样的?鲲鹏、昇腾已经找到了答案:在全球以AI之力竞逐“弯道超车”的机会之年,鲲鹏、昇腾正致力于通过全面开放的软硬件平台,倾注一切资源和力量降低技术门槛,加速开发者成长与创新——为中国开发者打造一片自由创造的沃土,让每个人的理想种子都能生根发芽。
正如Linux之父Linus Torvalds所言:“好的生态不是控制开发者,而是让他们自由创造你从未想象过的东西。”
- 标签: