全面开源开放,共赢昇腾生态
[中国,上海,2025年9月20日] 在华为全联接大会2025期间,华为昇腾计算业务总裁张迪煊发表了“以开发者为中心,加速自主创新,共赢昇腾生态”的主题演讲,宣布CANN技术指导委员会正式成立,并表示昇腾将持续聚焦开发者诉求,围绕昇腾的开放性、易用性和兼容性进行架构升级,并分层解耦、全面开源开放,加速开发者创新。

华为昇腾计算业务总裁张迪煊发表主题演讲
坚持软件开源开放,让开发者用好昇腾
昇腾坚持基础软件开源开放,与业界共创,为了匹配开发者习惯,昇腾与业界开源社区和开源项目展开深度合作,如Triton、PyTorch、vLLM、verl等,并会将新的功能和特性开源到社区,让开发者可以第一时间获取到最新技术。
昇腾通过分层解耦,以支持开发者从模型、算子、内核以及底层资源按需调用。开源底层Runtime能力,开发者可以细粒度调用硬件资源,充分挖掘硬件性能,满足发烧友的极致的需求。在下一代产品,昇腾将同时支持SIMD+SIMT的编程方式,满足不同场景的开发需求。
在加速库能力上,昇腾开源共建昇腾亲和加速库,支撑开发者即取即用。张迪煊表示:“9月底,我们将开源共享内存能力Share Memory,在超节点范围内的所有片上内存可实现资源池化共享,较传统以太网,通信时延大幅降低。”
当前,产学研界在积极探索低精度计算。昇腾创新了HiF8的数据格式并捐献给了全球计算联盟(GCC)。HiF8在传统浮点格式中引入动态点位域,实现指数和尾数的长度灵活可变,精度和位宽更符合实际数据特征,在相同精度下,可覆盖更大的数值表达范围,接近FP16,避免数值溢出。
业界对于推理吞吐和时延的探索永无止境。昇腾将Attention和FFN分离部署,在Attention阶段,由于权重数据并不大,内存能放下更多KV-Cache,所以可以输入更大的BatchSize、更长的Sequence;在FFN阶段,更大的BatchSize也可以充分发挥算力优势,提升整体MFU。基于这种“以通信换内存”的AF分离设计,实现Decode推理吞吐提升50%以上。
本次大会上,CANN技术指导委员会正式成立。张迪煊表示:“9月底,CANN全量算子将开源到GitCode社区,12月领域加速库、图计算、Ascend C、MindIE等软件代码也会陆续上仓,完成昇腾软件全量开源,全球共享,共同定义技术标准和发展方向。我们还将每年投入1500P算力和3万开发板,与全球开发者共创、共享昇腾开源生态。”

CANN技术指导委员会正式成立
硬件开放,共筑全场景坚实算力底座
昇腾坚持硬件开放,基于开放的模组和标卡,使能伙伴打造了200多款硬件产品,满足各场景差异化需求。张迪煊指出:“9月昇腾上市了大模型推理标卡,支撑伙伴打造场景化的大模型应用一体机。明年,我们将新上市Atlas 350标卡、Atlas 550模组和刀片,使能伙伴基于昇腾打造更具竞争力的服务器及超节点,共同构筑坚实的算力底座。”
使能伙伴打造场景化解决方案,加速千行万业走深向实
硬件是基础,应用是关键,昇腾致力于联合软件伙伴打造场景化方案。华为提供高性能的算力平台,并联合大模型伙伴和开源社区,提供昇腾亲和的开源模型和工具,使能伙伴匹配场景开发行业应用。
面向行业,昇腾与伙伴联合定义场景、开发方案、并协同上市、共同拓展,当前昇腾正在联合20多个ISV,面向金融、能源、制造、教育及医疗等行业,打造了信贷报告、电子病例、电力调度、网络安全、教学助手等场景方案。昇腾也将联合伙伴逐步从国内走向海外,提供全球市场拓展支持,共赢全球智能化机遇。
以最新技术培养人才,以创新人才引领产业
人才是创新的源泉。2020年华为联合教育部打造智能基座,把昇腾课程引入高校,加强人工智能的普适教学。去年,昇腾联合国内头部高校,成立了鲲鹏昇腾科教创新的卓越中心和孵化中心,探索高价值科研课题。
开源,不止于代码;开放,不止于态度;开创,更不止于探索。昇腾将持续创新引领,与全球开发者共建、共享、共赢昇腾生态。
2025年9月18-20日,第十届华为全联接大会在上海世博展览馆及世博中心举办。本届大会以“跃升行业智能化”为主题,通过“战略全景-产业技术-生态发展”的三维视角,阐释华为全面智能化战略的最新举措,并发布全新的数智基础设施产品、行业场景化解决方案、开发工具等。欲了解更多详情,请参阅华为全联接大会官网:www.huawei.com/cn/events/huaweiconnect