Recherche & Innovation
Huawei croit fermement à l'émergence d'un monde intelligent, porté par les progrès en matière d'IA. Cette conviction nous amène à concentrer nos efforts d'innovation sur les activités stratégiques et à redoubler d'efforts pour réaliser des percées dans l'application des théories fondamentales, afin d'assurer notre réussite et celle de nos clients, aujourd'hui et demain. Ce faisant, nous continuerons à renforcer l'avantage concurrentiel de nos produits et solutions pour l'ère de l'intelligence, et à servir nos clients au mieux de nos capacités
Recherche fondamentale : concentrer l'innovation sur les activités stratégiques et redoubler d'efforts pour réaliser des avancées majeures dans l'application de la théorie fondamentale
Algorithmes et applications d'IA :
- Pour pallier le coût de calcul élevé de l'échantillonnage en plusieurs étapes, nous avons proposé un algorithme d'optimisation de l'échantillonnage guidé par l'apprentissage par renforcement. Cet algorithme permet d'équilibrer l'efficacité et la qualité de la génération pour les modèles de diffusion multimodaux. La génération de vidéos et d'images est désormais cinq fois plus rapide, avec une perte de précision inférieure à 1 %.
- Pour une meilleure accélération de l'inférence LLM sur appareil, nous avons proposé une technique de distillation augmentée par l'apprentissage par renforcement. Grâce à une architecture de décodage spéculatif intégrant à la fois la recherche arborescente et l'acceptation assouplie des tokens, cette nouvelle technique a doublé le débit d'inférence de Celia Auto-answer tout en conservant le même niveau de précision.
- Dans les scénarios de longue traîne (long tail en anglais), les échantillons sont généralement clairsemés, tandis que la collecte de données souffre d'une faible efficacité. De plus, la modélisation générative de bout en bout dans des espaces perception-action de haute dimension constitue un défi en soi. Pour relever ces défis, nous avons introduit un World Engine basé sur le cloud et un World Action Model embarqué pour les véhicules. Ceux-ci ont considérablement renforcé les capacités de conduite intelligente de HUAWEI ADS 4, facilitant son déploiement sur plus d’un million de véhicules.
Technologies de communications et applications
- Le MIMO massif nécessite d'énormes ressources de calcul. Cependant, en adoptant une approche d'optimisation itérative avant-arrière, nous avons surmonté ce défi. Cette approche nous permet de faire un grand pas en avant dans la recherche d'une représentation de matrice de haute précision dans des espaces à très faible précision, réduisant ainsi la complexité de calcul matriciel des émetteurs-récepteurs d'environ 50 %.
- Nous avons également développé une théorie de conception d'opérateurs approximatifs basée sur la confiance afin de réduire la complexité de calcul des réseaux de prédistorsion numérique (DPD) d'environ 20 %.
- Les interférences des signaux Wi-Fi et la forte consommation électrique des puces des systèmes 50G PON constituent un casse-tête majeur pour l'industrie. En réponse, nous avons mis au point une architecture d'annulation d'interférences multi-niveaux et auto-adaptative, ainsi qu'un algorithme de basculement de bits dynamique et auto-adaptatif. Ces solutions nous ont permis de réduire la consommation électrique du système d'environ 10 % sans blindage électromagnétique.
Innovation ouverte : priorité donnée aux besoins des clients et à l'amélioration de leur compétitivité
La puissance de calcul étant au cœur du développement de l'IA, Huawei s'est attelé à l'amélioration de ses solutions SuperPoD et de clusters de calcul afin de répondre à une demande en constante augmentation :
- Publication de la feuille de route de nos produits SuperPoD, à savoir l'Atlas 950 SuperPoD et l'Atlas 960 SuperPoD. Ceux-ci intégreront respectivement jusqu'à 8 192 et 15 488 unités de traitement de réseaux neuronaux (NPU) Ascend, et se démarqueront sur tous les fronts, notamment en termes d'indicateurs clés tels que le nombre de NPU, la puissance de calcul totale, la capacité de mémoire et la bande passante d'interconnexion.
- Intégration de la fiabilité à chaque couche d'interconnexion et mettre au point une architecture peer-to-peer ainsi qu'un protocole unifié – UnifiedBus 1.0, centré sur la sémantique de la mémoire – afin de garantir une longue portée, une fiabilité élevée, une bande passante élevée et une faible latence. Cela permet également de mettre en œuvre un adressage de mémoire unifié, une latence ultra-faible de l'ordre de 100 nanosecondes et une bande passante de l'ordre du téraoctet, faisant ainsi des SuperPoD à grande échelle une réalité.
- Lancement en septembre 2025 d'UnifiedBus 2.0, une solution d'interconnexion pour les SuperPoDs, et publication des spécifications techniques afin de faire progresser à la fois la technologie d'interconnexion et le secteur.
Communications sans fil
Pour nous préparer à l'ère de l'IA mobile, nous embrassons le changement grâce à la convergence technologique et mettons en place une infrastructure réseau solide. Dans cette optique,en 2025, nous avons :
- Surmonté le goulot d'étranglement lié à la congestion des pilotes de canal à haute dimension dans le T-MIMO à ondes centimétriques en tirant parti d'une propagation quasi stationnaire et de mesures granulaires du domaine spatial tenant compte du contexte. Cela garantit une amélioration d'environ huit fois de l'efficacité spectrale.
- Utilisé un module RF (radiofréquence) passif intégré pour les T-Cells à ondes millimétriques et est devenue la première entreprise à mettre en œuvre l'accès multiple par répartition en fréquence (FDMA) sous-bande. Cela booste considérablement les stations de base, leur permettant de gérer facilement un trafic de données intense provenant d'un grand nombre d'utilisateurs simultanés.
- Proposé une approche entièrement nouvelle pour la désactivation synchrone sur l'ensemble du réseau et sur toute la bande, afin d'obtenir des intervalles de temps à consommation énergétique nulle, ainsi qu'une configuration de la consommation énergétique à plusieurs niveaux pour une planification affinée. Cela réduit la consommation d'énergie de près de 50 % tout au long du processus.
- Continué à faire progresser les réseaux centraux alimentés par l'IA générative en utilisant la technologie multi-agents, associée aux capacités intégrées de détection et de communication des ondes centimétriques. Cela nous permet de personnaliser les réseaux à la demande pour l'IA embarquée et l'IA intégrée, tout en améliorant l'expérience de connectivité sans fil.
Réseaux optiques
Nous avons :
- Réalisé des avancées décisives dans la détection, la suppression et la compensation des dégradations des liaisons optiques, ainsi que dans la mise au point d’une nouvelle architecture de décodage dynamique avec correction d’erreurs sans voie de retour (FEC), en nous concentrant sur le mécanisme de la source lumineuse, les canaux à fibre optique et les algorithmes. Cela permet une interconnexion optique hautement fiable et à faible consommation d’énergie entre les datacenters.
- Ouvert la voie à un certain nombre de technologies clés telles que la communication laser dans l'espace, les antennes optiques à diffraction limitée et l'acquisition, le suivi et le pointage (ATP) de haute précision. Ces avancées nous permettent de réaliser un suivi et une acquisition inter-satellites rapides et de haute précision, et de prendre en charge une communication laser en espace libre stable.
Réseaux
Nous continuons à améliorer les performances des communications à grande échelle pour les SuperPoD et les clusters :
- Nous avons développé le premier algorithme de contrôle de congestion au niveau des messages (MCC) du secteur, basé sur les informations relatives aux ensembles de chemins, afin de répondre aux besoins de débit élevé dans le cadre de l'entraînement et de l'inférence sur des clusters à grande échelle. Cet algorithme nous a permis de surmonter les difficultés liées à la congestion multipath et par paquet, et d'améliorer le débit de communication de 25 % à 50 %.
- Nous avons créé la première architecture de communication parallèle du secteur pour les plans de données et de signalisation de contrôle. Cela permet d'obtenir une faible latence pour l'inférence par mélange d'experts (MoE) pour les SuperPoD. En réduisant la charge liée à la synchronisation et à la préservation de l'ordre, l'architecture raccourcit le temps d'achèvement des communications collectives de 10 % à 30 %.
Equipements grand public
Dans ce domaine, nous restons à la pointe de l'innovation technologique et du savoir-faire, qu'il s'agisse des matériaux ou de l'architecture, des réseaux terrestres ou satellitaires, des applications connectées ou intelligentes, ainsi que de l'éclairage et des couleurs. Plus précisément, au cours de l'année écoulée, nous avons :
- Lancé le premier double téléobjectif commutable du secteur. Cet appareil photo allie à la perfection un grand capteur et un double téléobjectif pour offrir un zoom optique double de 3,7x et 9,4x.
- Conçu un système de charnière de précision avancé à trois segments, avec tenons et mortaises et cames auxiliaires, afin de garantir une expérience de pliage et de dépliage fluide sur nos appareils pliables.
- Intégré à nos ordinateurs portables pliables deux ventilateurs ultra-minces de 3,5 mm et une chambre à vapeur 3D anti-gravité en composite cuivre-acier, garantissant un excellent refroidissement malgré une épaisseur de seulement 7,3 mm à l'état déplié.
- Permis au réseau terrestre de dépasser un débit de liaison montante maximal de 1 Gbps et utilisé une architecture de puce intégrée pour les communications par satellite et cellulaires du réseau satellite, garantissant ainsi une connectivité fluide dans les environnements terrestres et aériens.
- Mis au point une technologie innovante pour les communications d'urgence dans les zones sans couverture réseau. Cette technologie offre une expérience de communication de qualité supérieure dans les environnements terrestres, satellitaires et hors réseau.
- Réalisé une avancée spectaculaire avec notre appareil photo True-to-Color. Grâce à la technologie de balance des blancs locale multispectrale, l'appareil photo prend en charge la balance des blancs au niveau du pixel et fonctionne de manière transparente avec l'appareil photo principal, l'appareil photo ultra grand angle et le téléobjectif pour offrir une précision des couleurs à couper le souffle et garantir que chaque teinte soit fidèle à la réalité dans des scénarios à sources lumineuses multiples.
- Utilisé l'IA pour booster l'esthétique computationnelle et le calcul graphique, offrant ainsi des expériences multimédias intelligentes telles que les styles personnalisés, les vidéos instantanées dans la galerie, les effets visuels immersifs de champ lumineux et l'accélération du rendu 3DGS.
- Repoussé les limites de l'IA grâce au déploiement de modèles intégrés aux appareils, permettant ainsi de proposer des expériences plus intelligentes telles que la réduction du bruit lors des appels, les résumés d'appels, Celia Brief, les résumés de documents et les recherches IA locales, et rendant Celia encore plus intelligente et performante.
- Achevé l'intégration verticale approfondie du matériel, des logiciels et des puces afin d'obtenir une amélioration des performances de plus de 35 % sur nos téléphones de la série Mate 80 grâce au noyau HongMeng, au compilateur BiSheng et au système de fenêtres du système d'exploitation.
Logiciels de base
Dans ce domaine, nous misons pleinement sur l'IA pour soutenir les capacités logicielles fondamentales indispensables aux infrastructures informatiques hétérogènes de nouvelle génération, et pour aider Huawei à offrir au monde une nouvelle alternative grâce à notre solide base informatique en matière d'IA. C'est pourquoi nous avons :
- Permis au compilateur BiSheng d'améliorer les performances des opérateurs Ascend clés de plus de 20 % grâce à la compilation par affinité microarchitecturale.
- Exploité le kit de développement de mémoire unifiée (UMDK) pour accélérer les communications, aidant ainsi Ascend à se hisser au premier rang en termes de performances d'inférence du parallélisme expert MoE.
- Réalisé des avancées pionnières dans des technologies telles que la reconnaissance et la planification intelligentes, le conteneur optimisé pour les clusters multi-CPU et l'accélération de la compilation sensible aux applications. Sur cette base, notre système d'exploitation openEuler et le compilateur BiSheng ont permis à Kunpeng d'atteindre des performances de pointe dans des scénarios clés.
- ouvert la voie à l'architecture multi-écriture basée sur le pooling pour notre base de données GaussDB. Associée au TaiShan 950 SuperPoD, cette architecture permet une migration fluide des serveurs mainframe et de milieu de gamme pour les systèmes centraux des institutions financières.
Ingénierie R&D
Dans ce domaine, nous avons intensifié nos efforts pour mettre en place des capacités d'ingénierie efficaces et fiables. Au cours de l'année écoulée, cela nous a amenés à :
- Développer un moteur de vérification de bout en bout fiable et traçable pour les calculs en virgule flottante. Ce moteur détecte plus de 90 % des corruptions de données silencieuses sur les NPU, augmentant ainsi considérablement les chances de convergence réussie pour l'entraînement de modèles sur des clusters de calcul à très grande échelle.
- Mettre au point une nouvelle approche visant à améliorer la fiabilité des agents IA alimentés par des modèles de langage à grande échelle (LLM). Fondée sur le langage PDDL (Planning Domain Definition Language), cette approche hautement adaptative est capable d'identifier qualitativement les étapes d'exécution de tâches à risque et d'intercepter 99,9 % des opérations présentant le plus grand risque.
- Repenser l'ingénierie logicielle en veillant à ce que l'IA joue un rôle plus important et plus fiable dans la distribution des requêtes, la génération de code, la révision de code, les tests unitaires, les tests système et la correction des vulnérabilités open source.