Ricerca e innovazione
Punteremo tutto sull’AI nell’era dell’intelligenza. Ci impegniamo a creare valore per i clienti, per ottenere anche il nostro successo commerciale, restando guidati dal valore di business e dalle esigenze del mercato. Ciò richiede di concentrare i nostri sforzi di innovazione sui business strategici e di intensificare l’impegno per ottenere svolte nell’applicazione delle teorie di base. Così facendo, continueremo a rafforzare il vantaggio competitivo dei nostri prodotti e delle nostre soluzioni per l’era intelligente e a servire i nostri clienti al meglio delle nostre capacità.
Ricerca di base: innovazione concentrata sui business strategici e maggiore impegno per svolte più significative nell’applicazione delle teorie di base
Algoritmi AI e applicazioni
Per affrontare l’elevato costo computazionale del campionamento multi-step, abbiamo proposto un algoritmo di ottimizzazione del campionamento guidato dal reinforcement learning. Questo algoritmo bilancia efficienza e qualità di generazione per i modelli di diffusione multimodali. La generazione di video e immagini è ora 5 volte più rapida, con una perdita di accuratezza inferiore all’1 %.
Per una migliore accelerazione dell’inferenza dei LLM on-device, abbiamo introdotto una tecnica di distillazione potenziata dal reinforcement learning. Grazie a un’architettura di speculative decoding che integra sia la tree search sia una relaxed token acceptance, questa nuova tecnica ha raddoppiato il throughput di inferenza di Celia Auto-answer mantenendo lo stesso livello di accuratezza.
Negli scenari long-tail, i campioni sono in genere rari, mentre la raccolta dati soffre di scarsa efficienza. Inoltre, la modellazione generativa end-to-end in spazi di percezione-azione ad alta dimensionalità è di per sé una sfida. Per affrontare queste sfide, abbiamo introdotto un World Engine basato su cloud e un World Action Model a bordo veicolo per i veicoli. Queste soluzioni hanno incrementato in modo significativo le capacità di guida intelligente di HUAWEI ADS 4, facilitandone l’implementazione su oltre 1.000.000 di veicoli.
Tecnologia delle comunicazioni e applicazioni
Il Massive MIMO ha una domanda di calcolo enorme. Tuttavia, adottando un approccio di ottimizzazione iterativa forward-backward, abbiamo superato questa sfida. Questo approccio ci porta molto vicini a individuare la rappresentazione di una matrice ad alta precisione in spazi a precisione estremamente bassa, riducendo così la complessità di calcolo della matrice dei ricetrasmettitori di circa il 50 %.
Abbiamo inoltre sviluppato una teoria di progettazione di operatori approssimati basata sul confidence, per ridurre la complessità computazionale delle reti di digital pre-distortion (DPD) di circa il 20 %.
Le interferenze del segnale Wi‑Fi e l’elevato consumo energetico dei chip nei sistemi 50G PON rappresentano un grosso problema per il settore. In risposta, abbiamo portato avanti un’architettura di cancellazione delle interferenze multilivello e auto-adattiva, insieme a un algoritmo di bit-flipping dinamico e auto-adattivo. Queste innovazioni ci hanno aiutato a ridurre il consumo energetico del sistema di circa il 10 % senza schermatura elettromagnetica.
Innovazione aperta: focus su esigenze di mercato e valore di business per una migliore competitività e maggiore valore per i clienti
Computing
Poiché il calcolo è centrale per lo sviluppo dell’AI, Huawei ha lavorato con impegno sulle nostre soluzioni SuperPoD e cluster di computing, per rispondere a una domanda di calcolo in costante crescita. Questo ha incluso:
- Pubblicazione della roadmap dei nostri prodotti SuperPoD future-oriented, ovvero Atlas 950 SuperPoD e Atlas 960 SuperPoD. Questi offriranno fino a 8.192 e 15.488 neural network processing unit (NPU) Ascend rispettivamente e saranno all’avanguardia su tutti i fronti, inclusi indicatori chiave come numero di NPU, potenza di calcolo totale, capacità di memoria e banda di interconnessione.
- Integrazione dell’affidabilità in ogni livello di interconnessione e definizione di un’architettura peer-to-peer e di un protocollo unificato – UnifiedBus 1.0 centrato sulla memory semantics – per garantire lunga distanza, alta affidabilità, alta banda e bassa latenza. Questo aiuta anche a realizzare un indirizzamento di memoria unificato, una latenza ultra-bassa a livello di 100 nanosecondi e una banda nell’ordine dei terabyte, rendendo possibili SuperPoD su larga scala.
- Rilascio di UnifiedBus 2.0, un’interconnessione per SuperPoD, a settembre 2025 e pubblicazione delle specifiche tecniche, per far avanzare sia la tecnologia di interconnessione sia l’industria.
Comunicazioni wireless
Per prepararci all’era dell’AI mobile, stiamo abbracciando il cambiamento attraverso la convergenza tecnologica e costruendo una solida base di rete. In quest’ottica, lo scorso anno abbiamo:
- Superato il collo di bottiglia della congestione dei pilot di canale ad alta dimensionalità nel T‑MIMO a onde centimetriche, sfruttando una propagazione quasi stazionaria e una misurazione fine e scenario-aware del dominio spaziale. Questo garantisce un miglioramento di circa 8 volte dell’efficienza spettrale.
- Utilizzato un modulo RF (radio frequency) integrato del front-end passivo per le T‑Cells mmWave, diventando la prima azienda a realizzare il sub-band frequency division multiple access (FDMA). Questo potenzia le stazioni base, consentendo loro di gestire facilmente un traffico dati intenso da un elevato numero di utenti concorrenti.
- Proposto un approccio completamente nuovo allo spegnimento sincrono full-band su scala di rete per timeslot a consumo energetico zero e una configurazione multilivello dei consumi energetici per una schedulazione più raffinata. Questo riduce il consumo energetico lungo l’intero processo di quasi il 50 %.
- Continuato a sviluppare core network abilitate dalla generative AI tramite tecnologia multi-agent, accoppiata con le capacità di integrated sensing and communications delle onde centimetriche. Questo ci consente di personalizzare le reti on demand per l’AI on-device e l’AI embodied, migliorando al contempo l’esperienza di connettività wireless.
Reti ottiche
Nel networking ottico, abbiamo:
- Ottenuto svolte nella demarcazione, soppressione e compensazione delle impairment dei collegamenti ottici e in una nuova architettura di decodifica dinamica della forward error correction (FEC), con focus su meccanismo della sorgente luminosa, canali in fibra e algoritmi. Questo consente un’interconnessione ottica altamente affidabile e a basso consumo tra data center.
- Avviato diverse tecnologie chiave come la comunicazione laser nello spazio, antenne ottiche a limite di diffrazione e acquisizione, tracking e pointing (ATP) ad alta precisione. Questi progressi ci permettono di realizzare un tracking e un’acquisizione inter-satellite rapidi e ad alta precisione, e di supportare comunicazioni laser in spazio libero stabili.
Networking
Nel networking, continuiamo a migliorare le prestazioni delle comunicazioni su larga scala per SuperPoD e cluster. A tal fine, abbiamo:
- Sviluppato il primo algoritmo del settore di Message-level signaling Congestion Control (MCC), basato su informazioni di pathset, per rispondere alla domanda di alto throughput nel training e nell’inferenza su cluster di grandi dimensioni. Questo algoritmo ci ha aiutato a superare la sfida della congestione multi-path e per pacchetto e a migliorare il throughput di comunicazione del 25 % – 50 %.
- Creato la prima architettura del settore di comunicazioni parallele per i piani di data e control signaling. Questo garantisce bassa latenza per l’inferenza mixture of experts (MoE) per SuperPoD. Riducendo l’overhead di sincronizzazione e di preservazione dell’ordine, l’architettura accorcia il tempo di completamento delle comunicazioni collettive del 10 % – 30 %.
Consumer business
In questo ambito, restiamo all’avanguardia nell’innovazione tecnologica e nell’esperienza, dai materiali all’architettura, dalle reti terrestri a quelle satellitari, dalle applicazioni smart a quelle intelligenti, includendo anche illuminazione e colore. In particolare, nell’ultimo anno abbiamo:
- Rilasciato la prima Switchable Dual Telephoto Camera del settore. Questa fotocamera combina perfettamente un grande sensore e un doppio teleobiettivo per supportare uno zoom ottico doppio a 3,7x e 9,4x.
- Realizzato un Advanced Precision Hinge System a tre segmenti con incastro maschio-femmina (mortise-and-tenon) con camme ausiliarie, per garantire ai nostri foldable un’esperienza di apertura e chiusura fluida.
- Introdotto nei nostri laptop pieghevoli due ventole ultra-sottili da 3,5 mm e una camera di vapore 3D anti-gravity in composito rame-acciaio, garantendo un raffreddamento eccellente nonostante uno spessore da aperto di soli 7,3 mm.
- Permesso alla rete terrestre di superare 1 Gbps di uplink peak rate e utilizzato un’architettura di chip integrata sia per le comunicazioni satellitari sia per quelle cellulari nella rete satellitare, garantendo una connettività senza interruzioni tra ambienti a terra e in aria.
- Offerto una nuova tecnologia per comunicazioni di emergenza in aree senza copertura di rete. Questo ha fornito un’esperienza di comunicazione superiore tra ambienti terrestri, satellitari e senza rete.
- Raggiunto un salto quantico con la nostra True-to-Color Camera. Supportata dalla tecnologia Multi-spectral Local White Balance, la fotocamera supporta un white balance pixel-wise e funziona senza soluzione di continuità con Primary Camera, Ultra-Wide Angle Camera e Telephoto Camera per offrire un’accuratezza cromatica straordinaria e garantire che ogni tonalità sia fedele alla realtà in scenari con più sorgenti luminose.
- Impiegato l’AI per potenziare la computational aesthetics e la graphics computing, offrendo esperienze media intelligenti come Custom Styles, Instant Movies nella Gallery, Immersive Light-field Visual Effects e 3DGS Rendering Acceleration.
- Spinto i confini dell’AI tramite il deployment di modelli on-device, realizzando esperienze più intelligenti come riduzione del rumore in chiamata, riassunti delle chiamate, Celia Brief, riassunti dei documenti e ricerche AI locali, rendendo Celia ancora più smart e più capace.
- Completato una profonda integrazione verticale di hardware, software e chip, ottenendo un miglioramento delle prestazioni superiore al 35 % sui telefoni della serie Mate 80 con HongMeng Kernel, BiSheng Compiler e l’OS Window System.
Software fondamentale
In questo ambito, abbracciamo pienamente l’AI per supportare capacità software fondamentali e critiche per l’infrastruttura di computing eterogeneo di prossima generazione e per aiutare Huawei a offrire al mondo una nuova opzione grazie alla nostra solida base di AI computing. Pertanto, abbiamo:
- Potenziato il BiSheng Compiler per migliorare di oltre il 20 % le prestazioni di operatori chiave Ascend tramite microarchitecture affinity compilation.
- Sfruttato lo Unified Memory Development Kit (UMDK) per l’accelerazione delle comunicazioni, aiutando Ascend a posizionarsi nel tier di punta in termini di prestazioni di inferenza MoE Expert Parallelism.
- Ottenuto breakthrough pionieristici in tecnologie come intelligent awareness and scheduling, Optimized Container per cluster multi-CPU e application-aware compilation acceleration. Su questa base, il nostro openEuler OS e il BiSheng Compiler hanno aiutato Kunpeng ad assicurarsi prestazioni leader in scenari chiave.
- Avviato una nuova architettura multi-write basata su pooling per il nostro GaussDB. In combinazione con TaiShan 950 SuperPoD, possiamo consentire una migrazione fluida da mainframe e server midrange per i sistemi core degli istituti finanziari.
Ingegneria R&S
In questo ambito, abbiamo intensificato gli sforzi per costruire capacità ingegneristiche efficienti e affidabili. Nell’ultimo anno, questo ci ha portato a:
- Sviluppare un motore di verifica affidabile, tracciabile ed end-to-end per i calcoli floating point. Questo motore rileva oltre il 90 % delle silent data corruptions sulle NPU, aumentando significativamente la probabilità di una convergenza riuscita del training su cluster di computing su scala ultra-large.
- Pionierare un nuovo approccio per migliorare l’affidabilità degli AI agent basati su LLM. Fondato sul Planning Domain Definition Language (PDDL), questo approccio altamente adattivo è in grado di identificare qualitativamente step rischiosi nell’esecuzione dei task e di intercettare il 99,9 % delle operazioni a più alto rischio.
- Rimodellare la software engineering assicurando che l’AI giochi un ruolo più ampio e più affidabile nella distribuzione delle richieste, generazione del codice, code review, unit testing, system testing e remediation delle vulnerabilità open source.