Per Huang, il vantaggio di Nvidia non è un singolo chip o CUDA da solo, ma la capacità di coordinare energia, fabbriche, software e domanda globale in un unico stack.
Nvidia, per Jensen Huang, non è una fabbrica di silicio che vende pezzi sostituibili. È il punto in cui elettroni, energia, supply chain e software vengono convertiti in token, e quel passaggio, sostiene, non si può trattare come una commodity. Da qui discende il resto della sua argomentazione: il vantaggio dell’azienda non è solo tecnico, è industriale, logistico e commerciale insieme. E proprio per questo, dice, il rischio non è che Nvidia venga schiacciata dalla standardizzazione dell’AI, ma che il resto del mercato non riesca a reggere il ritmo che Nvidia impone.
Per Huang, il vero fossato di Nvidia non è il chip isolato, né un file GDS2 spedito a una fonderia. È il passaggio che trasforma elettroni in token, e poi rende quei token più preziosi lungo la catena che li produce, li assembla e li fa funzionare. In questa lettura, la questione della commodity è quasi una falsa pista: anche se il software si standardizzasse, il sistema industriale che rende possibile l’output AI resterebbe difficile da replicare.
Alla fine, qualcosa deve trasformare gli elettroni in token. La trasformazione degli elettroni in token e il rendere quei token più preziosi nel tempo è difficile da commoditizzare completamente.
0:27
Il mio modello mentale della nostra azienda è questo: l’input sono gli elettroni, l’output sono i token. In mezzo c’è Nvidia. Il nostro compito è fare quanto basta, e il meno possibile, per rendere possibile quella trasformazione a capacità incredibili.
1:33
Huang insiste che Nvidia ha costruito proprio questo tipo di sistema, con partner a monte e a valle, e che il suo lavoro è fare il meno possibile da sola e il più possibile insieme agli altri. Descrive l’AI come una torta a cinque strati in cui l’azienda è presente lungo tutta la pila, dai fornitori di memoria agli sviluppatori di applicazioni e ai costruttori di modelli. La conseguenza, dice, è che il vantaggio non sta in un componente, ma nella capacità di orchestrare una rete che altre imprese non possono ricreare in fretta.
Abbiamo probabilmente il più grande ecosistema di partner, sia a monte nella supply chain sia a valle, con tutte le aziende di computer, gli sviluppatori di applicazioni e i creatori di modelli.
2:11
L’AI è, se vuoi, una torta a cinque strati. Abbiamo ecosistemi su tutti e cinque gli strati.
2:21
Per Huang, la scarsità non si risolve aspettando che il mercato si aggiusti da solo. Si governa prima, con segnali di domanda abbastanza forti da convincere fabbriche, fornitori di memoria, packaging e persino gli anelli più lontani della catena. La sua tesi, qui, è semplice e ambiziosa: se sai dire oggi che tra tre anni ti servirà molto di più, il sistema produttivo può ancora arrivarci.
Alcuni li devo convincere direttamente, altri indirettamente, e altri ancora in modo ancora più a monte. Se riesco a convincere TSMC, ASML sarà convinta.
14:37
Dobbiamo pensare ai punti critici di strozzatura. Ma se TSMC è convinta, tra qualche anno avrai in abbondanza macchine EUV.
14:37
Huang insiste che molti vincoli hanno una vita breve, due o tre anni al massimo, mentre la domanda cresce molto più in fretta. Cita l'EUV* come il nodo da cui dipendono memoria e logica, poi allarga il quadro a CoWoS*, packaging e capacità di fabbrica. Nel suo racconto, la parte difficile non è la fisica ma il coordinamento.
Nessuno di questi colli di bottiglia dura più di un paio d’anni, due o tre anni, nessuno.
14:56
Più capacità per i chip, questo è un problema da due o tre anni. Più capacità CoWoS, un problema da due o tre anni.
15:35
Per Huang, il punto non è se i grandi clienti sappiano scrivere i propri kernel o se comprino anche altrove. Il punto è che, quando vogliono spremere davvero l’hardware, tornano a un ecosistema che Nvidia controlla e aggiorna in continuazione. In questa parte della sua difesa, CUDA non è presentato come un semplice strato software, ma come la cerniera che trasforma una GPU in una macchina utile su scala industriale.
Usiamo un’enormità di IA per creare i kernel che abbiamo. Sono abbastanza sicuro che continueremo a essere necessari per parecchio tempo.
31:39
Le nostre competenze aiutano i partner dei nostri laboratori di IA a ottenere spesso un altro 2x dal loro stack. Non è raro che, quando abbiamo finito di ottimizzare il loro stack o un kernel specifico, il loro modello sia più veloce del 3x, del 2x, del 50%.
31:46
Huang insiste però su un’altra leva: la tessitura dell’ecosistema, non il singolo prodotto. Dice che Nvidia ha installato la propria architettura ovunque, che le startup scelgono ciò che è più abbondante e che l’abbondanza, in questo caso, coincide con la base installata più grande e con la maggiore programmabilità. È un modo per dire che CUDA non vince solo perché è migliore, ma perché è già ovunque e quindi abbassa il rischio di chi deve costruire sopra.
Sceglieresti un’architettura che è la più abbondante. Siamo la più abbondante al mondo. Sceglieresti quella con la base installata più grande. Siamo la base installata più grande.
33:19
Il flywheel è davvero la base installata, la programmabilità della nostra architettura, la ricchezza del nostro ecosistema, e il fatto che ci siano così tante aziende di IA nel mondo.
33:19
Per Huang, la questione non è se Nvidia venda chip o faccia banca. È che, se vuole restare il centro dello stack, deve arrivare prima dove si forma la domanda, senza trasformarsi in un hyperscaler che compra e controlla tutto da solo. Per questo parla di investimenti in OpenAI, Anthropic e nei neocloud come di un modo per allineare capitale e clienti, non per sostituirsi ai clienti.
Se vuoi fare un ordine da 100 miliardi di dollari di AI factory, nessun problema. Siamo l’unica azienda al mondo oggi che può dirlo.
56:38
Se non hanno abbastanza soldi, investiamo persino in loro.
1:15:59
La sua linea è che Nvidia può finanziare senza diventare proprietaria dell’infrastruttura perché il vero prodotto non è il singolo server, ma la capacità di mettere in moto tutto il sistema. In questa lettura, investire in un laboratorio o in un operatore di cloud AI serve a far crescere l’ecosistema che poi compra GPU, software e servizi costruiti sopra GPU. Il confine, però, è sottile: più Nvidia seleziona chi aiutare, più somiglia a un arbitro del mercato che a un fornitore neutrale.
L’unica cosa più importante per la nostra azienda è la ricchezza del nostro ecosistema, che riguarda gli sviluppatori.
1:19:15
Non siamo una banca. Vogliamo competere nel mercato.
1:20:50
Huang insiste che questo non è un gesto filantropico né una copertura per rinunciare alla disciplina industriale. Il suo punto è che, se l’AI è una filiera a più strati, Nvidia deve aiutare a tenere insieme il livello dei modelli, quello dell’infrastruttura e quello degli sviluppatori, altrimenti qualcun altro si prende il valore a valle. È anche un modo per dire che la selezione dei partner non è un vezzo finanziario, ma una scelta di posizionamento: meglio essere il motore che fa girare l’insieme che il proprietario dell’insieme.
Huang prova a spostare il dibattito dai dazi alla geografia del potere tecnologico. Il suo punto è che i controlli all’export non “proteggono” gli Stati Uniti: semmai rischiano di cedere il secondo mercato mondiale e, con esso, la capacità di fissare gli standard del settore. In questa lettura, il vero obiettivo non è chiudere la Cina fuori dal calcolo, ma impedire che la Cina costruisca un ecosistema alternativo mentre l’America si ritrae.
Siamo beneficiari della leadership tecnologica americana. Siamo beneficiari del fatto che gli sviluppatori lavorino sullo stack tecnologico americano. Siamo beneficiari del fatto che, mentre questi modelli di IA si diffondono nel resto del mondo, lo stack tecnologico americano sia quindi il migliore per farlo».
1:25:54
Non si può concedere quel mercato agli Stati Uniti dell’industria tecnologica. È un disservizio per il nostro Paese. È un disservizio per la nostra sicurezza nazionale. È un disservizio per la nostra leadership tecnologica, tutto per il beneficio di una sola azienda».
1:25:29
Huang respinge l’idea che il confronto si giochi su una sola leva, il chip, e insiste che la Cina stia già sviluppando un ecosistema proprio. Sottolinea che i modelli cinesi sono ancora oggi costruiti sullo stack americano, ma avverte che, se gli Stati Uniti cedono la seconda piazza mondiale, Pechino avrà spazio per ottimizzare software, modelli e architetture attorno ai propri vincoli. La sua tesi è semplice: lasciare quel vuoto non indebolisce soltanto Nvidia, indebolisce la capacità americana di diffondere le proprie regole.
All of the five layers of the tech stack for AI are important. The United States ought to go win all five of them».
1:27:43
Abbiamo fatto il nostro meglio. Hai tutti i software. È solo difficile immaginare un lock-in di lungo periodo nell’ecosistema cinese, anche se per un po’ hanno un modello open source leggermente migliore».
1:27:16
Qual è, per Huang, il vero moat di Nvidia?
Il vero moat è l’intero stack: install base, ecosistema software, capacità di co-progettare hardware e supply chain globale. Dice che il chip da solo non basta a spiegare il vantaggio.
Perché Huang insiste tanto su CUDA?
Perché lo considera un ecosistema, non un semplice toolkit. Sostiene che programmabilità, install base e compatibilità con molti framework rendano CUDA difficile da sostituire.
Perché Nvidia investe in OpenAI e Anthropic?
Huang dice che l’azienda ora può farlo e che quelle realtà avevano bisogno di capitali che i VC non potevano fornire. Aggiunge che lo fa per sostenere l’ecosistema, non per diventare un fondo.
Huang vuole che Nvidia diventi una cloud company?
No. Dice che Nvidia deve fare «as much as needed, as little as possible»: supportare l’ecosistema, non trasformarsi in hyperscaler o finanziatore di mestiere.
Che cosa pensa dell’export verso la Cina?
Pensa che cedere quel mercato sia un errore strategico. Secondo lui la Cina ha già energia, chip e ricercatori sufficienti per restare competitiva, quindi gli Stati Uniti dovrebbero vincere competendo, non ritirandosi.
Sintesi assistita dall'AI del podcast di Dwarkesh Patel, verificata sulla trascrizione originale.