Hoewel Google publiekelijk waarschuwt voor’irrationaliteit’op de AI-markt, heeft het leiderschap van Google privé opdracht gegeven tot een agressieve uitbreiding van de infrastructuur om de AI-bedieningscapaciteit elke zes maanden te verdubbelen.

Volgens een presentatie bekeken door CNBC deze week mikt de richtlijn op een duizendvoudige schaalvergroting binnen vijf jaar om het rekenintensieve “tijdperk van inferentie” te ondersteunen.

Dit interne mandaat, geleverd door infrastructuur vice-president Amin Vahdat, staat in schril contrast met de recente opmerkingen van CEO Sundar Pichai op een interview met de BBC over een mogelijke zeepbel.

Gedreven door de existentiële angst voor onderinvestering, vertrouwt de strategie op speciaal silicium, zoals de Ironwood TPU-chips van Google, om te voorkomen dat de kosten meegroeien met de capaciteitsgroei.

Het 1000x mandaat: Inside Google’s War Room

Details uit de all-hands meeting van 6 november schetsen een beeld van een bedrijf dat opereert in oorlogstijd.

Infrastructuur VP Amin Vahdat presenteerde een routekaart met de titel’AI-infrastructuur’, waarin de exponentiële groeivereisten werden uiteengezet die nodig zijn om gelijke tred te houden met de vraag. Expliciet vereist de richtlijn dat Google zijn AI-bedieningscapaciteit elke zes maanden moet verdubbelen om zijn concurrentiepositie te behouden.

Langetermijnprognoses mikken op een duizelingwekkende duizendvoudige toename van de capaciteit binnen slechts vier tot vijf jaar. De drijvende kracht achter deze versnelling is niet modeltraining, die historisch gezien het grootste deel van de computerbronnen heeft verbruikt, maar een fundamentele verschuiving naar het “tijdperk van inferentie.”

Modellen zoals de onlangs gelanceerde Gemini 3 Pro vereisen enorme, continue rekenkracht om redeneringstaken uit te voeren en code uit te voeren.

Vahdat waarschuwde dat “de concurrentie in de AI-infrastructuur het meest kritische en ook het duurste onderdeel van de AI-race is.”

Dit sentiment werd versterkt door CEO Sundar Pichai, die citeerde gemiste kansen met de videogeneratietool van het bedrijf, Veo, vanwege hardwarebeperkingen. Pichai gaf toe dat, ondanks de sterke groei van de cloud, “die cijfers veel beter zouden zijn geweest als we meer rekenkracht hadden gehad.”

In plaats van te bezuinigen op het scepticisme van de markt, wordt 2026 door de interne toon omschreven als een “intens” jaar van “ups en downs.” De boodschap van het leiderschap is duidelijk: de belangrijkste belemmering voor groei is niet langer softwarecapaciteit, maar de fysieke beschikbaarheid van computers.

Het Silicon Shield: Ironwood, Axion en de efficiëntieval

Het 1000 keer opschalen van de capaciteit met kant-en-klare hardware zou financieel rampzalig zijn. De strategie van Google is gebaseerd op het ontkoppelen van prestatiewinst en lineaire kostenstijgingen. Vahdat schetste de technische vereisten:

“Google moet’1000 keer meer mogelijkheden, rekenkracht en opslagnetwerken kunnen leveren tegen in wezen dezelfde kosten en in toenemende mate hetzelfde vermogen, hetzelfde energieniveau’, zei Vahdat.”

Aan de basis van deze enorme uitbreiding ligt een eenvoudige maar meedogenloze economische realiteit: efficiëntie is de enige weg naar duurzaamheid. Vertrouwen op de Ironwood TPU, die onlangs algemeen verkrijgbaar is geworden, staat centraal in deze strategie.

Deze chip van de zevende generatie claimt een 10x betere prestatieverbetering ten opzichte van de v5p en biedt 2x prestaties per watt vergeleken met de vorige Trillium-generatie.

Algemene werklasten worden overgebracht naar de nieuwe Arm-gebaseerde Axion CPU’s om kracht en thermische speelruimte vrij te maken voor AI-taken. Door standaard computertaken naar efficiëntere processors te verplaatsen, wil Google de energie die beschikbaar is voor zijn energievretende TPU’s maximaliseren.

Met een’co-design’-filosofie integreren ingenieurs software rechtstreeks met de hardware-architectuur. Onderzoek van Google DeepMind levert informatie over het chipontwerp, waardoor het bedrijf winst kan behalen waar standaardhardware dat niet kan. Vahdat merkte op dat “het niet gemakkelijk zal zijn, maar door samenwerking en co-design gaan we er komen.”

De “efficiëntievalkuil” dreigt echter groot te worden. De paradox van Jevon suggereert dat naarmate computers efficiënter worden, de vraag zal stijgen om het overschot te consumeren, waardoor de kostenbesparingen teniet worden gedaan. Mochten de kosten van inferentie dalen, dan zal het aantal vragen – gedreven door agentische workflows en ‘Deep Think’-redeneringen – naar verwachting exploderen, waardoor het totale energieverbruik hoog blijft.

De zeepbelparadox: wedden tegen ‘irrationaliteit’

Te midden van een groeiend extern scepticisme over het rendement op de investering (ROI) voor generatieve AI, gaat deze agressieve interne expansie door.

In een interview met de BBC, Pichai gaf toe dat er “elementen van irrationaliteit” zitten in de huidige marktwaardering van AI. Ondanks deze publieke voorzichtigheid heeft Alphabet zijn investeringsprognose voor 2025 verhoogd naar $93 miljard, met een “significante stijging” gepland voor 2026.

Medewerkers hebben tijdens de vraag-en antwoordsessie rechtstreeks de leiding over deze kloof uitgedaagd. Eén vraag ging specifiek in op de spanning tussen stijgende uitgaven en de angst voor een marktcorrectie:

“Te midden van aanzienlijke Al-investeringen en marktpraat over een potentiële Al-zeepbel, hoe denken we erover om de duurzaamheid en winstgevendheid op de lange termijn te garanderen als de Al-markt niet volwassen wordt zoals verwacht?”

De verdediging van Pichai berust op de balans van het bedrijf. Hij betoogde: “Wij zijn beter gepositioneerd om het hoofd te bieden aan, weet je, missers dan andere bedrijven.”

Defensief stelt de logica dat het risico van onderinvestering – en mogelijk irrelevant worden – existentieel is, terwijl overinvestering alleen maar duur is.

Een dergelijke redenering drijft momenteel de aanhoudende AI Capex Boom aan, waarbij het uitbouwen van infrastructuur losstaat van de onmiddellijke inkomstenrealiteit. Google gokt er feitelijk op dat het de concurrentie kan verslaan in een kapitaalintensieve uitputtingsslag.

Marktrealiteit: het gevangenendilemma van AI

Gezamenlijk zullen de “Big Four” – Google, Microsoft, Amazon en Meta – dit jaar naar verwachting ruim $380 miljard aan infrastructuur uitgeven, volgens cijfers geciteerd door CNBC. Nvidia-CEO Jensen Huang verwierp deze week expliciet het ‘zeepbel’-verhaal, daarbij verwijzend naar een tastbare vraag, een standpunt waar Google zich tegen moet indekken.

Concurrent OpenAI wordt geconfronteerd met zijn eigen problemen. Een interne memo van Sam Altman die deze week opdook, suggereert dat de marktleider steeds meer worstelt met de economische realiteit van schaalvergroting. Dit creëert een opening voor Google om zijn verticale integratie te benutten.

Het verschuiven van het knelpunt van de beschikbaarheid van gegevens naar de pure snelheid en kosten voor het genereren van tokens is het’tijdperk van gevolgtrekkingen’. Het specifieke voordeel van Google ligt in de op maat gemaakte siliciumstapel, waardoor het mogelijk een marge-verpletterende prijzenoorlog beter kan doorstaan ​​dan degenen die uitsluitend afhankelijk zijn van Nvidia-hardware.

Recente productlanceringen, zoals Gemini 3 Pro en Gemini 3 Pro Image, drijven deze vraag verder aan. Uiteindelijk hangt de uitkomst af van de vraag of premiumfuncties zoals’Deep Think’en agentische workflows sneller inkomsten kunnen genereren dan de hardware in waarde daalt.

Ondanks de duizelingwekkende kosten lijkt Google tot nu toe toegewijd aan een’build it and they will come’-strategie.

Categories: IT Info