Black Forest Labs (BFL) heeft dinsdag zijn enorme FLUX.2-modelfamilie uitgebracht. Door een Vision-Language Model (VLM) van Mistral te integreren, wil de startup afbeeldingen baseren op logica uit de echte wereld in plaats van alleen op pixelwaarschijnlijkheid.

Om te voorkomen dat de architectuur met 32 ​​miljard parameters de consumentenhardware verplettert, werkte BFL samen met NVIDIA om de modellen voor GeForce RTX Graphics Processing Units (GPU’s) te optimaliseren. Een nieuwe kwantiseringstechniek vermindert het gebruik van Video Random Access Memory (VRAM) met 40%, waardoor het enorme systeem lokaal kan draaien.

De release, die slechts enkele dagen na de lancering van Google’s Gemini 3 Pro Image verschijnt, daagt de verschuiving naar gesloten ecosystemen uit. BFL geeft open gewichten vrij voor ontwikkelaars en gokt erop dat gemeenschapsinnovatie de ommuurde bedrijfstuinen zal overtreffen.

Architectuurverschuiving: de opkomst van redeneren

Black Forest Labs (BFL) doorbreekt de industrienorm om uitsluitend op pixelwaarschijnlijkheid te vertrouwen en heeft zijn vlaggenschipmodel fundamenteel opnieuw ontworpen. FLUX.2 maakt gebruik van een hybride ontwerp dat een gelijkgerichte stroomtransformator combineert met een Vision-Language Model (VLM), een stap die bedoeld is om generatieve outputs in logische consistentie te aarden.

Door “Mistral-3″, een 24 miljard parameter VLM te integreren, krijgt het systeem een laag van ‘wereldkennis’ die traditionele diffusiemodellen ontberen.

De integratie van de VLM stelt het model in staat ruimtelijke relaties en fysieke eigenschappen te begrijpen voordat pixels worden weergegeven, waardoor het ‘hallucinatie’-probleem direct wordt aangepakt waarbij AI fysiek onmogelijke objecten of verlichting genereert.

Het bedrijf beschrijft de praktische bedoeling achter deze verschuiving en verklaarde: “FLUX.2 is ontworpen voor creatieve workflows in de echte wereld, niet alleen voor demo’s of feesttrucs.”

“FLUX.2 biedt nu ondersteuning voor meerdere referenties, met de mogelijkheid om maximaal 10 afbeeldingen te combineren in een nieuwe uitvoer, een uitvoerresolutie van maximaal 4 MP, aanzienlijk betere snelle naleving en wereldkennis, en aanzienlijk verbeterde typografie.”

FLUX.2 is er: ons meest capabele model voor het genereren en bewerken van afbeeldingen tot nu toe.

Multi-referentie. 4 MP. Productieklaar. Gewichten openen.

In het nieuwe. pic.twitter.com/wynj1vfYTV

— Zwarte Woud Labs (@bfl_ml) 25 november 2025

Dergelijke architectonische veranderingen maken mogelijkheden mogelijk die voorheen onbetrouwbaar waren. De maximale uitvoerresolutie is verhoogd naar 4 megapixels (ongeveer 2048×2048), een specificatie die zich richt op professionele print-en weergaveworkflows met hoge resolutie in plaats van alleen op sociale media-consumptie.

Een nieuwe functie”Multi-Reference Control”stelt gebruikers in staat maximaal 10 verschillende referentiebeelden tegelijkertijd in te voeren. De functie is ontworpen voor commerciële storyboards en handhaaft een strikte stijl-en karakterconsistentie over meerdere generaties heen, een cruciale vereiste voor het maken van campagne-items.

FLUX.2 bevat een nieuwe Variational Autoencoder (VAE) die is ontworpen om leerbaarheid, kwaliteit en compressie in evenwicht te brengen, waardoor het model verder wordt geoptimaliseerd voor diverse implementatiescenario’s.

Typografiemogelijkheden zijn ook gereviseerd. Door eerdere zwakke punten te herzien, geeft het systeem complexe tekstreeksen en lay-outs betrouwbaar weer, waarbij het zich richt op een beruchte fout van modellen van de vorige generatie die vaak onleesbare of onzinnige letters produceerden.

Het hardwareknelpunt en NVIDIA’s oplossing

Het aanpakken van de hardwarebeperkingen die inherent zijn aan zo’n complex systeem vereiste een toegewijde technische inspanning. Met een gewicht van maar liefst 32 miljard parameters heeft het volledige model 90 GB VRAM nodig om in zijn niet-gekwantiseerde staat te laden.

Dergelijke vereisten plaatsen het model ver buiten de mogelijkheden van zelfs de duurste consumentenhardware, zoals de 24 GB NVIDIA GeForce RTX 4090. Om het model lokaal te kunnen gebruiken zijn doorgaans serverclusters van bedrijfsniveau nodig, waardoor de toegankelijkheid ervan wordt beperkt tot een fractie van het potentiële gebruikersbestand.

Om dit op te lossen, BFL werkte rechtstreeks samen met NVIDIA om FP8-kwantisering (8-bit floating point) te implementeren. Kwantisering vermindert de VRAM-vereisten met 40% terwijl de “vergelijkbare kwaliteit” behouden blijft, waardoor het model binnen het bereik komt van high-end enthousiaste werkstations. NVIDIA schrijft:

“De nieuwe FLUX.2-modellen zijn indrukwekkend, maar ook behoorlijk veeleisend. Ze draaien een duizelingwekkend model met 32 miljard parameters, waarvoor 90 GB VRAM nodig is om volledig te laden.”

“Om de toegankelijkheid van het FLUX.2-model te vergroten, hebben NVIDIA en Black Forest Labs samengewerkt om het model te kwantificeren tot FP8, waardoor de VRAM-vereisten met 40% zijn verlaagd bij vergelijkbare kwaliteit.”

Voor gebruikers die nog steeds niet voldoende voldoende hebben. VRAM, een samenwerking met ComfyUI, introduceert een nieuwe functie voor het streamen van gewichten. Door gewichtsstreaming kunnen delen van het model dynamisch worden overgebracht naar een langzamer systeem-RAM, waarbij de inferentiesnelheid wordt ingeruild voor de mogelijkheid om het model überhaupt op beperkte hardware uit te voeren.

Toekomstige toegankelijkheid is ook gepland. Een’Klein’-model, beschreven als een op grootte gedistilleerde versie van de architectuur, is in ontwikkeling om zich te richten op hardware met lagere specificaties, hoewel een specifieke releasedatum nog niet bevestigd is.

De prijzen voor de API zijn agressief gepositioneerd, geschat tussen $0,01 en $0,04 per afbeelding. De structuur ondermijnt de concurrentie en daagt het’buy vs. build’-dilemma uit voor grote technologiebedrijven die moeten beslissen of ze hun eigen modellen willen ontwikkelen of superieure externe technologie in licentie willen geven.

Open Weights vs. The Walled Gardens

Terwijl concurrenten hun modellen opsluiten achter strikt gecontroleerde API’s, handhaaft BFL een gelaagde releasestrategie die open toegang omvat. FLUX.2 dev biedt open gewichten voor niet-commercieel gebruik en onderzoek, waardoor de gemeenschap de kerntechnologie kan inspecteren en erop kan voortbouwen.

Commerciële gebruikers worden doorverwezen naar de API-only [pro] en [flex] lagen, die beheerde infrastructuur en service-level overeenkomsten bieden. Gedetailleerde controle over generatieparameters, zoals het aantal stappen en de begeleidingsschaal, wordt geïntroduceerd in de [flex]-laag, gericht op ervaren gebruikers die verfijning nodig hebben.

BFL legde de filosofie achter de open release uit en merkte op:”Wij geloven dat visuele intelligentie moet worden gevormd door onderzoekers, creatievelingen en ontwikkelaars overal ter wereld, en niet slechts door een paar.”

Het vrijgeven van gewichten staat in schril contrast met de Gemini 3 Pro Image-lancering en het beeldgeneratiemodel van OpenAI, die werken als volledig gesloten systemen. Door de gewichten vrij te geven, gokt BFL erop dat door de gemeenschap aangestuurde optimalisatie de ontwikkeling van het model sneller zal versnellen dan interne R&D alleen.

Ontwikkelaars hebben onmiddellijk toegang tot het model via partnerplatforms, waaronder Fal, Replicate en TogetherAI. 

Marktcontext: de’Reasoning’-oorlog

Slechts vijf dagen nadat Google Gemini 3 Pro Image heeft onthuld, benadrukt de lancering een sectorbrede spil. Beide releases maken gebruik van’redeneermogelijkheden’, wat erop wijst dat leveranciers haast hebben om hun tools betrouwbaar genoeg te maken voor zakelijk gebruik in plaats van alleen maar creatief onderzoek.

Meta’s recente gerapporteerde deal van $140 miljoen met BFL valideert de technologie van de startup als een haalbaar alternatief voor interne ontwikkeling. Zelfs technologiegiganten met enorme middelen vinden het moeilijk om het tempo van gespecialiseerde laboratoria in de generatieve AI-ruimte te evenaren.

BFL voorspelt dat deze verschuiving blijvende gevolgen zal hebben en stelt:”Door de economie van generatie radicaal te veranderen, zal FLUX.2 een onmisbaar onderdeel worden van onze creatieve infrastructuur.”

Categories: IT Info