Black Forest Labs (BFL) ay naglabas ng napakalaking pagkilos ng bagay nito.2 Model Family noong Martes. Ang pagsasama ng isang modelo ng wikang pang-vision (VLM) mula sa Mistral, ang pagsisimula ay naglalayong mga imahe ng lupa sa lohika ng real-world sa halip na posibilidad na pixel lamang. Ang isang bagong pamamaraan ng dami ay binabawasan ang paggamit ng Video Random Access Memory (VRAM) ng 40%, na nagpapahintulot sa napakalaking sistema na tumakbo nang lokal. Ang BFL ay naglalabas ng mga bukas na timbang para sa mga nag-develop, pagtaya na ang pagbabago ng komunidad ay magpapalabas ng mga hardin na may pader na may pader. src=”data: imahe/svg+xml; nitro-empty-id=mty2mdoxmju4-1; base64, phn2zyb2awv3qm94psiwidagotq0idy5 OCIGD2LKDGG9IJK0NCIGAGVPZ2H0PSI2OTGIIHHTBG5ZPSJODHRWOI8VD3D3LNCZLM9YZY8YMDAWL3N2zyi+PC9ZDMC+”>
shift ng arkitektura: Ang pagtaas ng pangangatuwiran
Ang Flux.2 ay nagpatibay ng isang hybrid na disenyo na nagsasama ng isang naayos na daloy ng transpormer na may isang modelo ng wikang pang-vision (VLM), isang paglipat na inilaan upang ground generative output sa lohikal na pagkakapare-pareho. target=”_ blangko”> 24-bilyong parameter vlm , ang sistema ay nakakakuha ng isang layer ng”kaalaman sa mundo”na ang mga tradisyonal na mga modelo ng pagsasabog ay kulang. nakasaad:”Ang flux.2 ay idinisenyo para sa mga real-world creative workflows, hindi lamang mga demo o trick ng partido.”
-Ang aming pinaka-may kakayahang henerasyon ng imahe at modelo ng pag-edit hanggang sa kasalukuyan.
multi-reference. 4MP. Handa ng paggawa. Buksan ang mga timbang.
sa bago. pic.twitter.com/wynj1vfytv
-Black Forest Labs (@bfl_ml) Nobyembre 25, 2025
Ang maximum na resolusyon ng output ay nadagdagan sa 4 na megapixels (humigit-kumulang na 2048 × 2048), isang pagtutukoy na nagta-target ng propesyonal na pag-print at mataas na resolusyon na mga daloy ng pagpapakita sa halip na ang tampok na social media. Dinisenyo para sa komersyal na storyboarding, ang tampok na ito ay nagpapanatili ng mahigpit na estilo at pagkakapareho ng character sa maraming mga henerasyon, ang isang kritikal na kinakailangan para sa paglikha ng asset ng kampanya. Ang pag-aayos ng mga nakaraang kahinaan, ang system ay nagbibigay ng mga kumplikadong mga string ng teksto at mga layout na maaasahan, na nagta-target ng isang kilalang-kilala na kapintasan ng mga nakaraang henerasyon na mga modelo na madalas na gumawa ng garbled o nonsensical sulat. Ang pagtimbang sa isang malaking 32 bilyon na mga parameter, ang buong modelo ay hinihiling ng 90GB ng VRAM upang mai-load sa hindi katibayan na estado. base ng gumagamit. Ang dami ay binabawasan ang mga kinakailangan ng VRAM sa pamamagitan ng 40% habang pinapanatili ang”maihahambing na kalidad,”na nagdadala ng modelo na maabot ang mga high-end na mahilig sa workstation. Sinusulat ni Nvidia:”Ang mga bagong flux.2 mga modelo ay kahanga-hanga, ngunit medyo hinihingi din. Nagpapatakbo sila ng isang nakakapagod na 32-bilyong-parameter na modelo na nangangailangan ng 90GB VRAM na ganap na mag-load.”[…]”Upang mapalawak ang flux.2 Modelong Pag-access, Nvidia at Black Forest Labs ay nakipagtulungan upang mabuo ang modelo sa FP8-binabawasan ang mga kinakailangan ng VRAM sa pamamagitan ng 40% sa maihahambing na kalidad.”Pinapayagan ng weight streaming ang mga bahagi ng modelo na maging pabago-bago na na-offload sa mas mabagal na sistema ng RAM, ang bilis ng pangangalakal ng bilis para sa kakayahang patakbuhin ang modelo sa lahat sa napilitan na hardware.
Ang pag-access sa hinaharap ay binalak din. Ang isang”Klein”na modelo, na inilarawan bilang isang bersyon na hindi napapansin na bersyon ng arkitektura, ay nasa pag-unlad upang ma-target ang mas mababang specification hardware, kahit na ang isang tiyak na petsa ng paglabas ay nananatiling hindi nakumpirma. target=”_ blangko”> $ 0.01 at $ 0.04 bawat imahe . Sa pag-undercutting ng mga kakumpitensya, hinamon ng istraktura ang”bumili kumpara sa build”na dilemma para sa mga malalaking kumpanya ng tech na dapat magpasya kung bubuo ang kanilang sariling mga modelo o lisensya na mahusay na panlabas na teknolohiya. Nag-aalok ang Flux.2 DEV ng mga bukas na timbang para sa hindi pang-komersyal na paggamit at pananaliksik, na nagpapahintulot sa komunidad na siyasatin at mabuo ang pangunahing teknolohiya. Ang kontrol ng butil sa mga parameter ng henerasyon, tulad ng hakbang sa hakbang at gabay na scale, ay ipinakilala sa [flex] tier, na nakatutustos sa mga gumagamit ng kapangyarihan na nangangailangan ng pag-aayos. Ang paglunsad ng imahe ng Gemini 3 Pro at modelo ng henerasyon ng imahe ng OpenAi, na nagpapatakbo bilang ganap na saradong mga sistema. Sa pamamagitan ng paglabas ng mga timbang, ang BFL ay nagtaya na ang pag-optimize na hinihimok ng komunidad ay mapabilis ang pag-unlad ng modelo nang mas mabilis kaysa sa panloob na R&D lamang.
Parehong naglalabas ng mga tout na”pangangatuwiran”na kakayahan, na nagmumungkahi ng mga vendor ay karera upang gawin ang kanilang mga tool na maaasahan na sapat para sa paggamit ng negosyo sa halip na malikhaing paggalugad. Kahit na ang mga higanteng tech na may malawak na mapagkukunan ay nahihirapan na tumugma sa bilis ng mga dalubhasang lab sa generative AI space.