Black Forest Labs (BFL) telah mengeluarkan fluks besar.2 Model Keluarga pada hari Selasa. Mengintegrasikan Model Bahasa Visi (VLM) dari Mistral, permulaan bertujuan untuk mendatangkan imej dalam logik dunia sebenar dan bukan hanya kebarangkalian piksel.

Teknik kuantisasi baru mengurangkan penggunaan memori akses rawak video (VRAM) sebanyak 40%, yang membolehkan sistem besar-besaran berjalan secara tempatan. BFL melepaskan berat terbuka untuk pemaju, pertaruhan bahawa inovasi komuniti akan melampaui kebun berdinding korporat.

Peralihan seni bina: Kebangkitan Penalaran

Memecahkan dari standard industri bergantung semata-mata pada kebarangkalian piksel, Makmal Hutan Hitam (BFL) secara asasnya telah mengulangi semula model perdana. Fluks.2 Mengamalkan reka bentuk hibrid yang menggabungkan pengubah aliran yang diperbetulkan dengan model bahasa penglihatan (VLM), satu langkah yang dimaksudkan untuk output generatif tanah dalam konsistensi logik.

sasaran=”_ blank”> Parameter 24 bilion vlm , sistem memperoleh lapisan”pengetahuan dunia”bahawa model penyebaran tradisional kekurangan. Peralihan ini, syarikat itu menyatakan:”Flux.2 direka untuk aliran kerja kreatif dunia sebenar, bukan hanya demo atau helah parti.”ada di sini-model generasi & penyuntingan imej kami yang paling berkebolehan sehingga kini.

Multi-reference. 4mp. Pengeluaran-siap. Berat terbuka.

Ke yang baru. pic.twitter.com/wynj1vfytv

-Makmal Hutan Hitam (@bfl_ml) (“https://twitter.com/bfl_ml/status/199933454545804563?ref_src=twsrc%5etfw”Resolusi output maksimum telah meningkat kepada 4 megapiksel (kira-kira 2048 × 2048), satu spesifikasi yang mensasarkan aliran kerja cetak dan resolusi tinggi dan bukan sekadar penggunaan media sosial.

Direka untuk papan cerita komersil, ciri ini mengekalkan gaya yang ketat dan konsistensi watak dalam pelbagai generasi, keperluan kritikal untuk penciptaan aset kempen. Kelemahan-kelemahan terdahulu yang terdahulu, kelemahan-kelemahan terdahulu, sistem-rentet dan susun atur teks yang kompleks dengan pasti, yang mensasarkan kecacatan generasi-model generasi terdahulu yang sering dihasilkan oleh perintah-surat yang diperbaiki. Berat badan pada parameter 32 bilion yang besar, model penuh menuntut 90GB VRAM untuk memuatkan dalam keadaan yang tidak beragama. asas pengguna yang berpotensi.

Untuk menyelesaikan ini,

“Model fluks baru.2 yang mengagumkan, tetapi juga cukup menuntut. […]”Untuk meluaskan fluks.2 Kebolehcapaian model, NVIDIA dan Makmal Hutan Hitam bekerjasama untuk mengukur model kepada FP8-mengurangkan keperluan VRAM sebanyak 40% pada kualiti yang boleh dibandingkan. Streaming berat membolehkan bahagian-bahagian model untuk dimuatkan secara dinamik ke RAM sistem yang lebih perlahan, kelajuan kesimpulan perdagangan untuk keupayaan untuk menjalankan model sama sekali pada perkakasan yang dikekang.

Kebolehcapaian masa depan juga dirancang. Model”Klein”, yang digambarkan sebagai versi saiz yang disenaraikan dari seni bina, sedang dalam pembangunan untuk menargetkan perkakasan spesifikasi yang lebih rendah, walaupun tarikh pelepasan tertentu tetap tidak disahkan.

sasaran=”_ kosong”> $ 0.01 dan $ 0.04 setiap imej . Pesaing pemotongan, struktur itu mencabar dilema”membeli vs membina”untuk syarikat-syarikat teknologi tinggi yang mesti memutuskan sama ada untuk membangunkan model mereka sendiri atau lesen teknologi luaran yang unggul.

Flux.2 Dev menawarkan berat terbuka untuk kegunaan dan penyelidikan bukan komersial, yang membolehkan masyarakat memeriksa dan membina teknologi teras.

Pengguna komersil diarahkan kepada peringkat API-Only [Pro] dan [Flex], yang menawarkan perjanjian infrastruktur dan peringkat perkhidmatan yang terurus. Kawalan granular ke atas parameter generasi, seperti kiraan langkah dan skala bimbingan, diperkenalkan di peringkat [flex], yang melayani pengguna kuasa yang memerlukan penalaan halus. Pelancaran dan model penjanaan imej OpenAI, yang beroperasi sebagai sistem tertutup sepenuhnya. Dengan melepaskan berat, BFL bertaruh bahawa pengoptimuman yang didorong oleh komuniti akan mempercepatkan perkembangan model lebih cepat daripada R & D dalaman sahaja.

Pemaju boleh mengakses model melalui platform rakan kongsi termasuk FAL, meniru, dan bersama-sama dengan segera. 

Konteks pasaran: Perang’Penalaran’

Tiba hanya lima hari selepas Google melancarkan imej Gemini 3 Pro, pelancaran itu menyoroti pivot seluruh industri. Kedua-duanya melepaskan keupayaan”penalaran”, yang mencadangkan vendor berlumba untuk menjadikan alat mereka cukup dipercayai untuk kegunaan perusahaan daripada hanya penerokaan kreatif. Malah gergasi teknologi dengan sumber yang luas mendapati sukar untuk memadankan kadar makmal khusus di ruang AI generatif.

Categories: IT Info