Ekipi Qwen i Alibaba ka nisur Qwen-Image-Edit, një model i ri AI me burim të hapur që sfidon drejtpërdrejt softuerin profesional si Adobe Photoshop, i cili përdoret nga mbi 90% të profesionistëve krijues në botë. Lëshuar globalisht në 18 gusht, mjeti lejon këdo që të kryejë redaktime komplekse të imazhit duke përdorur nxitje të thjeshta të tekstit. target=”_ bosh”> chat qwen , dhe përmes një pagoi alibaba cloud api . Ai shkëlqen në interpretimin dhe modifikimin e tekstit brenda imazheve si në anglisht ashtu edhe në kinezisht, një detyrë tradicionale e vështirë për AI. Kjo veprim ofron një alternative të fuqishme, të arritshme për sistemet e shtrenjta, të pronarit.
Vegla e re është ndërtuar mbi modelin e fuqishëm të parametrave 20-miliardë Fondacioni Qwen-Image Foundation, i cili debutoi në 4 gusht. Risia e tij thelbësore për redaktim është një lejon ndryshime të rëndësishme në nivelin e pikselit në të gjithë kanavacën duke ruajtur identitetin thelbësor të subjektit. Aplikimet praktike përfshijnë ndryshimin e stilit të një fotografie për të ngjasuar me një animacion në studio Ghibli, duke rrotulluar një objekt për të zbuluar një këndvështrim të ri, ose krijimin e paketave të tëra emoji nga një maskë. Ai lejon përdoruesit të shtojnë ose heqin elementë, të ndryshojnë ngjyrën e një objekti të vetëm ose të kryejnë retushim delikate të fotografive duke siguruar që zonat përreth mbeten plotësisht të pandryshuara. Siç vuri në dukje studiuesi i ekipit Qwen, Junyang Lin,”Ai mund të heqë një fije floku, modifikim shumë delikat të imazhit.”
Një standard i ri për redaktimin e tekstit dygjuhësh
ku Qwen-Image-Edit me të vërtetë dallon vetë vetë në trajtimin e tij të përparuar të tekstit, një aftësi që e ka të bëjë atë me një redaktor të thjeshtë të imazhit. Modeli trashëgon dhe shtrin aftësitë e forta të interpretimit dygjuhësh të paraardhësit të tij, modelin e Fondacionit Qwen-Image, i cili u krijua posaçërisht për të zotëruar tipografinë. Kjo i lejon asaj të shtojë, heqë ose modifikojë me saktësi si në anglisht ashtu edhe në kinezisht. Modelet standarde të difuzionit shpesh luftojnë me tekstin sepse ato përpunojnë imazhe si modele të mëdha të pikselave sesa si karaktere simbolike. Kjo e bën drejtshkrimin koherent, ndarjen logjike dhe tipografinë e qëndrueshme një pengesë të madhe, veçanërisht për skriptet komplekse logografike si kinezisht. Modeli i fondacionit u trajnua duke përdorur një qasje”mësimi i kurrikulës”, duke filluar me imazhet themelore para se të shkallëzoni gradualisht për të trajtuar përshkrimet e tekstit të nivelit të paragrafit. Kjo u plotësua nga një tubacion i sintezës së të dhënave që gjeneroi imazhe trajnimi me cilësi të lartë, të pasura me tekst, duke mësuar në mënyrë efektive modelin rregullat e tipografisë.
Për përdoruesit, kjo përkthehet në një nivel të paparë kontrolli. Modeli mund , një detyrë që kërkon të dy kuptimin semantik dhe precizin e pikës së pikës. Në një treg konkurrues
vendimi i Alibaba për të lëshuar qwen-image-edit nën një është një gambit i qartë strategjik. Ai e bën një mjet më të lartë të artit në dispozicion lirisht për përdorim komercial, duke nënvlerësuar drejtpërdrejt modelet e biznesit të lojtarëve të vendosur. Nisja vjen ndërsa tregu i redaktimit të AI nxehet. Adobe kohët e fundit forcoi Photoshop me karakteristika të reja të energjisë nga Firefly si”Harmonize”për përzierjen e objekteve dhe”Upscale Generative”për përmirësimin e zgjidhjes. Modele të tjera të fuqishme nga konkurrentët si Bytedance dhe Black Forest Labs me aftësi për redaktimin e imazhit janë shfaqur gjithashtu. Qasja me burim të hapur të Alibaba paraqet një rrugë të ndryshme, më përçarëse për të njëjtin qëllim. Ai ndjek debutimin e modelit të arsyetimit të mendimit QWEN3-të mesime dhe modelit të tij të përparuar të gjenerimit të videos WAN2.2. Strategjia synon të kultivojë një komunitet global të zhvilluesve që mund të ndërtojë teknologjinë e tij, duke nxitur një ekosistem që mund të inovojë potencialisht më shpejt sesa platformat e mbyllura, të pronarit. Një zëdhënës i Alibaba Cloud e konfirmoi këtë ndërrim, duke shpjeguar”pasi të diskutojmë me komunitetin dhe të reflektojmë për këtë çështje, ne kemi vendosur të braktisim mënyrën e të menduarit hibrid. Tani do të trajnojmë modelet e instruksionit dhe të menduarit veç e veç për të arritur cilësinë më të mirë të mundshme.”Ky përqendrim në modele të specializuara, me cilësi të lartë të hapur, synon të ndërtojë një ekosistem gjithëpërfshirës që mund të inovojë sistemet e mbyllura që mbizotërojnë në treg.