opisyal na inilunsad ng Google ang gemini 2.5 flash image, ang malakas na modelo ng AI na naging viral noong Agosto bilang”nano banana,”na ginagawa itong pangkalahatang magagamit para sa mga developer at mga negosyo na handa na sa pamamagitan ng Gemini API, Google AI Studio, at Vertex AI. 10 aspeto ng mga ratios at pinahusay na pagkakapare-pareho ng character para sa mas makatotohanang pag-edit. Ang henerasyon ng imahe sa mga kamay ng higit pang mga tagalikha.

Ang Pangkalahatang Paglabas ng Availability sa Oktubre 2 ay makabuluhang mga pag-upgrade na nakatuon sa produksyon. Pinapayagan nito ang mga tagalikha na maiangkop ang nilalaman para sa mga tukoy na platform. Ang tampok na ito, na nagpapanatili ng pagkakahawig ng isang paksa sa mga pangunahing pag-edit, ay tumutugon sa isang karaniwang punto ng pagkabigo para sa maraming mga modelo ng AI. ito upang maproseso ang teksto at mga imahe nang sabay-sabay. Nangangahulugan ito na maiintindihan nito ang isang umiiral na imahe at isama ito sa proseso ng malikhaing, sa halip na bumubuo lamang mula sa isang text prompt.

Pinapayagan nito ang mas tumpak at pare-pareho na pag-edit sa isang pag-uusap. Natagpuan ng AI Startup Cartwheel ang modelo na natatanging may kakayahang pangasiwaan ang mga kumplikadong poses mula sa anumang anggulo ng camera. $ 0.039 bawat imahe at $ 30 bawat milyong mga token ng output, isang mapagkumpitensyang rate na naglalayong magmaneho ng pag-aampon ng negosyo sa pamamagitan ng platform ng Vertex AI. Ang presyon ay tumindi matapos isama ng OpenAi ang generator ng imahe ng GPT-4O na direkta sa ChATGPT, ang pagmamaneho ng isang napakalaking pagsulong sa pakikipag-ugnayan ng gumagamit. Inilunsad ng Bytedance ang modelo ng Seedream 4.0 bilang isang direktang mapaghamon sa”nano banana”.

pagbabalanse ng malikhaing kapangyarihan na may mga bagong proteksyon Ang bagong paglulunsad na ito ay sinamahan ng mas matatag na mga protocol ng kaligtasan. Ito ay kaibahan sa mga ligal na labanan na nagtatakip ng mga katunggali tulad ng midjourney. Ang pag-edit ng mga tool sa produkto ng punong barko nito, ang Google ay nagpoposisyon sa Gemini hindi lamang bilang isang chatbot, ngunit lalo na bilang isang komprehensibong malikhaing makina, na katulad ng OpenAi, na inilunsad lamang ang modelo ng video ng SORA 2 AI.

Categories: IT Info