Η Google ξεκίνησε επίσημα το Gemini 2.5 Flash Image, το ισχυρό μοντέλο AI που έγινε ιό τον Αύγουστο ως”Nano Banana”, καθιστώντας το γενικά διαθέσιμο για προγραμματιστές και επιχειρήσεις παγκοσμίως. Οι αναλογίες και η ενισχυμένη συνέπεια των χαρακτήρων για πιο ρεαλιστικές επεξεργασίες. Στα χέρια περισσότερων δημιουργών.
Νέοι δημιουργικοί έλεγχοι και επιτυχία πρώιμης υιοθετητής
Η πρώτη στρατηγική του μοντέλου γεννήθηκε σημαντικά στην επίσημη πλατφόρμα αξιολόγησης. Η γενική απελευθέρωση διαθεσιμότητας στις 2 Οκτωβρίου επίσης σημαντικές αναβαθμίσεις με επίκεντρο την παραγωγή.
Μια βασική βελτίωση είναι η υποστήριξη για 10 διαφορετικές αναλογίες διαστάσεων, που κυμαίνονται από κινηματογραφικό τοπίο έως κατακόρυφες μορφές κοινωνικών μέσων. Αυτό επιτρέπει στους δημιουργούς να προσαρμόσουν το περιεχόμενο για συγκεκριμένες πλατφόρμες. Αυτό το χαρακτηριστικό, το οποίο διατηρεί την ομοιότητα ενός υποκειμένου σε μεγάλες επεξεργασίες, απευθύνεται σε ένα κοινό σημείο αποτυχίας για πολλά μοντέλα AI.
Nicole Brichtova, ένα προϊόν στο Google Deepmind, σημείωσε:”Το P> για την επεξεργασία κειμένου και εικόνων ταυτόχρονα. Αυτό σημαίνει ότι μπορεί να κατανοήσει μια υπάρχουσα εικόνα και να την ενσωματώσει στη δημιουργική της διαδικασία, αντί να παράγει μόνο από μια προτροπή κειμένου. Το AI Startup Cartwheel βρήκε το μοντέλο μοναδικά ικανό να χειρίζεται το σύνθετο θέτει από οποιαδήποτε γωνία κάμερας. $ 0.039 ανά εικόνα και 30 δολάρια ανά εκατομμύριο μάρκες παραγωγής, ένα ανταγωνιστικό επιτόκιο που στοχεύει στην οδήγηση της υιοθέτησης των επιχειρήσεων μέσω της πλατφόρμας AIT AI. Η πίεση εντατικοποιήθηκε αφού η OpenAI ενσωμάτωσε τη γεννήτρια εικόνων GPT-4O απευθείας στο CHATGPT, οδηγώντας μια τεράστια αύξηση της εμπλοκής των χρηστών. Η Bytedance ξεκίνησε το μοντέλο SeedReam 4.0 ως άμεσο αμφισβητία στο”Nano Banana”.
Η εξισορρόπηση της δημιουργικής δύναμης με νέες διασφαλίσεις
Η ώθηση της Google έρχεται μετά από προηγούμενα σκαλοπάτια στην παραγωγή εικόνων AI. Αυτή η νέα εκτόξευση συνοδεύεται από πιο ισχυρά πρωτόκολλα ασφαλείας. Αυτό έρχεται σε αντίθεση με τις νομικές μάχες που εμπλέκονται σε ανταγωνιστές όπως το Midjourney.
Το Midjourney αντιμετωπίζει σήμερα μια υψηλού προφίλ αγωγής πνευματικών δικαιωμάτων από τη Disney και την Universal για τα δεδομένα της εκπαίδευσης. Το προϊόν AI, η Google τοποθετεί το Gemini όχι μόνο ως chatbot, αλλά όλο και περισσότερο ως μια ολοκληρωμένη δημιουργική μηχανή, παρόμοια με την OpenAi, η οποία μόλις ξεκίνησε το μοντέλο βίντεο Sora 2 AI.
Η κίνηση είναι ένα σαφές στοίχημα ότι η προσβασιμότητα και η εμπιστοσύνη μπορούν να κερδίσουν πάνω από τους κύριους χρήστες στο ταχέως εξελισσόμενο πεδίο του γενετικού AI.