Η Google αγκαλιάζει μια φιλοσοφία”λιγότερο είναι περισσότερο”με την τελευταία έκδοση του AI, ξεκινώντας το υπερ-αποδοτικό Gemma 3 270M Open Model. Με μόλις 270 εκατομμύρια παραμέτρους, αυτό το συμπαγές μοντέλο είναι σχεδιασμένο για τους προγραμματιστές να δημιουργούν εξειδικευμένες εφαρμογές που μπορούν να συντονιστούν, οι οποίες μπορούν να εκτελούνται απευθείας σε συσκευές όπως τα smartphones ή ακόμα και σε ένα πρόγραμμα περιήγησης ιστού. Αντί να βασίζονται σε μαζικά συστήματα που βασίζονται σε σύννεφο, η Gemma 3 270M επικεντρώνεται στην ακραία απόδοση ενέργειας για καλά καθορισμένες εργασίες, καθιστώντας το Advanced AI πιο προσιτό για την On-Device και την Edge Computing. Target=”_ blank”> επεκτείνοντας το”gemmaverse”των ανοικτών μοντέλων . Ακολουθεί το αρχικό ντεμπούτο της σειράς Gemma 3 τον Μάρτιο, την απελευθέρωση των εκδόσεων QAT για τους καταναλωτές GPU τον Απρίλιο και την κυκλοφορία του κινητού-πρώτου Gemma 3n τον Ιούνιο. Src=”Δεδομένα: εικόνα/svg+xml; nitro-empty-id=mty0nzoxmdu3-1, base64, phn2zyb2awv3qm94psiwidagmti4mca3mj Aiihdpzhropsixmjgwiibozwlnahq9ijcymcigeg1sbnm9imh0dha6ly93d3cudzmub3jnlziwmdavc3znij48l3n2zz4=”>>

Αυτή η στρατηγική ευθυγραμμίζεται με μια ευρύτερη μετατόπιση της βιομηχανίας προς τα μικρά γλωσσικά μοντέλα (SLMS). Εταιρείες όπως η Microsoft με τη σειρά PHI, το Mistral AI με το μικρό μοντέλο 3 και το αγκάλιασμα του προσώπου με τα μοντέλα SMOLVLM επενδύουν σε μεγάλο βαθμό στην αποτελεσματική AI. Υπογραμμίζει μια αυξανόμενη τάση της βιομηχανίας όπου τα μικρότερα, εξειδικευμένα μοντέλα καθίστανται απαραίτητα εργαλεία για την πρακτική, την πραγματική ανάπτυξη. href=”https://developers.googleblog.com/en/introducing-gemma-3-270m”target=”_ blank”> Η Google τοποθετεί τα συστήματα Google. Η επίσημη ανακοίνωση της εταιρείας επικαλείται μια κλασική αρχή μηχανικής: δεν θα χρησιμοποιούσατε ένα σφυρί για να κρεμάσετε ένα πλαίσιο εικόνας. Αυτό το μοντέλο Ενσωματώνει αυτό το σωστό εργαλείο για τη δουλειά”Φιλοσοφία” Οι καλά καθορισμένες λειτουργίες όπου η ταχύτητα και η αποτελεσματικότητα κόστους είναι υψίστης σημασίας. Η Google προσδιορίζει περιπτώσεις ιδανικής χρήσης, όπως ανάλυση συναισθημάτων, εξαγωγή οντότητας, δρομολόγηση ερωτημάτων, δημιουργική γραφή, ελέγχους συμμόρφωσης και μετατροπή μη δομημένων κειμένων σε δομημένα δεδομένα. Ο στόχος είναι να ενισχυθούν οι προγραμματιστές να κατασκευάζουν και να αναπτύσσουν πολλαπλά προσαρμοσμένα μοντέλα, κάθε εξειδικευμένο εκπαιδευμένο για διαφορετικό έργο, χωρίς το απαγορευτικό κόστος που συνδέεται με μεγαλύτερα συστήματα. Η Google υπογραμμίζει το έργο του Adaptive ML με το SK Telecom, όπου ένα μοντέλο Gemma που έχει ρυθμιστεί με λεπτόκοκκο ήταν επιφορτισμένο με λεπτή, πολύγλωσσο μετριοπάθεια περιεχομένου. Τα αποτελέσματα ήταν έντονα: το εξειδικευμένο μοντέλο όχι μόνο ικανοποιήθηκε, αλλά ξεπέρασε τα πολύ μεγαλύτερα ιδιόκτητα συστήματα στο συγκεκριμένο έργο του. Αυτή η ιστορία επιτυχίας χρησιμεύει ως πρακτικό σχέδιο για τον τρόπο με τον οποίο οι προγραμματιστές μπορούν να εκμεταλλευτούν την απόδοση του Gemma 3 270m. Αυτή η στρατηγική στοχεύει άμεσα στην αυξανόμενη ανάγκη για οικονομικά αποδοτική ΑΙ που μπορεί να αναπτυχθεί σε κλίμακα χωρίς να επιβαρύνεται με τεράστιο κόστος συμπερασμάτων. Το μικρό μέγεθος του μοντέλου επιτρέπει την ταχεία επανάληψη, επιτρέποντας την ολοκλήρωση πειράματα ρύθμισης σε ώρες, όχι ημέρες. Για ορισμένους εξαιρετικά εξειδικευμένους ρόλους, όπως το παιχνίδι roleplaying Game NPCs ή το Custom Journaling Bots, η ικανότητα του μοντέλου να «ξεχνά» τη γενική γνώση μέσω της υπερφόρτωσης, εξασφαλίζοντας ότι παραμένει το μέγεθος του λέιζερ, το Gemma 3 270ms Alex. αποτέλεσμα σκόπιμων αρχιτεκτονικών συμβιβασμών. Οι 270 εκατομμύρια παράμετροι του μοντέλου κατανέμονται ασυνήθιστα: ένα ουσιαστικό 170 εκατομμύρια είναι αφιερωμένα στο στρώμα ενσωμάτωσης, αφήνοντας μόλις 100 εκατομμύρια για τα μπλοκ μετασχηματιστή πυρήνα. Αυτή η επιλογή σχεδιασμού επιτρέπει άμεσα το χαρακτηριστικό του μοντέλου: ένα τεράστιο λεξιλόγιο 256.000 token.

Αυτό το μεγάλο λεξιλόγιο είναι το κλειδί για την εξειδίκευσή του. Επιτρέπει στο μοντέλο να χειρίζεται σπάνια, συγκεκριμένα και τεχνικά μάρκες με υψηλή πιστότητα, καθιστώντας το ένα εξαιρετικά ισχυρό θεμέλιο για την τελειοποίηση σε εξειδικευμένες περιοχές όπως το νόμο, η ιατρική ή η χρηματοδότηση. Με την κατανόηση της συγκεκριμένης φρασεολογίας της βιομηχανίας από την αρχή, απαιτεί λιγότερα δεδομένα κατάρτισης για να γίνει ειδικός. Αυτό συμπληρώνεται από ένα αξιοσέβαστο παράθυρο περιβάλλοντος 32K, επιτρέποντάς του να επεξεργάζεται σημαντικές προτροπές και έγγραφα. Η εταιρεία είναι σαφές ότι η GEMMA 3 270M δεν έχει σχεδιαστεί για σύνθετες, ανοιχτές περιπτώσεις συνομιλητικής χρήσης όπως ένα chatbot. Αντ’αυτού, η έκδοση που διαμορφώνεται με οδηγίες έχει σχεδιαστεί για να ακολουθεί αποτελεσματικά τις δομημένες προτροπές και τις εντολές από το κουτί, παρέχοντας μια αξιόπιστη βάση για περαιτέρω προσαρμογή. Στη δοκιμή IFEVAL, η οποία μετρά την ικανότητα ενός μοντέλου να ακολουθήσει επαληθεύσιμες οδηγίες, η GEMMA 3 270M επιτυγχάνει βαθμολογία 51,2 %. Αυτή η βαθμολογία είναι υψηλότερη από άλλα ελαφριά μοντέλα που έχουν περισσότερες παραμέτρους, δείχνοντας ότι γροθιά πολύ πάνω από το βάρος του. Παρόλο που προφανώς υπολείπεται μοντέλα παραμέτρων δισεκατομμυρίων παραμέτρων, η απόδοσή του είναι αξιοσημείωτα ανταγωνιστική για το κλασματικό μέγεθος του. Οι εσωτερικές δοκιμές σε ένα Pixel 9 Pro έδειξαν ότι ένα μοντέλο που χρησιμοποιείται μόνο το 0,75% της μπαταρίας της συσκευής για 25 συνομιλίες, καθιστώντας το πιο αποδοτικό μοντέλο GEMMA της Google μέχρι σήμερα. Εξασφαλίζει επίσης την ιδιωτική ζωή των χρηστών, καθώς οι ευαίσθητες πληροφορίες μπορούν να υποβληθούν σε επεξεργασία τοπικά χωρίς να αποστέλλονται ποτέ στο σύννεφο. Αυτό επιτρέπει στους προγραμματιστές να εκτελούν τα μοντέλα σε ακρίβεια Int4 με ελάχιστη αποικοδόμηση απόδοσης, ένα κρίσιμο χαρακτηριστικό για την ανάπτυξη σε υλικό περιορισμένου πόρου. href=”https://huggingface.co/collections/google/gemma-3-release-67c6c6f89c4f76621268bb6d”target=”_ blank”> Διατίθεται τώρα μέσω δημοφιλών πλατφορμών όπως το αγκάλιασμα προσώπου , ollama και kagle, με ενσωμάτωση στην vertex της Google. Αυτή η ευρεία προσβασιμότητα, που επαίνεσε από προγραμματιστές όπως ο Simon Willison, ο οποίος κάλεσε μια προηγούμενη απελευθέρωση της Gemma”Η πιο ολοκληρωμένη μέρα που έχω δει για οποιοδήποτε μοντέλο”είναι το κλειδί για την προώθηση ενός ζωντανού οικοσυστήματος γύρω από αυτά τα μικρότερα, πιο πρακτικά εργαλεία AI.

Categories: IT Info