Η Google έχει κυκλοφορήσει πλήρως το Gemma 3N, μια νέα γενιά μοντέλων τεχνητής νοημοσύνης ανοιχτού κώδικα που έχει σχεδιαστεί για να φέρει ισχυρές πολυτροπικές δυνατότητες απευθείας στις καταναλωτικές συσκευές. Σε μια σημαντική κίνηση για τον εκδημοκρατισμό του Advanced AI, αυτά τα μοντέλα μπορούν να επεξεργαστούν εικόνες, ήχους και εισόδους βίντεο για τη δημιουργία κειμένου ενώ λειτουργούν σε υλικό με μόλις 2GB μνήμης, αποτελεσματικά το συγκρότημα AI από το σύννεφο. href=”https://developers.googleblog.com/en/introducing-gemma-3n-developer-guide/”target=”_ blank”> Οδηγός προγραμματιστών , εισάγει μια οικογένεια μοντέλων”Mobile-First”που βρίσκεται σε αντίθεση με τα μεγαλύτερα, ιδιωτικά συστήματα Gemini. Τα νέα μοντέλα διατίθενται σε δύο κύρια μεγέθη, E2B και E4B, τα οποία χρησιμοποιούν αρχιτεκτονικές καινοτομίες για να τρέξουν με ένα αποτύπωμα μνήμης συγκρίσιμο με πολύ μικρότερα μοντέλα. Αυτή η ανακάλυψη απόδοσης σημαίνει ότι οι προγραμματιστές μπορούν τώρα να δημιουργήσουν και να αναπτύξουν εκλεπτυσμένες εφαρμογές AI που μπορούν να ξεπεράσουν σε ένα ευρύ φάσμα καθημερινών υλικών, από smartphones έως φορητούς υπολογιστές. Η πλήρης απελευθέρωση ενισχύει την ώθηση της Google για να ενδυναμώσει την κοινότητα των προγραμματιστών με εργαλεία που ήταν προηγουμένως ο τομέας των κέντρων δεδομένων μεγάλης κλίμακας, η ουσιαστική αλλαγή που μπορεί να χτίσει με αιχμηρά AI.

Η αρχιτεκτονική της προσβασιμότητας

Στην καρδιά της απόδοσης του Gemma 3N είναι μια νέα αρχιτεκτονική που σχεδιάστηκε από το έδαφος για την απόδοση της συσκευής. Η Google εισάγει αυτό που ονομάζει matformer ή matryoshka μετασχηματιστής, αρχιτεκτονική , που φωτίζει μικρότερα, πλήρως λειτουργικά μοντέλα μέσα σε ένα μεγαλύτερο. Αυτό επιτρέπει στους προγραμματιστές να αναπτύξουν ένα φάσμα μεγεθών μοντέλων προσαρμοσμένα σε συγκεκριμένους περιορισμούς υλικού, με το Google να παρέχει ένα lab matformer lab Αυτή η καινοτομία επιτρέπει την επεξεργασία ενός μεγάλου τμήματος των παραμέτρων του μοντέλου στην κύρια CPU μιας συσκευής, μειώνοντας δραστικά την ποσότητα της μνήμης επιταχυντής υψηλής ταχύτητας (VRAM). Η αρχιτεκτονική χρησιμοποιεί επίσης την κοινή χρήση της προσωρινής μνήμης KV, την οποία η εταιρεία ισχυρίζεται ότι διπλασιάζει την ταχύτητα της αρχικής επεξεργασίας.

[Ενσωματωμένο περιεχόμενο]

Το Gemmaverse και η ανοιχτή στρατηγική της Google Αυτή η στρατηγική του οικοσυστήματος φαίνεται να αποτελεί βασικό μέρος της διπλή προσέγγιση της εταιρείας στην ανάπτυξη της AI. Σύμφωνα με το μια συνέντευξη venturebeat με τον διευθυντή προϊόντων Google Priya Singh, η εταιρεία είναι ανοιχτά και κλειστά μοντέλα ως μια σχέση Symbiotic. Η Google δεν βλέπει τους Gemma και Gemini ως ανταγωνιστές, περισσότερες δύο πλευρές του ίδιου νομίσματος. Η εταιρεία αναλύει αυτό που οι προγραμματιστές χτίζουν με τη Gemma για να προσδιορίσουν πού να προχωρήσουν στη συνέχεια με την έρευνα Frontier.

Αυτή η στρατηγική είναι εμφανής στην ποικιλία των εξειδικευμένων μοντέλων που κυκλοφόρησαν το Gemma που κυκλοφόρησαν κατά το παρελθόν έτος. Αυτά περιλαμβάνουν το TXGEMMA, μια σουίτα εργαλείων για την ανακάλυψη φαρμάκων που βασίζονται στην προηγούμενη αρχιτεκτονική Gemma 2 και το εξαιρετικά εξειδικευμένο Dolphingemma. Το τελευταίο είναι μια μοναδική συνεργασία με το έργο Wild Dolphin για να αναλύσει δεκαετίες εγγραφών δελφινιών, προσπαθώντας να βρουν πρότυπα στην επικοινωνία των ζώων-ένα έργο που ωθεί το ανοικτό μοντέλο είναι η λήψη του AI. ενθουσιασμός για την άμεση χρηστικότητα του. Ο ανεξάρτητος προγραμματιστής Simon Willison επαίνεσε την ολοκληρωμένη φύση της απελευθέρωσης, ονομάζοντάς το”Το Gemma 3N είναι επίσης η πιο ολοκληρωμένη ημέρα ένα λανσάρισμα που έχω δει για οποιοδήποτε μοντέλο”. Σε πρακτικές δοκιμές λεπτομερώς στο blog του , ο Willison τόνισε την ευρεία υποστήριξη από δημοφιλή εργαλεία όπως το Ollama και το MLX. Ενώ χρησιμοποίησε με επιτυχία μια έκδοση του μοντέλου για μεταγραφή ήχου, σημείωσε επίσης κάποιες αρχικές ιδιορρυθμίες, με το μοντέλο να μην περιγράψει σωστά μια εικόνα που είχε μόλις δημιουργήσει. 3n Impact Challenge , ένας διαγωνισμός με $ 150.000 σε βραβεία για τους προγραμματιστές που χρησιμοποιούν τα νέα μοντέλα για την κατασκευή προϊόντων για κοινωνικό καλό. Τα μοντέλα διαθέτουν έναν προηγμένο κωδικοποιητή ήχου που βασίζεται στο Universal Speech Model (USM) Η αποτελεσματικότητα και η εξουσία απέδωσαν εντυπωσιακά αποτελέσματα σε leaderboards. Η μεγαλύτερη παραλλαγή Gemma 3N E4B είναι το πρώτο μοντέλο κάτω από 10 δισεκατομμύρια παραμέτρους για να επιτευχθεί βαθμολογία Lmarena πάνω από 1300, ένα σημείο αναφοράς που μετρά την απόδοση με βάση τις ανθρώπινες προτιμήσεις.

Με τη μηχανική ενός ισχυρού πολυτροπικού μοντέλου που μπορεί να ζήσει στις συσκευές που χρησιμοποιούν οι άνθρωποι κάθε μέρα, η Google δεν απελευθερώνει μόνο ένα νέο εργαλείο, αλλά κάνει μια σαφή δήλωση. Η κίνηση αμφισβητεί την ιδέα ότι η αιχμή του AI πρέπει να διαμένει αποκλειστικά στο σύννεφο, ενισχύοντας ένα νέο κύμα προγραμματιστών για την κατασκευή της επόμενης γενιάς έξυπνων, ιδιωτικών και προσβάσιμων εφαρμογών.

Categories: IT Info