Η Microsoft διαθέτει ανοιχτού κώδικα Phi-4, το μοντέλο της συμπαγούς γλώσσας, στο κοινό, δημοσιεύοντας το πλήρες βάρος του στο Hugging Face με άδεια MIT.
Το Phi-4, που παρουσιάστηκε για πρώτη φορά τον Δεκέμβριο του 2024 έως και Η πλατφόρμα Azure AI Foundry της Microsoft, ήταν αρχικά διαθέσιμη μόνο σε ερευνητές με ελεγχόμενη άδεια. Με την έκδοση ανοιχτού κώδικα, η Microsoft παρέχει σε ερευνητές και προγραμματιστές σε όλο τον κόσμο τα εργαλεία για την προσαρμογή, την ανάπτυξη και την εμπορευματοποίηση του συμπαγούς αλλά υψηλής απόδοσης μοντέλου.
Phi-4: Ένα συμπαγές μοντέλο με υπερμεγέθη. Αποτελέσματα
Το Phi-4 αντιπροσωπεύει μια απόκλιση από την παραδοσιακή ανάπτυξη τεχνητής νοημοσύνης, η οποία συχνά έχει δώσει προτεραιότητα στην κλίμακα ως την κύρια μέτρηση για την απόδοση. Με μόλις 14 δισεκατομμύρια παραμέτρους, το Phi-4 προσφέρει αποτελέσματα που ανταγωνίζονται και ξεπερνούν ακόμη και μεγαλύτερα αντίστοιχα, όπως το Gemini Pro 1.5 της Google και το GPT-4o του OpenAI.
Πηγή: Microsoft
Στα πρόσφατα σημεία αναφοράς, το Phi-4 σημείωσε εντυπωσιακό 91,8 στο αμερικανικό Διαγωνισμός Μαθηματικών (AMC 12), ξεπερνώντας τη βαθμολογία του Gemini Pro 1.5 89,8 και GPT-4o’s 77.9.
Η Microsoft παρουσίασε τις μαθηματικές συλλογιστικές δυνατότητες του Phi-4 μέσω ενός προβλήματος συνδυαστικής, όπου το μοντέλο υπολόγισε με ακρίβεια 431 διακριτές μεταθέσεις για μια υποθετική φυλή που περιλαμβάνει πέντε σαλιγκάρια.
Phi-Το 4 ξεπερνά τα πολύ μεγαλύτερα μοντέλα, συμπεριλαμβανομένου του Gemini Pro 1.5, σε προβλήματα μαθηματικών διαγωνισμών (Πηγή: Microsoft)
Αυτό το επίπεδο ακρίβειας υπογραμμίζει τις δυνατότητές της για τομείς που απαιτούν λογική και μαθηματική αυστηρότητα, όπως τα οικονομικά, η μηχανική και η επιστημονική έρευνα.
Η Microsoft εξήγησε τους στόχους της για το Phi-4 στην επίσημη τεκμηρίωσή της: «Το Phi-4 συνεχίζει να προωθεί τα σύνορα. του μεγέθους έναντι της ποιότητας», ένα συναίσθημα που αντηχούν οι ερευνητές που συνέκριναν την απόδοσή του με μοντέλα με πενταπλάσιο αριθμό παραμέτρων.
Το θεμέλιο της επιτυχίας του Phi-4 βρίσκεται στην εκπαιδευτική του προσέγγιση, η Microsoft αξιοποίησε συνθετικά σύνολα δεδομένων που περιλαμβάνουν περιεχόμενο σε στυλ σχολικού βιβλίου, δίνοντας έμφαση στη μαθηματική λογική, στον προγραμματισμό και. λογική κοινής λογικής. Αυτά τα σύνολα δεδομένων, συνολικά 9,8 τρισεκατομμύρια μάρκες, συμπληρώθηκαν από επιμελημένα δημόσια έγγραφα, ακαδημαϊκά κείμενα και πολύγλωσσα δεδομένα.
“Αντί να χρησιμεύουν ως φθηνό υποκατάστατο για τα οργανικά δεδομένα, τα συνθετικά δεδομένα προσφέρουν άμεσα πλεονεκτήματα”, σημείωσε η Microsoft, σημείωσε η Microsoft. στην τεχνική έκθεσή του, τονίζοντας τον έλεγχο και την προσαρμοστικότητα που παρέχει κατά τη διάρκεια της εκπαίδευσης μοντέλων ασυνέπειες.
Για να βελτιώσει τη λογική και την ευθυγράμμιση του μοντέλου, η Microsoft εφάρμοσε προηγμένες τεχνικές μετά την εκπαίδευση, όπως η εποπτευόμενη βελτιστοποίηση και η άμεση βελτιστοποίηση προτιμήσεων-εξόδους ποιότητας, ενισχύοντας περαιτέρω την ακρίβειά του σε εφαρμογές που αφορούν συγκεκριμένους τομείς.
Open-Source. Διαθεσιμότητα
Η απόφαση να κυκλοφορήσει το Phi-4 ως ανοιχτού κώδικα αντικατοπτρίζει την ευρύτερη στρατηγική της Microsoft για τον εκδημοκρατισμό των εργαλείων τεχνητής νοημοσύνης Οι προγραμματιστές μπορούν πλέον να έχουν πρόσβαση στο μοντέλο στο Hugging Face, όπου είναι όλα τα βάρη του διατίθεται με άδεια MIT. Ο Shital Shah, κύριος μηχανικός της Microsoft, ανακοίνωσε την κυκλοφορία στο X (πρώην Twitter), γράφοντας:”Πολλοί άνθρωποι μας ζητούσαν απελευθέρωση βάρους… Λοιπόν, μην περιμένετε άλλο.”
Μας εξέπληξε η ανταπόκριση στην κυκλοφορία του phi-4 Πολλοί άνθρωποι μας ζήτησαν να απελευθερώσουμε το βάρος τους HuggingFace.co/rcugWBPU4r”>pic.twitter.com/rcugWBPU4r
— Shital Shah (@sytelus) 8 Ιανουαρίου 2025
Η έκδοση ανοιχτού κώδικα επιτρέπει στους προγραμματιστές να προσαρμόσουν το Phi-4 για συγκεκριμένες εφαρμογές χωρίς την υπολογιστική επιβάρυνση που συνήθως σχετίζεται με μεγαλύτερα μοντέλα Η πυκνή αρχιτεκτονική μόνο με αποκωδικοποιητή, μια παραλλαγή του μοντέλου μετασχηματιστή, ελαχιστοποιεί τις απαιτήσεις πόρων, καθιστώντας την προσβάσιμη ακόμη και σε οργανισμούς με περιορισμένη υποδομή.
Ηθικά ζητήματα και επιπτώσεις στον κλάδο
Η κυκλοφορία του Phi-4 της Microsoft υπογραμμίζει τη δέσμευσή της για υπεύθυνη ανάπτυξη τεχνητής νοημοσύνης. Η πλατφόρμα Azure AI Foundry, η οποία αρχικά φιλοξένησε το Phi-4, ενσωματώνει διασφαλίσεις όπως το φιλτράρισμα περιεχομένου και τη δοκιμή αντιπάλου. Αυτά τα μέτρα έχουν σχεδιαστεί για να μετριάζουν κινδύνους όπως μεροληψία, παραπληροφόρηση και δημιουργία επιβλαβούς περιεχομένου.
Με την κυκλοφορία του Phi-4 με άδεια ανοιχτού κώδικα, η Microsoft αντιμετωπίζει επίσης την αυξανόμενη ζήτηση για διαφάνεια στην ανάπτυξη τεχνητής νοημοσύνης. Η κίνηση ευθυγραμμίζεται με τις τάσεις της βιομηχανίας που παρατηρούνται σε εκδόσεις όπως το Meta’s Llama 3.2 και η σειρά Gemma της Google, αν και η εξαιρετική απόδοση του Phi-4 στα σημεία αναφοράς θέτει ένα νέο πρότυπο για τα συμπαγή μοντέλα.
Το Phi-4 αμφισβητεί την υπόθεση ότι τα μεγαλύτερα μοντέλα αμφισβητούν την υπόθεση ότι τα μεγαλύτερα μοντέλα. είναι εγγενώς καλύτερες. Ο συμπαγής σχεδιασμός του όχι μόνο μειώνει το υπολογιστικό και το ενεργειακό κόστος αλλά διευρύνει επίσης την πρόσβαση σε προηγμένες δυνατότητες τεχνητής νοημοσύνης. Αυτή η αποτελεσματικότητα είναι ιδιαίτερα πολύτιμη για μεσαίου μεγέθους οργανισμούς και ερευνητές που δεν διαθέτουν τους πόρους για να αναπτύξουν τεράστια μοντέλα.
Καθώς η τεχνητή νοημοσύνη συνεχίζει να εξελίσσεται, το Phi-4 προσφέρει μια ματιά σε ένα μέλλον όπου μπορούν να συναντηθούν μικρότερα, εξυπνότερα μοντέλα τις απαιτήσεις εξειδικευμένων εργασιών χωρίς συμβιβασμούς στην απόδοση.