Moonshot AI που εδρεύει στο Πεκίνο κυκλοφόρησε την Kimi K2 την Παρασκευή, μια σειρά μοντέλων ανοιχτού κώδικα AI που αποσκοπεί στην ανάκτηση της ηγεσίας της αγοράς στον ανταγωνιστικό τομέα AI της Κίνας. Η εκτόξευση είναι μια στρατηγική κίνηση για να αμφισβητήσει τους αντιπάλους όπως το Deepseek και να ανταγωνιστεί παγκοσμίως με τις αμερικανικές εταιρείες.
Το Kimi K2 είναι ένα τεράστιο μοντέλο μείγματος-exper με 1 τρισεκατομμύρια παραμέτρους. Είναι ειδικά σχεδιασμένο για”Agentic Intelligence”, επιτρέποντάς του να εκτελεί αυτόνομα σύνθετα καθήκοντα και να χρησιμοποιεί ψηφιακά εργαλεία. Το Moonshot υπογραμμίζει την ικανότητα του Kimi K2 να ενεργεί, όχι μόνο να συνομιλήσει, τοποθετώντας το ως ισχυρό νέο εργαλείο για τους προγραμματιστές
Ιδρύθηκε το 2023 από τον πτυχιούχο του Πανεπιστημίου Tsinghua Yang Zhilin, το Moonshot AI κέρδισε γρήγορα την εξέχουσα θέση, αλλά η στάση της στην αγορά αμφισβητήθηκε πρόσφατα από επιθετικές κινήσεις από τοπικούς ανταγωνιστές. Αυτή η εκτόξευση είναι μια άμεση και δυναμική απάντηση. Src=”Δεδομένα: εικόνα/svg+xml; nitro-empty-id=mty0ntoxmti3-1, base64, phn2zyb2awv3qm94psiwidagmti4mca3mj Aiihdpzhropsixmjgwiibozwlnahq9ijcymcigeg1sbnm9imh0dha6ly93d3cudzmub3jnlziwmdavc3znij48l3n2zz4=”>>
Ένα στρατηγικό gambit στο άγριο AI Wars της Κίνας Η απελευθέρωση Kimi K2 είναι μια σαφής προσφορά για να αντιστραφεί αυτή η τάση.
Με την ανοικτή προσφορά του μοντέλου ναυαρχίδας, το Moonshot υιοθετεί μια στρατηγική που ευνοείται όλο και περισσότερο από τις κινεζικές εταιρείες τεχνολογίας. Αυτή η προσέγγιση συμβάλλει στην οικοδόμηση μιας ευρείας κοινότητας προγραμματιστών και επεκτείνει την παγκόσμια επιρροή, χρησιμεύοντας ως ισχυρό αντίμετο για τους τεχνολογικούς περιορισμούς των Η.Π.Α. Είναι ένα gambit για να κερδίσει καρδιές και μυαλά μέσω κώδικα. Αυτή η κίνηση στοχεύει στην αποκατάσταση της Kimi ως πλατφόρμα για προγραμματιστές, στοιχηματίζοντας ότι η ανώτερη ικανότητα και ένα ανοιχτό οικοσύστημα μπορούν να κερδίσουν το μερίδιο αγοράς. καθήκοντα. Τα αποτελέσματα υποδεικνύουν ανταγωνιστικές επιδόσεις σε διάφορους βασικούς τομείς, συμπεριλαμβανομένης της κωδικοποίησης, της χρήσης εργαλείων και της σύνθετης συλλογιστικής. Στη δοκιμή κωδικοποίησης Agentic Swench επαληθεύτηκε, η ακρίβεια του μεμονωμένα ήταν 65,8%, τοποθετώντας την πάνω από το 38,8%του Deepseek-V3 και το 54,6%της GPT-4,1, ενώ η βαθμολογία του CLAUDE Sonnet 4 του 72,7%. Στην εργασία Tau2 Telecom, η Kimi K2 σημείωσε 65,8, η οποία ήταν υψηλότερη από τις αναφερόμενες βαθμολογίες για το GPT-4.1 (38.6) και το Claude Sonnet 4 (45.2). Αυτό υποδηλώνει μια ισχυρή ικανότητα για διασύνδεση με εξωτερικά εργαλεία για την ολοκλήρωση των στόχων. Σχετικά με το αναφορά του διαγωνισμού μαθηματικών AIME 2024, η βαθμολογία του 69,6 ήταν υψηλότερη από αυτή του Gemini 2,5 Flash (61,3) και του Claude Opus 4 (48,2). Ομοίως, στη δοκιμή συλλογισμού GPQA-DIAMOND, η βαθμολογία του 75,1 υπερέβη ελαφρώς το CLAUDE OPUS 4’s 74,9. Αυτό το τοποθετεί σε στενό ανταγωνισμό με άλλα μοντέλα Frontier, με το GPT-4.1 να βαθμολογεί 90,4 και Claude Opus 4 να επιτύχει 92,9. Συλλογικά, τα δεδομένα υποδηλώνουν ότι το Kimi K2 είναι ένα εξαιρετικά ικανό μοντέλο, ιδιαίτερα στην κατηγορία ανοιχτού κώδικα. href=”https://moonshotai.github.io/kimi-k2/”target=”_ blank”> 32 δισεκατομμύρια ενεργοποιούνται για οποιοδήποτε δεδομένο token . Αυτή η αρχιτεκτονική, παρόμοια με αυτή που χρησιμοποιείται από τον αντίπαλο Deepseek-V3, έχει σχεδιαστεί για υπολογιστική απόδοση σε μαζική κλίμακα, βασικό παράγοντα για την πρακτική ανάπτυξη. Διαθέτει 384 ξεχωριστούς εμπειρογνώμονες, με οκτώ να επιλέγονται για επεξεργασία κάθε διακριτικού, επιτρέποντας τον εξαιρετικά εξειδικευμένο και αποτελεσματικό υπολογισμό. Αυτός ο σχεδιασμός είναι αποτέλεσμα της ανάλυσης κλιμακωτών δικαίων που αποσκοπεί στη μεγιστοποίηση της απόδοσης του συμβολικού. Για να διαχειριστεί αυτή τη διαδικασία χωρίς αποτυχία, το Moonshot ανέπτυξε ένα νέο βελτιστοποιητή”MuonClip”. Αυτή η τεχνική είναι μια εξέλιξη του Προηγούμενη εργασία στο Muon Optimizer , το οποίο ξεπερνά το πρότυπο Adamw Optimizer, αλλά μπορεί να υποφέρει από αστάθεια σε κλίμακα. Μπορεί να εκτροχιάσει την ανάπτυξη μοντέλων μεγάλης κλίμακας. Η εταιρεία αναφέρει ότι αυτή η μέθοδος της επέτρεψε να ολοκληρώσει ολόκληρη την κατάρτιση των 15,5T Token με το”Zero Training Spike”, υπογραμμίζοντας την ευρωστία της. Αυτό το σύστημα προσομοιώνει σενάρια πραγματικού κόσμου με χιλιάδες εργαλεία, συμπεριλαμβανομένων εκείνων που είναι συμβατά με το πρωτόκολλο μοντέλου περιβάλλοντος (MCP), για τη δημιουργία δεδομένων υψηλής ποιότητας, που βασίζονται σε jubric για τη χρήση εργαλείων. Αυτό συνεπάγεται έναν μηχανισμό αυτο-κρίσης όπου το μοντέλο λειτουργεί ως δικός του κριτικός για να παρέχει ανατροφοδότηση σχετικά με τα καθήκοντα με μη επαληθεύσιμες ανταμοιβές, όπως η γραφή μιας έκθεσης, ένα κρίσιμο βήμα στην ανάπτυξη γενικότερων και αξιόπιστων δεξιοτήτων. το μοντέλο . Το Kimi-K2-Base είναι το θεμελιώδες μοντέλο, που προορίζεται για ερευνητές που χρειάζονται πλήρη έλεγχο για την τελειοποίηση. Το Kimi-K2-Intruct είναι μια μετα-εκπαιδευμένη έκδοση που είναι βελτιστοποιημένη για συνομιλία και περιγράφεται ως”μοντέλο αντανακλαστικής-χωρίς μεγάλη σκέψη”για out-of-box agentic tasks. href=”https://platform.moonshot.ai/”target=”_ blank”> API developer και
Η Agentic Intelligence μετά τη θεμελιώδη βιομηχανία απομακρύνεται από τους βοηθούς του AI που απλώς προτείνουν κείμενο ή κώδικα. Οι πράκτορες της AI έχουν σχεδιαστεί για να κατανοούν έναν στόχο, να δημιουργήσουν ένα σχέδιο και να χρησιμοποιούν εργαλεία για την εκτέλεση σύνθετων εργασιών πολλαπλών βημάτων. Σε μια κίνηση ορόσημο, η επενδυτική τράπεζα Goldman Sachs μόλις άρχισε να δοκιμάζει αυτόνομο AI κωδικοποιητή Devin. Η τράπεζα στοχεύει στην οικοδόμηση ενός”υβριδικού εργατικού δυναμικού”όπου οι ανθρώπινοι μηχανικοί της επιβλέπουν χιλιάδες πράκτορες AI. Το εργατικό δυναμικό με τον Devin, το οποίο θα είναι σαν ο νέος μας υπάλληλος που θα αρχίσει να κάνει πράγματα για λογαριασμό των προγραμματιστών μας”, μεταβάλλοντας την ανθρώπινη εστίαση από την κουραστική κωδικοποίηση σε εποπτεία υψηλού επιπέδου.
Αυτή η τάση δεν περιορίζεται στη χρηματοδότηση. Η ευρύτερη αγορά κωδικοποίησης AI είναι ένα πεδίο μάχης, με την Google να ξεκινά τον πράκτορα Jules και τον ελεύθερο Gemini CLI. Η OpenAI έδωσε την πρόσβαση στο Διαδίκτυο του κώδικα, αν και ο Διευθύνων Σύμβουλος Sam Altman προειδοποίησε τους χρήστες να «διαβάσουν προσεκτικά τους κινδύνους και να χρησιμοποιήσουν όταν έχει νόημα», αναγνωρίζοντας τους εγγενείς κινδύνους. Η ANYSPHERE, κατασκευαστής του δημοφιλούς επεξεργαστή δρομέα AI, ξεκίνησε πρόσφατα μια εφαρμογή ιστού για να διαχειριστεί τους πράκτορες κωδικοποίησης από οποιαδήποτε συσκευή. Αυτή η στρατηγική”πολλαπλών επιφανειών”στοχεύει να καταστήσει το AI ένα περιβάλλον, πάντα παρόν συνεργάτη.