Microsoft hat ein Trio neuer künstlicher Intelligenzmodelle unter seinem Phi-Banner eingeführt und sich auf kleinere, effiziente Systeme intensiviert, die zu komplexer Problemlösung in der Lage sind. Das Unternehmen PHI-4-REA-READ-PHI-4-MINI-PLUS. 3,8 Milliarden Parameter. Sie sind ab sofort über Microsoft Azure ai> und das Umarmende Gesichtsplattform Unter zulässigen Lizenzen. Microsoft’s technical documentation asserts that Phi-4-reasoning-plus, enhanced through reinforcement learning, performs competitively with OpenAI’s o3-mini and approaches the capability of DeepSeek-R1 (a 671B parameter model) on certain mathematical evaluations Wie der Aime 2025-Test.
Beide 14B-Modelle Berichten zufolge 128.000-gesete Kontextlänge mit einer Größe von 200 K+ Vokabular. Microsoft erklärte diese Modelle „Gleichgewichtsgröße und Leistung“ und ermöglichte „selbst ressourcenbegrenzte Geräte, um komplexe Argumentationsaufgaben effizient auszuführen. Die PHI-4-Begründung ist eine beaufsichtigte Feinabstimmung (SFT) des ursprünglichen PHI-4-Basismodells, wobei über 1,4 Millionen Beispiele mit Argumentationsschritten verwendet werden, die durch OpenAIs O3-Mini erzeugt wurden. Richtlinienoptimierung (GRPO)-Ein Algorithmus zur Verbesserung von Modellausgaben basierend auf relativen Präferenzen zwischen verschiedenen generierten Antworten-zur Verfeinerung seiner Ausgabe. Das PHI-4-Mini-Reasonierungsmodell wurde im Februar 2024 auf Phi-4-reasoning-plus model.
Evolution of the Phi Family and Strategic Context
Die Start markiert eine Fortsetzung des PHI-Projekts von Microsoft, das mit dem ursprünglichen 14B-Parameter-PHI-4 im Dezember 2024 aufmerksam gemacht wurde. Dieses anfängliche PHI 4-Modell wurde für starke mathematische Leistung vermerkt und erzielte bei AMC 12-Tests vor Wettbewerbern wie Gemini Pro 1.5 (89.8) zum Zeitpunkt. Microsoft verfolgt im Januar 2025 einen vollständig offenen PHI-4-PHI-4, der seine Gewichte auf dem Umarmungsgesicht unter einer MIT-Lizenz veröffentlicht. Warten Sie nicht mehr. Die Familie sah im Februar 2025 eine weitere Expansion mit einem anderen textbasierten Mini-Modell und der pHI-4-multimodalen Variante aus. Die aktuellen Argumentationsmodelle bauen direkt auf den zuvor verwendeten SFT-und synthetischen Datentechniken auf. SLMs gewinnen in Brancheninteresse aufgrund potenzieller Vorteile wie reduzierten Schulungskosten und einfacheren domänenspezifischen Feinabstimmungen. Dieser Ansatz zielt auf Effizienz und Zugänglichkeit ab und senkt möglicherweise die Barriere für Unternehmen und Entwickler. Microsoft integriert PHI-Modelle in sein Ökosystem, wie die für NPUs in Copilot+ PCs optimierte PHI-Silica-Variante. Projekte wie Unloth , ein beliebtes Format für die lokale Ausführung von Modellen auf Verbraucherhardware. Microsoft betonte, dass die PHI-Modelle nach ihrem verantwortungsbewusste AI-Prinzipien für den 14B-Models und den fundierten Fokus auf Englisch auf dem englischen Fokus auf dem Englisch und dem primären Fokus auf dem Englisch und dem primären Fokus auf dem Englisch und dem Fokus auf dem Englisch und dem primären Fokus auf dem Englisch-Fokus entwickelt wurden.