A kínai technológiai óriás, a Baidu csütörtökön Pekingben bemutatta új zászlóshajója AI modelljét, az ERNIE 5.0-t.
A vállalat a Baidu World 2025 rendezvényen mutatta be a rendszert. Szöveg, kép, hang és videó együttes kezelésére készült.
A Baidu azt állítja, hogy 2,4 billió paraméteres modellje a legfontosabb üzleti feladatokban felülmúlja az olyan vezető riválisokat, mint az OpenAI GPT-5.1. Ez magában foglalja az összetett dokumentumok és diagramok megértését.
A kiadás stratégiai lépés a globális vállalati mesterséges intelligencia piacának megszerzésére. Hatékony, hazai gyártású lehetőséget kínál, mivel a Baidu világszerte kiterjeszti mesterséges intelligencia-termékeit.
Az ERNIE 5.0 megköveteli az Enterprise AI Crown-t a dokumentumok és diagramok felett
A Baidu World 2025 rendezvényen bejelentett új modell jelentős lépést jelent a globális mesterséges intelligencia-versenyben.
<5p> szabadalmaztatott, natívan minden modális rendszer, amelyet az alapoktól kezdve úgy terveztek, hogy közösen dolgozzanak fel és generáljanak tartalmat szövegek, képek, hangok és videók között.
Egy reportálása 4 jelentős ugrást jelent a Baidu modellcsaládjának összetettségében.
A nyugati mesterséges intelligencia vezetőinek közvetlen kihívásként a Baidu az ERNIE 5.0-t a vállalati alkalmazások kiváló eszközeként pozicionálta.
A vállalat olyan referenciaértékeket adott ki, amelyek azt sugallják, hogy a modell felülmúlja az OpenAI legújabb GPT-5.1-et, illetve a Google high-value 2.5.5p>Gemini tartományát.
A Baidu azt állítja, hogy határozott előnye van a dokumentumok megértésében, hivatkozva az olyan tesztek legjobb pontszámaira, mint az OCRBench és a DocVQA. A strukturált adatok érvelésében is vezető szerepet tölt be, rámutatva a ChartQA benchmark teljesítményére.
A Baidu ERNIE 5.0 szöveges benchmarkok
A vállalati szempontból kritikus feladatokra való összpontosítás jelzi a Baidu stratégiáját, amely a gyakorlati hasznosság terén kíván versenyezni, nem csupán az általános társalgási képességekkel.
A pénzügyi elemzésekkel foglalkozó vállalkozások számára ezek az alapvető dokumentumok feldolgozó képességei vagy kapacitásai. követelményeknek.
Baidu ERNIE 5.0 Visual Understanding benchmarks.
A modell már elérhető a vállalati ügyfelek számára a Baidu Qianfan felhőplatform API-ján keresztül, és a nyilvánosság számára az ERNIE Bot webhelyén keresztül.
A bevezetés azonban nem volt problémamentes. Lisan al Gaib, a mesterséges intelligencia értékelője vegyes véleményt írt, kijelentve
„Az ERNIE 5.0 benchmarkjai őrültnek tűntek a platformjukkal/sajnos, amíg nem teszteltem az RL-t… rendszerkérdés.”
A Baidu fejlesztői támogatási fiókja gyorsan válaszolt,
„Köszönjük a visszajelzést. Ez egy ismert hiba, amelyen biztosan ki lehet javítani a felszólítás átfogalmazása vagy módosítása, hogy egyelőre elkerüljük” – ismerte el a vállalat, demonstrálva a hangsúlyt a fejlesztőkkel való átlátható kommunikációra.
Kétvágányú stratégia: prémium API-k és nyílt forráskódú alternatívák
Az ERNIE 5.0 a prémium végén helyezkedik el, a Baidu árazási struktúrájától a szándékos árcsökkentés érdekében. Kína mesterséges intelligencia-piaca.
Az API-hozzáférés ára megközelítőleg 0,85 USD/millió bemeneti token és 3,40 USD/millió kimeneti token, ami a költségvetési alternatívák helyett más csúcskategóriás modellekhez igazodik.
Ez azt sugallja, hogy a Baidu bízik a modell nagy teljesítményű teljesítményében az összetett, multimodális feladatokhoz képest.
a nyílt forráskódú közösségben. Néhány nappal az ERNIE 5.0 megjelenése előtt a Baidu kiadta az ERNIE-4.5-VL-t, egy multimodális modellt a megengedő Apache 2.0 licenc alatt, amely lehetővé teszi a nagyvállalatok számára, hogy a dual-tracking ezt a két Baidu-t.
szabadalmaztatott rendszer és a szélesebb fejlesztői közösség képes, korlátlan, nyílt forráskódú eszközökkel.
A BAidu stratégiája egy érlelődő piacot tükröz, ahol az egy méretben használható megközelítés már nem elegendő. Azáltal, hogy csúcskategóriás, teljes mértékben támogatott terméket és rugalmas, nyitott alternatívát kínál, a vállalat az AI ökoszisztéma különböző szegmenseivel foglalkozhat.
Robin Li vezérigazgató úgy fogalmazta meg ezt a jövőképet, hogy hangsúlyozta, hogy a mesterséges intelligenciát alapvető üzleti funkcióvá kell tenni. „A mesterséges intelligencia belsővé tétele natív képességgé válik, és az intelligenciát költségből a termelékenység forrásává alakítja” – nyilatkozta az eseményen.
Globális ambíciók: A Baidu a mesterséges intelligencia ökoszisztémáját a kínai határokon túlra tolja
A vállalat a részletes nemzetközi AI-modell mellett egy jelentős nemzetközi alkalmazássorozatot is létrehoz.
A Baidu számos kulcsfontosságú terméket vezet be a globális piacokon, jelezve azon törekvését, hogy világméretű mesterségesintelligencia-infrastruktúra-szolgáltatóvá váljon, ne csak hazai bajnok legyen. Ezeket a kezdeményezéseket arra tervezték, hogy átfogó ökoszisztémát hozzanak létre alapmodelljei köré.
A kód nélküli alkalmazáskészítője, amely jelenleg globálisan elérhető MeDo néven, lehetővé teszi a technikai szakértelem nélküli felhasználók számára, hogy AI-alapú eszközöket hozzanak létre.
Baidu MeDo
A Baidu bevezette a A Create fora-top termékét is, amely már most is vonzó 1,2 millió felhasználó világszerte.
Továbbá a vállalat Kínában széles körben elterjedt digitális emberi technológiája Brazíliában debütált, és az Egyesült Államokra és Délkelet-Ázsiára kíván terjeszkedni.
Ezt az ökoszisztémát a növekvő felhasználói bázis hajtja. A Baidu általános célú mesterséges intelligencia-ügynöke, a GenFlow a 3.0-s verzióra frissült, és mára több mint 20 millió felhasználót szolgál ki, amivel a Baidu állítása szerint a világ legnagyobb ügynöke a felhasználók száma alapján.
Ez a széles körű alkalmazás kulcsfontosságú adatokat és visszacsatolási hurkokat biztosít az alapul szolgáló modellek finomításához.
A BAidu teljes integrációs stratégiája alátámasztja. Az ERNIE 5.0 bevezetése egybeesett azzal, hogy a Baidu bejelentette az új egyedi Kunlunxin AI chipeket, amelyek célja a modellek táplálása és a külföldi hardvertől való függés csökkentése.
A Baidu számára a szilíciumtól a szoftverig terjedő teljes készlet birtoklása jelenti a végső versenyelőnyt. Ahogy Robin Li kifejtette: „Maguk az AI-ügynökök a legjelentősebb alkalmazások, és a technológiai iteráció sebessége az egyetlen versenyárok.”
Ez az integrált megközelítés, amely a fejlett modelleket egy globális termékcsomaggal ötvözi, a Baidu-t a mesterséges intelligencia bevezetésének következő szakaszában félelmetes versenyzővé teszi.