Le géant chinois de la technologie Alibaba a intensifié ses efforts dans le domaine de l’IA grand public jeudi, en annonçant que ses nouvelles lunettes Quark AI seront lancées en décembre au prix de 660 $ pour concurrencer directement Meta.

La société basée à Hangzhou a également dévoilé un nouveau chatbot IA pour son application Quark. Cette avancée en matière de matériel grand public est soutenue par un nouveau système d’entreprise puissant, Aegaeon, dévoilé plus tôt cette semaine, qui réduit les coûts opérationnels de l’IA de 82 %.

Ensemble, ces annonces signalent une stratégie globale visant à construire un écosystème d’IA économiquement durable, s’attaquant à la fois au marché grand public et aux coûts immenses nécessaires à son fonctionnement.

Une attaque sur deux fronts : les gadgets grand public soutenus par l’efficacité de l’entreprise

Avec sa dernière révélation sur le matériel, Alibaba fait un pari calculé sur l’avenir de l’IA grand public. La société a annoncé jeudi que ses lunettes Quark AI seraient disponibles en prévente le 24 octobre.

Au prix de 4 699 yuans chinois (659,4 dollars), avec une expédition en décembre, les lunettes sont alimentées par les grands modèles linguistiques avancés Qwen de la société et prennent en charge des fonctionnalités telles que les appels mains libres et la traduction en temps réel.

Parallèlement au nouveau matériel, Alibaba a également lancé AI Chat Assistant, un nouveau chatbot. mode dans son application Quark existante. Cette décision met en évidence l’importance croissante accordée aux produits d’IA destinés aux consommateurs, un domaine où l’expérience utilisateur est primordiale.

Mais derrière cette poussée élégante des consommateurs se cache une innovation d’entreprise essentielle conçue pour rentabiliser l’ensemble de l’entreprise.

Résoudre les immenses dépenses opérationnelles liées à l’inférence de l’IA reste un obstacle majeur à une adoption généralisée. Plus tôt cette semaine, Alibaba a dévoilé sa dernière solution: un système appelé Aegaeon qui utilise la « mise à l’échelle automatique au niveau des jetons » pour réduire les coûts des GPU jusqu’à 82 %.

Au cours d’un essai de trois mois, le système a permis à Alibaba Cloud de servir sa vaste collection de modèles d’IA en utilisant seulement 213 GPU au lieu des 1 192 précédemment requis.

Cette avancée cible directement la non-durabilité économique liée à l’exploitation de milliers de modèles d’IA spécialisés et rarement utilisés, ce qui rend viable le marché tentaculaire de l’IA d’Alibaba.

Alibaba entre dans un champ encombré : la course croissante au matériel d’IA

Les nouvelles lunettes d’Alibaba entrent dans une bataille de plus en plus encombrée et aux enjeux élevés entre les géants de la technologie pour définir le prochain grand informatique plate-forme.

Le leader actuel du marché, Meta, a pris une longueur d’avance significative grâce à son partenariat pluriannuel avec la société mère de Ray-Ban, EssilorLuxottica.

Bien que Meta ait établi une avance rapide sur le marché des wearables, sa stratégie évolue.

La société a récemment dévoilé ses lunettes Meta Ray-Ban Display à 799 $, dotées d’un affichage tête haute pour les notifications et d’un port au poignet. « Neural Band » pour le contrôle gestuel.

Image : Lunettes intelligentes Meta Ray-Ban Display

Elle cible également de nouveaux marchés avec les Oakley Meta Vanguard, conçues pour les athlètes. Comme l’a déclaré Alex Himel, responsable des wearables chez Meta,”c’est notre premier pas dans la catégorie performance. Il y a plus à venir.”Pour accélérer son écosystème, Meta ouvre également sa plateforme aux développeurs tiers avec une nouvelle boîte à outils d’accès aux capteurs, dans le but de créer une masse critique d’applications avant que ses concurrents ne puissent rattraper leur retard.

D’autres géants ne sont pas loin derrière. Amazon serait en train de développer son propre appareil AR grand public, nommé « Jayhawk », pour un lancement potentiel en 2026 ou 2027. Apple, quant à lui, serait en train d’accélérer son propre projet de lunettes intelligentes IA, signalant un tournant stratégique majeur.

Cette poussée à l’échelle de l’industrie reflète une croyance partagée dans le potentiel de cette nouvelle catégorie d’appareils. Comme l’a déjà déclaré Song Gang d’Alibaba, « les lunettes IA deviendront la forme la plus importante d’intelligence portable – elles serviront de paire d’yeux et d’oreilles supplémentaires pour les humains. »

Cependant, la prolifération de ces appareils intégrés équipés d’une caméra soulève de profondes questions en matière de confidentialité. Bâtir la confiance du public est un obstacle de taille pour chaque entreprise dans la course.

Au-delà de la force brute : la guerre à l’échelle de l’industrie contre les coûts de l’IA

La planification intelligente d’Aegaeon représente un front dans une guerre à l’échelle de l’industrie contre les coûts opérationnels stupéfiants de l’IA. Alors que le prix de la formation et de l’inférence reste un obstacle majeur à l’adoption, les principaux acteurs attaquent le problème d’efficacité sous différents angles, créant ainsi un paysage diversifié d’innovation.

Une approche populaire consiste à repenser l’architecture du modèle elle-même. Les récents modèles Granite 4.0 d’IBM, par exemple, utilisent une conception hybride qui mélange des blocs Transformer traditionnels avec des couches Mamba très efficaces pour réduire la charge de calcul de base.

Rechercher l’efficacité de cette manière signifie construire un moteur fondamentalement plus simple à partir de zéro.

Des approches plus radicales émergent également qui remettent entièrement en question le paradigme de mise à l’échelle. Cet été, des chercheurs ont dévoilé un modèle de vision semblable au cerveau qui imite les structures neuronales humaines pour une efficacité énergétique supérieure.

L’un de ses co-auteurs, Zejin Lu, a expliqué le concept :”Pour les humains, lorsque vous détectez certains objets, ils ont une position typique. Vous savez déjà que les chaussures sont généralement en bas, au sol. L’avion, c’est en haut.”

Son modèle résultant consomme plus dix fois moins d’énergie qu’une IA standard, ce qui prouve qu’un design élégant peut parfois battre le calcul par force brute.

Aegaeon d’Alibaba est une approche puissante et complémentaire à ces autres méthodes. Cela démontre qu’une ingénierie de systèmes sophistiquée peut générer des économies aussi importantes que celles résultant d’une refonte architecturale.

En s’attaquant simultanément au matériel destiné aux consommateurs et à l’économie back-end, Alibaba se positionne non seulement pour rivaliser dans la course aux armements de l’IA, mais pour la gérer de manière durable.

Categories: IT Info