Google DeepMind entre dans la recherche biomédicale avec Txgemma, une suite de modèles d’IA open source conçus pour aider au développement thérapeutique. Sortie fin mars 2025, l’initiative se distingue par son accessibilité, offrant des outils qui peuvent fonctionner sur le matériel de base et s’intègre à des flux de travail biomédicaux spécialisés.
Le package comprend des modèles prédictifs pour évaluer les protéines et les composés, aux côtés d’un agent conversationnel propulsé par GEMINI 1.5 Pro qui automatise les processus de recherche scientifique. Les deux sont disponibles sur des plates-formes comme Face étreint et le sommet AI, avec Colab Notebooks Fourni pour l’expérimentation pratique.
Construit pour Biomedicine . href=”https://develovers.google.com/health-ai-developer-foundations/txgemma/model-card”cible=”_ Blank”> Les modèles principaux de TxGemma sont formés sur des données spécifiques au domaine, avec des tailles de paramètres de 2b, 9b et 27B. The 9B and 27B versions also support conversational interaction for researchers seeking more flexible exchanges.
These models were trained on instruction pairs sourced from the thérapeutique Données Commons (TDC) , leur permettant de traiter et d’évaluer les séquences chimiques, les protéines, les maladies et les lignées cellulaires.
Comme décrit dans la documentation officielle de Google, les modèles TXGEMMA sont conçus
Les modèles peuvent fonctionner en mode de prédiction-avec des entrées étroites et structurées pour des tâches telles que la classification composée-ou en mode chat qui prend en charge le raisonnement multi-tours. En offrant des versions quantifiées, Google garantit qu’ils peuvent être déployés sur des GPU ou des TPU uniques sans compromettre beaucoup sur la précision ou la latence.
Agent-TX: un assistant de recherche avec des outils
agentic-tx est l’autre moitié de la version txGemma. Contrairement aux modèles de base, cet agent ne se concentre pas uniquement sur les prédictions. Au lieu de cela, il est conçu pour mener des flux de travail de recherche entiers à l’aide des capacités de raisonnement de Gemini 1.5 Pro et des outils externes tels que Alphafold, Esmfold et des systèmes de recherche de littérature.
Le système gère les tâches en plusieurs étapes qui nécessiteraient traditionnellement une conservation manuelle ou des scripts multiples. Il permet à un chercheur de commencer par une question-telle que l’identification des sites de liaison pour une protéine-et de recevoir des réponses itératives et soutenues par des outils avec un raisonnement biologique inclus dans la chaîne d’interaction.
GEMMA 2 Contexte de recherche
Alors que Google a introduit par Google. La famille Gemma 2 se compose de modèles de transformateurs uniquement au décodeur optimisés pour un déploiement efficace, même sur les plateformes mobiles et Web. Ces modèles ont été conçus pour soutenir la modularité et les workflows de recherche ouverts, ce qui en fait une base appropriée pour les applications biomédicales.
Gemma 3 elle-même a apporté des mises à niveau notables-telles que le support multimodal, une fenêtre de contexte de 128K et une compatibilité avec plus de 140 langues, mais ces caractéristiques n’étaient pas directement incorporées dans le txgemma. Néanmoins, leur proximité sur le calendrier de sortie illustre la poussée plus large de Google pour étendre les outils d’IA au-delà des modèles de chat à usage général et dans des champs plus spécialisés.
Pour une sécurité et une transparence supplémentaires, l’écosystème GEMMA plus large comprend également Shieldgemma 2, un classificateur de sécurité basé sur l’image, et Gemma Scope , un ensemble de comportements de l’auto de la sparse. Bien que ces outils ne soient pas explicitement emballés avec TXGEMMA, leur existence suggère une philosophie de conception partagée axée sur l’utilisation responsable de l’IA dans les domaines scientifiques.
Pourquoi les accessoires ouverts dans la thérapeutique
TXGEMMA Open-source Research reflète une évolution stratégique vers la transparence et la représentation de la recherche dans la biome. En publiant à la fois les modèles et les outils associés sur les plates-formes accessibles, DeepMind espère abaisser la barrière pour les laboratoires académiques, les startups biotechnologiques et les chercheurs travaillant dans des environnements liés aux ressources.
Google dit que l’objectif est de prendre en charge les limites et les considérations plus efficaces et plus reproductibles. La promesse de Txgemma est claire, l’application du monde réel nécessite toujours une prudence. Les modèles quantifiés peuvent fournir une efficacité améliorée, mais le compromis implique souvent une certaine réduction de la précision. De même, la dépendance de l’agentique-TX à l’égard des outils externes introduit des points de défaillance ou d’incohérence potentielle, en fonction de la façon dont ces systèmes s’intègrent à des flux de travail spécifiques.
En outre, tandis que l’interface conversationnelle des modèles plus importants offre une flexibilité, il pourrait poser des défis dans des environnements hautement réglementés où des sorties déterministes déterministes sont attendues. Une évaluation indépendante des prédictions des modèles sera essentielle avant d’être incorporées dans des pipelines cliniques ou des plateformes de développement de médicaments commerciaux.
Néanmoins, la possibilité d’exécuter des modèles biomédicaux spécifiques au domaine avec un seul accélérateur-et d’interagir avec eux par le langage naturel tout en invoquant des outils scientifiques avancés. Toolkit, pas un système clé en main
Txgemma n’est pas un moteur de découverte de médicaments de bout en bout. Au lieu de cela, il s’agit d’un cadre modulaire-celui qui invite les chercheurs à expérimenter, à itérer et à y construire. Avec un soutien aux modalités thérapeutiques allant de l’analyse de la structure des protéines à la prédiction de la toxicité, il est conçu pour s’adapter aux flux de travail scientifiques existants sans exiger des infrastructures propriétaires ou des services de biologie académique.
collaborateur.