Dans le cadre d’une avancée majeure pour la recherche médicale, des scientifiques de Google DeepMind et de l’université de Yale ont utilisé une nouvelle IA pour découvrir une voie potentielle de traitement du cancer. Le modèle de 27 milliards de paramètres, appelé C2S-Scale 27B, a été dévoilé le 15 octobre 2025.
Il a analysé des données unicellulaires pour former une nouvelle hypothèse : un médicament spécifique pourrait amplifier la capacité du système immunitaire à cibler des tumeurs autrement « invisibles ». Les chercheurs ont ensuite validé avec succès cette prédiction générée par l’IA dans des expériences en laboratoire.
Ce succès marque un moment charnière pour « l’IA pour la science ». Cela montre que les grands modèles peuvent non seulement traiter des informations, mais également générer des idées originales et testables. Cela pourrait accélérer le développement de nouveaux traitements médicaux et changer la manière dont la recherche biologique est menée.
De l’écran virtuel à la découverte validée
L’un des principaux défis de l’immunothérapie du cancer réside dans le fait que de nombreuses tumeurs sont « froides », c’est-à-dire invisibles pour le système immunitaire de l’organisme. Une stratégie clé consiste à les rendre « chauds » en les forçant à afficher des signaux de déclenchement immunitaire via un processus appelé présentation de l’antigène.
Pour trouver un moyen d’y parvenir, les chercheurs ont chargé le C2S-Scale 27B d’une mission très spécifique. Ils ont conçu un « écran virtuel à double contexte » pour trouver un médicament agissant comme un amplificateur conditionnel, simulant les effets de plus de 4 000 médicaments.
Le « double contexte » l’approche était essentielle. Le modèle devait trouver un médicament efficace uniquement dans un contexte adapté au patient et présentant des signaux immunitaires, mais inefficace dans un contexte de laboratoire isolé. Cette précision nécessitait un niveau sophistiqué de raisonnement conditionnel.
Le meilleur candidat de l’IA était le silmitasertib (CX-4945). Le modèle prédit que cela augmenterait fortement la présentation des antigènes dans le contexte cible, mais aurait peu d’effet autrement. Il s’agissait d’une nouvelle hypothèse, car le médicament n’avait aucun lien précédemment signalé avec ce mécanisme spécifique.
Pour tester la prédiction, l’équipe a fait passer l’hypothèse de l’ordinateur au laboratoire. Ils ont utilisé des modèles de cellules neuroendocrines humaines, un type de cellule que l’IA n’avait jamais rencontré au cours de sa formation. Les résultats ont été une confirmation éclatante de l’hypothèse du modèle.
Cette étape, passant d’une prédiction informatique (in silico) à un test en laboratoire (in vitro), est la référence en matière de validation des hypothèses biologiques basées sur l’IA. Les expériences ont montré que même si le médicament ou l’interféron à faible dose avaient peu d’effet seuls, leur combinaison produisait une amplification synergique marquée.
Les lois d’échelle et l’aube de la biologie générative
Les réalisations de Google fournissent des preuves solides en faveur de la théorie des « lois d’échelle » en biologie. Le concept, qui a alimenté la récente explosion des grands modèles de langage, postule qu’à mesure que les modèles grandissent, ils ne se contentent pas de s’améliorer: ils peuvent acquérir des capacités entièrement nouvelles et émergentes.
Les capacités émergentes sont des capacités qui ne sont pas explicitement programmées mais qui apparaissent à mesure qu’un modèle grandit en taille et en complexité. Pour C2S-Scale, cela signifiait qu’il pouvait effectuer le raisonnement conditionnel nécessaire pour comprendre la logique « si-alors » du contexte immunitaire, une tâche qui avait échappé aux modèles plus petits.
Le modèle C2S-Scale, construit sur l’architecture ouverte Gemma 2 de Google, l’a démontré en générant une idée scientifique testable. Comme l’explique Shekoofeh Azizi de Google DeepMind,”ce résultat fournit également un modèle pour un nouveau type de découverte biologique.”
Cela représente un changement fondamental de l’IA en tant que simple outil d’analyse de données à un partenaire créatif dans la découverte scientifique. Le succès du modèle suggère un avenir dans lequel l’IA pourra exécuter des écrans virtuels massifs pour découvrir des mécanismes biologiques complexes et dépendants du contexte.
La nouvelle approche pourrait considérablement raccourcir le chemin entre la recherche initiale et les pistes thérapeutiques viables. L’équipe a déclaré que cela prouve que des modèles plus grands « peuvent créer des modèles prédictifs du comportement cellulaire qui sont suffisamment puissants pour… générer des hypothèses biologiquement fondées ».
Un nouvel outil dans l’écosystème ouvert « IA pour la science »
Le projet C2S-Scale 27B fait partie d’une tendance plus large de l’industrie vers la création d’une IA spécialisée pour les domaines scientifiques. Google développe activement son « Gemmaverse » avec des modèles comme TxGemma pour la découverte de médicaments. Cela reflète une stratégie axée sur des applications ciblées et à fort impact.
Microsoft poursuit une initiative similaire « IA pour la science », en lançant des outils tels que BiomedParse pour l’analyse d’images médicales et un modèle de détection d’anomalies pour détecter le cancer du sein. Ces efforts parallèles soulignent un pivot stratégique dans l’ensemble du secteur.
Conformément à l’esprit de science ouverte, Google et Yale ont rendu le modèle C2S-Scale 27B, son code sous-jacent et le document de recherche accessibles au public sur des plateformes telles que Hugging Face et GitHub. Cela permet à la communauté mondiale de la recherche de s’appuyer sur ses travaux.
Cette approche ouverte est cruciale pour la validation scientifique. En publiant ces outils, Google et Yale invitent à l’examen et à la collaboration, permettant à d’autres chercheurs de reproduire leurs découvertes et d’explorer de nouvelles hypothèses. Cela favorise un environnement de recherche plus transparent.
Bien que cette découverte constitue une réalisation historique, le chemin vers une application clinique est long. L’IA en médecine est confrontée à des obstacles importants, qu’il s’agisse d’assurer une fiabilité dans le monde réel ou de naviguer dans l’éthique complexe de la confidentialité des données des patients, une préoccupation soulignée par d’autres IA de santé à grande échelle.
Comme le professeur Moritz Gerstung du DKFZ l’a noté à propos d’un modèle prédictif similaire, « des modèles génératifs tels que le nôtre pourraient un jour aider à personnaliser les soins et à anticiper les besoins de santé à grande échelle. » Ce travail, en passant de la prédiction pure à la découverte validée, rapproche cette vision de la réalité.