Microsoft a introduit GigaPath, un modèle de transformateur de vision (ViT) visant à aborder les complexités du numérique pathologie. Développé en collaboration avec Providence Health System et l’Université de Washington, ce modèle promet d’améliorer l’analyse pathologique de la lame entière à l’aide de méthodes informatiques avancées.
GigaPath répond aux exigences informatiques des lames gigapixels : des images nettement plus grandes que les lames classiques. – en employant des mécanismes d’auto-attention dilatés. Cette technique permet au modèle de gérer les calculs approfondis requis pour analyser des images aussi volumineuses. La pathologie numérique implique généralement la conversion de lames de verre traditionnelles en images numériques, facilitant ainsi une visualisation, une analyse et un stockage améliorés.
Développement et formation collaboratifs
Le développement de GigaPath est le résultat d’un effort de collaboration entre Microsoft, Providence Health System et l’Université de Washington. Prov-GigaPath est un modèle de base de pathologie à lame entière en libre accès. Il a été pré-entraîné sur un milliard de tuiles d’images pathologiques de 256 x 256 dérivées de plus de 170 000 diapositives entières, en utilisant des données réelles. Tous les calculs ont été effectués chez le locataire privé de Providence, avec l’approbation du Providence Institutional Review Board (IRB).
Le processus de formation de GigaPath implique un processus en deux étapes approche d’apprentissage du curriculum. Cela commence par un pré-entraînement au niveau des tuiles utilisant le le transformateur de vision auto-supervisé de Meta, modèle DINOv2, et progresse vers un pré-entraînement au niveau des diapositives avec un pré-entraînement masqué. encodeur automatique et LongNet. La méthode d’auto-supervision DINOv2 combine perte de reconstruction masquée et perte contrastive pour entraîner les transformateurs de vision. L’attention dilatée de LongNet est adaptée à la modélisation au niveau des diapositives, en segmentant la séquence de tuiles en morceaux gérables et en mettant en œuvre une attention clairsemée pour les segments plus longs.
Mesures de performances et applications
GigaPath a montré des performances remarquables, dépassant le deuxième meilleur modèle dans 18 des 26 tâches liées au sous-typage et à la pathomique du cancer. Le sous-typage du cancer consiste à catégoriser des sous-types spécifiques à l’aide de diapositives pathologiques, tandis que les tâches pathologiques classent les tumeurs en fonction d’altérations génétiques thérapeutiquement importantes. Prov-GigaPath a démontré des performances supérieures, en particulier dans le scénario pan-cancer, obtenant des améliorations notables de l’AUROC et de l’AUPRC par rapport à d’autres méthodes.
L’efficacité du modèle a été validée davantage à l’aide des données du Cancer Genome Atlas Program (TCGA), où il a systématiquement surpassé les autres approches. La capacité de GigaPath à extraire des caractéristiques morphologiques génétiquement liées au cancer pan-cancer et à des sous-types spécifiques au niveau de la lame entière souligne son potentiel pour de futures recherches sur la biologie complexe du microenvironnement tumoral.
Les progrès de Microsoft en matière d’IA générative ont joué un rôle un rôle crucial dans le développement de GigaPath. Le processus de transformation d’une lame de microscopie standard de tissu tumoral en une image numérique haute résolution est désormais largement accessible. Dans une étude publiée dans Nature, les chercheurs à l’origine de GigaPath ont détaillé diverses applications de l’outil pour l’analyse de la pathologie. images. L’étude a révélé que GigaPath a amélioré le sous-typage du cancer pour neuf types de cancer majeurs et a surpassé toutes les approches concurrentes sur les tâches de sous-typage.
Une étape importante pour la médecine de précision
GigaPath devrait bénéficier à la médecine de précision, qui se concentre sur la compréhension du traitement et de la prévention des maladies en tenant compte de la constitution et des caractéristiques génomiques spécifiques d’un individu. Avec des milliards de dollars investis dans la médecine de précision, la recherche dans ce domaine progresse rapidement, démontrant la valeur de cette industrie.
Malgré le potentiel prometteur de GigaPath, le parcours pour intégrer cette technologie dans les environnements cliniques et à grande échelle la mise en place des paramètres pertinents ne fait que commencer. Les innovateurs et les leaders de l’industrie doivent relever les défis liés à l’intégration de cette technologie d’une manière qui garantit des résultats de santé précis, la confidentialité et les principes d’utilisation éthique. S’il est réalisé correctement, GigaPath pourrait avoir un impact significatif sur le domaine de la pathologie numérique.