Le terme « intelligence artificielle » a souvent été associé au concept de technologie futuriste capable de décupler les capacités de recherche et de développement technologique. L'intelligence artificielle existe depuis les années 1950 et a été utilisée de bien des manières différentes depuis sa création. Pour simplifier, l'intelligence artificielle (IA) désigne toute technologie permettant aux machines de mimer l'intelligence humaine. L'IA peut être classée parmi les techniques plus avancées dites d'« apprentissage automatique », qui utilisent des méthodes statistiques pour permettre aux machines d'apprendre à réaliser des tâches à partir de données, sans qu'aucune programmation explicite ne soit faite. La forme d'IA la plus pointue est appelée « apprentissage profond ». Cette technique fait appel à des réseaux neuronaux organisés en plusieurs couches capables d'apprendre des représentations et des tâches directement à partir d'ensembles de données complexes. La technologie d'apprentissage profond est devenue si puissante qu'elle dépasse bien souvent les capacités humaines pour la précision de la classification des images.
Figure 1. Chronologie du développement de l'intelligence artificielle.
L'IA, et plus spécifiquementt la technologie d'apprentissage profond, peut facilement être utilisée en microscopie pour permettre aux chercheurs d'analyser de façon plus fiable et plus rapidement leurs données. Les réseaux neuronaux de la technologie TruAI™ d'Olympus sont des réseaux neuronaux convolutifs capables de segmenter les objets avec une grande flexibilité pour l'analyse d'ensembles de données complexes. Ces réseaux peuvent analyser plusieurs types de données ou d’indices et prendre des décisions relatives à ces données, une tâche qui, si elle est réalisée manuellement, peut être sujette à des erreurs humaines. Cette note d'application illustre concrètement ce que la technologie TruAI, comparativement à d'autres outils d'IA moins pointus, apporte à l'analyse automatique par segmentation de neurones c-Fos positifs dans le cerveau d'une souris.
Au cours de cette expérience, le chercheur a eu besoin de quantifier l'expression des neurones C-Fos positifs au niveau de l'hippocampe (région cérébrale responsable de la mémoire et de l'apprentissage) afin d'évaluer les conséquences systémique de la perturbation de la neurogenèse. Le proto-oncogène C-Fos est une protéine dont l'expression peut être utilisée comme marqueur de l'activité neuronale. Les méthodes de segmentation morphométrique ou en fonction de l’intensité conventionnelle ne sont pas suffisamment efficaces pour générer des ensembles de données fiables. En effet, ces derniers présentent des niveaux de bruit de fond et des niveaux d'intensité cibles variables, qui compliquent les tentatives d'analyse manuelle (figure 2) et nécessitent une vérification chronophage des résultats afin d'éliminer les faux positifs.
Figure 2. Exemple du type d'ensembles de données devant être analysé par segmentation : photocollage représentant toute la région de l'hippocampe d’une souris transgénique exprimant la protéine fluorescente tdTomato sous le contrôle du promoteur du gène c-Fos (à gauche) et images individuelles illustrant la variabilité du signal c-Fos et des niveaux de bruit de fond des images du photocollage (à droite). Empilement Z d'images 1k x 1k acquises avec un objectif x10 SAPO et un zoom x2 à 1 AU.
Le protocole d'entraînement du réseau neuronal (NN) de la technologie TruAI nécessite tout d'abord de posséder un ensemble de données « d'entraînement » établissant la vérité de terrain en vue de la réalisation de futures identifications et analyses. Cette vérité de terrain peut être basée sur des annotations de données brutes par l'utilisateur ou peut être automatiquement générée par la fonction de segmentation et de seuillage morphométrique/d'intensité du logiciel cellSens. À partir de ces données initiales, pendant la période d’entraînement itératif, le réseau neuronal TruAI apprend et utilise les ensembles de données expérimentales et l’utilisateur n’a pas besoin de fournir des données supplémentaires. Cet établissement de la vérité de terrain est ce qui permet au réseau neuronal TruAI de faire la différence entre ce qui est réel (cible) et ce qui ne l'est pas (non cible). Au cours de cette expérience, huit ensembles de données contenant différents niveaux d'expression de la protéine c-Fos ont été utilisés pour entraîner le réseau neuronal TruAI (figure 3). Sur la base de ces ensembles de données, le réseau neuronal TruAI a suivi un entraînement rigoureux de 40 000 itérations pour générer le réseau neuronal qui sera utilisé pour l'analyse de toutes les images suivantes. Au cours de l'entraînement itératif, une image de validation, sélectionnée dans l'ensemble d'entraînement initial, a été contrôlée et utilisée à des fins de comparaison.
Figure 3. Ensembles de données d'entraînement utilisés pour la génération du réseau neuronal TruAI : huit ensembles de données présentant différents niveaux d'expression ont été utilisés pour différencier les objets (en rouge) du bruit de fond (en gris).
Une fois le réseau neuronal TruAI entraîné généré, il a été utilisé pour le traitement et l'analyse par lot des ensembles de données restants. La figure 4 représente la carte de probabilité et l'analyse par segmentation subséquente réalisée à l’aide du réseau neuronal TruAI résultant. À l’aide du réseau neuronal TruAI, l'ensemble de données a été segmenté en fonction de la couche de probabilité et a automatiquement été passé dans les algorithmes de classification et de fractionnement pour effectuer la numération des cellules c-Fos positives à partir de l'intensité moyenne, de l'intensité totale et de la surface. La fonction Gestionnaire de macro du logiciel cellSens a permis le traitement par lot de tous les ensembles de données restants.
Figure 4. Utilisation du réseau neuronal pour le seuillage et la segmentation : le microscope FV3000 a acquis une image des cellules c-Fos positives (à gauche), carte de probabilité des cellules c-Fos positives générée par le réseau neuronal (au milieu) et segmentation des cellules c-Fos positives en fonction de la couche de probabilité (à droite) ; les données ont été fractionnées de manière automatique et classifiées en fonction de l'intensité moyenne, de l'intensité totale et de la surface.
Comme indiqué précédemment, l’avantage de l'utilisation de la technologie d'apprentissage profond pour l'analyse des images est qu’elle permet d'identifier de manière plus fiable des objets par rapport aux autres technologies d'IA. Au cours de cette expérience, la technologie d'apprentissage profond TruAI a utilisé huit ensembles de données dans 40 000 itérations d’entraînement au total pour générer un réseau neuronal capable d'analyser les ensembles de données restants. L'avantage de l’utilisation de tels protocoles d'entraînement fiables est qu’ils permettent au réseau neuronal d’identifier les objets de façon plus fiable sur des images difficiles à analyser, comme des images avec un bruit de fond élevé et une faible expression de la protéine cible. Cet avantage est illustré dans la figure 5. Dans cet exemple, les performances du réseau neuronal TruAI ont été comparées à celles d'un réseau neuronal moins bien entraîné avec seulement un ensemble de données d’ entraînement. On observe que les deux algorithmes ont réussi à identifier le même nombre de cellules lorsque le niveau d'expression est élevé. Toutefois, lorsque le niveau d'expression est faible, le réseau le moins bien entraîné à surestimer par pratiquement un facteur deux le nombre de cellules c-Fos positives, un résultat susceptible d'avoir un impact sur les conclusions de l'expérience. La technologie d'apprentissage profond TruAI se comporte mieux face à des variations de niveaux de bruit de fond et d'intensité du signal c-Fos et produit des résultats plus fiables sans avoir besoin d'effectuer une vérification manuelle des données en vue d'éliminer les faux positifs.
Figure 5. Comparaison des taux d'identification des cellules c-Fos positives d’un réseau neuronal moins bien entraîné et du réseau neuronal TruAI ; les barres orange représentent les résultats obtenus avec le réseau neuronal moins bien entraîné généré suite à un entraînement avec un seul ensemble de données et 2000 itérations d’entraînement, tandis que les barres bleues représentent les résultats obtenus avec le réseau neuronal TruAI généré avec huit ensembles de données et un total de 40 000 itérations d’entraînement.
Concernant l'IA, j'estime que celle-ci a, pour deux raisons, un impact bénéfique sur la recherche scientifique. Quand je parle de ce type de systèmes, je ne cesse de répéter qu'ils nous aident à éliminer les biais liés à l’expérimentateur lors de la quantification des images car, même si pour une raison quelconque l’expérimentateur ne peut être tenu dans l’ignorance des conditions expérimentales, avec l’IA, ce n’est pas lui qui décide ce qui est et de ce qui n’est pas une cellule marquée dans l'échantillon de tissu analysé. Outre les biais, ces systèmes permettent également de réduire la variabilité entre chaque expérimentateur et chaque expérience menée dans le laboratoire et donc d’accroître la reproductibilité de nos données. Je pense que ce type d'approche est essentiel pour s'assurer que nous prenons des mesures adaptées en vue de résoudre les problèmes de reproductibilité qui affectent actuellement les sciences. |
Remerciements
Cette note d’application a été rédigée avec l’aide du chercheur suivant :
Dr Jonathan Epp, University of Calgary
Please adjust your selection to be no more than 5 items to compare at once
Not Available in Your Country
Sorry, this page is not
available in your country.
You are being redirected to our local site.