Connect

Comment l'apprentissage en profondeur pourrait donner un coup de pouce aux médecins ?

31 juillet 2023

France

Les recherches de Jingqing Zhang sur le traitement du langage naturel visent à extraire les données pertinentes des dossiers médicaux électroniques. Par Lucy Goodchild van Hilten | 21 02 2022

Cet article est une traduction française de l'article : "How deep learning could give doctors a helping hand".

Dans le monde, on compte plus de 9 millions de médecins et 18 millions d'infirmièresopens in new tab/window, qui prennent tous des notes sur leurs patients. Ces notes prennent de plus en plus la forme de dossiers médicaux électroniques (DME). Collectivement, les DME fournissent des informations sur la manière dont les professionnels de la santé prennent des décisions de traitement et établissent des diagnostics.

Cependant, l'exploitation intelligente de ces informations textuelles à grande échelle reste un défi.

L'une des façons de le relever est de développer un type d'intelligence artificielle appelé "cadre d'apprentissage profond (deep-learning)", capable de marquer, ou d'annoter, le texte avec des informations plus structurées et plus faciles à analyser. Jingqing Zhangopens in new tab/window (张敬卿), candidat au doctorat de l'Imperial College de Londresopens in new tab/window, a travaillé sur cette approche, en collaboration avec LexisNexis, dans le cadre du programme universitaire LexisNexis Risk Solutions HPCC Systemsopens in new tab/window. LexisNexisopens in new tab/window fait partie de RELXopens in new tab/window, la société mère d'Elsevier.

Jingqing espère développer un cadre d'apprentissage profond qui "rendra le processus de décision clinique plus intelligent, précis et personnalisé."

Une connexion fortuite

Jingqing a commencé à travailler avec le traitement du langage naturel (NLP) durant ces études en Computer Science and Technology à l'Université Tsinghuaopens in new tab/window en Chine. En 2016, il a déménagé à Londres et a poursuivi ces études en master de recherche et doctorat à l’Imperial’s Department of Computingopens in new tab/window.

La collaboration avec LexisNexis a été établie par le superviseur de Jingqing, le professeur Yi-Ke Guoopens in new tab/window, codirecteur du Data Science Instituteopens in new tab/window et professeur à la Faculty of Engineering at Imperialopens in new tab/window. "Mes intérêts de recherche initiaux portaient sur le traitement du langage naturel, et mon superviseur a proposé cette collaboration grâce à ses relations chez LexisNexis", a déclaré Jingqing. "J’ai pensé que c'était une excellente idée, alors je suis allé de l'avant".

La connexion entre Jingqing et LexisNexis est peut-être le fruit du hasard, mais elle s'est avérée être une collaboration productive grâce à leurs intérêts communs.

Jingqing a déclaré :

« LexisNexis est intéressé par la façon dont nous pouvons appliquer leur système de traitement des données, qui s'appelle HPCC Systemsopens in new tab/window, dans notre flux de données. Nous utilisons leur système pour traiter plus efficacement les données textuelles dont nous disposons, puis nous appliquons nos algorithmes d'apprentissage profond pour en extraire les données pertinentes. »

Les décisions cliniques comme étude de cas

Les modèles d'apprentissage profond et le traitement automatique des langues peuvent être appliqués dans tous les secteurs et domaines pour comprendre les processus décisionnels. Jingqing travaille sur la technologie de manière plus large et souhaite qu'elle soit adaptée à toute tâche de PNL.

Au début de son programme universitaire, il a exploré différentes idées et essayé de valider les modèles d'apprentissage profond classiques en utilisant des données séquentielles, notamment des données textuelles et des données de trafic. L'année dernière, il a travaillé sur des données de grand volume disponibles sur internet. Pour son doctorat, il avait besoin d'une étude de cas ; il a choisi le domaine clinique, comme il l'a expliqué :

« Nous nous intéressons aux scénarios qui nécessitent une certaine explication, comme les décisions cliniques. Nous devons par exemple comprendre pourquoi les médecins prescrivent un certain type de médicament à une dose particulière plutôt qu'un autre médicament à une dose différente. Nous pensons que l'utilisation des informations contenues dans les dossiers médicaux électroniques peut nous aider à trouver des connexions et à extraire des renseignements. »

Les données contenues dans les dossiers de santé électronique constituent une sorte de connaissance préalable. Il existe deux types de connaissances préalables : non structurées et structurées. Les connaissances antérieures non structurées se présentent sous forme de texte et peuvent être trouvées dans un grand corpus de textes, comme les dossiers de santé électronique, Wikipédia, les articles de presse et les livres. Les connaissances structurées peuvent être définies par une ontologie - une sorte de taxonomie qui décrit les catégories et les relations entre elles pour un certain sujet.

Jingqing utilise les connaissances de base, telles que les dossiers de santé électronique, avec des modèles d'apprentissage profond pour comprendre le traitement du langage naturel.

Notre question est la suivante : comment pouvons-nous combiner efficacement ces connaissances de base dans le modèle d'apprentissage profond et extraire l'intelligence de si grandes quantités de données non structurées ?

C'est là que l'annotation entre en jeu. Jingqing peut connecter une ontologie aux données non structurées en les annotant avec des catégories pertinentes. Pour les DME, cela signifie qu'il faut annoter les données avec les catégories qui sont répertoriées dans l'ontologie des phénotypes humains (HPO)opens in new tab/window. En pratique, cela signifie qu'une étiquette est placée dans le texte du DME si une "anomalie" est notée et elle peut aller d'un résultat d'analyse sanguine à une fracture osseuse.

Apprentissage profond et médecine de précision

Jingqing a présenté ces travaux lors d'un séminaire pour Elsevier : Integrating Prior Knowledge with Learning in Natural Language Processingopens in new tab/window. Jusqu'à présent, ils ont testé le cadre sur un sous-ensemble d'anomalies phénotypiques de l'HPO. Ils prévoient d'étendre l'annotation à l'ensemble des 13 000 anomalies répertoriées.

Les résultats de ces travaux sont jusqu'à présent positifs : les expériences ont montré que la méthode est efficace, efficiente et évolutive, et Jingqing et ses collègues pensent qu'elles pourraient fournir une meilleure indication pour le diagnostic des maladies. Cependant, contrairement à certaines affirmations, Jingqing ne voit pas l'IA prendre le rôle du médecin :

« L'algorithme est toujours un assistant pour le clinicien, qui prendra ses propres décisions sur la base de ses connaissances spécialisées. Un modèle d'apprentissage profond lui fournirait des informations utiles - par exemple, au lieu de lire 200 pages d'informations dans différents documents, l'algorithme pourrait filtrer les informations importantes dont il a besoin pour prendre sa décision. »

Jingqing pense également qu'à l'avenir, les modèles d'apprentissage profond seront en mesure de rendre le processus de décision clinique plus intelligent, précis et personnalisé, favorisant une médecine de précision.

« Il y a beaucoup de données disponibles, mais il n'y a pas de technologie à l'heure actuelle qui puisse tirer parti de tout cela pour l’homme, probablement en raison de goulots d'étranglement technologiques et réglementaires. Mais je pense que ce sera la direction à prendre pour une médecine plus précise ou intelligente. Si nous pouvons comprendre les données pour les décisions cliniques ou la recherche pharmaceutique, j'espère que nous aurons un impact énorme sur l'avenir. »

Les recherches se poursuivent et Jingqing devrait terminer son doctorat à la fin de l'année 2021 :

« Après avoir obtenu mon diplôme, je veux rejoindre l'industrie, peut-être en travaillant sur le traitement du langage naturel et les données cliniques pour faire avancer cette recherche. »

Lisez-en plus sur le travail de Jinqingopens in new tab/window

Lucy Goodchild van Hilten

Rédactrice indépendante pour TellLucy

Après quelques accidents, Lucy Goodchild van Hilten a découvert qu'elle était bien meilleure écrivaine que scientifique. Après avoir obtenu une maîtrise en histoire des sciences de la médecine et de la technologie à l'Imperial College de Londres, elle est devenue rédactrice adjointe de Microbiology Today.

Après un passage au service de presse de l'Imperial College, ses articles ont fait la une des journaux et elle a déménagé à Amsterdam pour travailler chez Elsevier en tant que directrice principale de la communication marketing pour Life Sciences. Elle est désormais rédactrice indépendante pour TellLucy.

Twitter(S’ouvre dans une nouvelle fenêtre)