Cette équipe de l’Université Drexel (Philadelphie) montre comment il est possible de prédire la gravité de la prochaine vague de COVID-19, à l’aide du séquençage génétique et de l'intelligence artificielle (IA). Ce modèle informatique, décrit dans la revue Computers in Biology and Medicine promet d’aider les responsables de santé publique du monde entier à faire face à la pandémie, qui se poursuit. À l'aide d'algorithmes d'apprentissage automatique, formés pour identifier les corrélations entre les modifications de la séquence génétique du virus COVID-19 et les augmentations des taux de transmission, d’hospitalisations et de décès, le modèle apporte une alerte précoce selon la gravité des nouvelles variantes.
Ce modèle répond, 2 ans après le début de la pandémie, au besoin de prévisions, pour les décideurs et les systèmes de santé, de la transmission du virus et de l’évolution de la pandémie, en fonction des mutations émergentes du virus SARS-CoV-2. Plutôt que collecter et analyser en temps réel les données génétiques des souches en circulation, afin d’identifier les nouvelles variantes et évaluer leur capacité de transmission, l’équipe a développé un système d'alerte précoce qui, à partir du séquençage génétique de quelques échantillons peut prédire à quel une nouvelle variante émergente, risque d’être dangereuse.
Une météorologie de la virologie
L’équipe du Dr Bahrad A. Sokhansanj, professeur de recherche au Drexel's College of Engineering parle d’une « modélisation virologique » comparable à une modélisation météorologique permettant donc de prédire des pics épidémiques comme on prédit des alertes météo.
Le modèle repose donc sur une analyse ciblée de la séquence génétique de la protéine de pointe du virus, la partie du virus qui lui permet d'échapper au système immunitaire et d'infecter les cellules saines. C'est aussi la partie connue pour avoir muté le plus fréquemment tout au long de la pandémie. Ces données génétiques sont combinées aux facteurs tels que l'âge, le sexe et l'emplacement géographique des patients COVID. De plus le modèle a été nourri avec les données de la base GISAID (John Hopkins) la plus large sur les cas d’infection COVID-19.
Grâce à une analyse textuelle, le programme se concentre rapidement sur les domaines de la séquence génétique qui sont les plus susceptibles d'être liés à des changements dans la sévérité de la variante. Le programme est donc non seulement capable de valider les prédictions qu'il a déjà faites sur la variante existante, mais de faire des projections lorsqu'il rencontre de nouvelles mutations dans la protéine de pointe, sur la transmission des variantes émergentes.
Plus rapide que toutes les analyses existantes : « Nous sommes ainsi capables de faire une prédiction sur le risque de maladie sévère associé à une variante émergente, avant même que les laboratoires effectuent leurs expériences in vitro et in vivo, ou qu'un nombre suffisant de personnes tombent malades pour pouvoir analyser les données épidémiologiques ».
Que prédit le modèle pour les variantes émergentes ? L'équipe a fait ses projections sur les sous-variantes d'Omicron émergeant après BA.1 et BA.2. La conclusion est préoccupante : « les futures sous-variantes d'Omicron sont plus susceptibles de provoquer une maladie plus grave. Bien que dans le monde réel, cette gravité accrue de la maladie sera atténuée par une protection naturelle des populations, liée aux précédentes variantes Omicron ». Le facteur a d’ailleurs bien été pris en compte dans la modélisation.
« Certaines analyses suggèrent que le SRAS-CoV-2 n'a exploré que 30 à 40 % du spectre possible pour les mutations de sa protéine de pointe. Alors que chaque mutation peut avoir un impact sur les propriétés clés du virus, comme la virulence et l'échappement immunitaire, il est vital de pouvoir identifier rapidement ces variations et de comprendre ce qu'elles impliquent, en particulier pour les personnes vulnérables à l'infection ».
« Le virus peut et a décidé de nous surprendre,
le besoin d’accroître notre capacité mondiale à séquencer des variantes est immense, l’analyse des séquences de variantes émergentes doit pouvoir être réalisée, avant que ces souches ne deviennent un problème mondial ».
Source: Computers in Biology and Medicine 27 Aug, 2022 DOI: 10.1016/j.compbiomed.2022.105969 Predicting COVID-19 disease severity from SARS-CoV-2 spike protein sequence by mixed effects machine learning
Plus sur COVID-19
Équipe de rédaction SantélogSep 3, 2022Rédaction Santé log