Back to list

Les études GWAS prédisant la taille sont bidon ; il en va probablement de même pour la prédiction des maladies

Translated from Haidut blog (haidut.me)

Les études GWAS prédisant la taille sont bidon ; il en va probablement de même pour la prédiction des maladies

Une autre étude remet en question la validité des études d'association pangénomiques (GWAS), du moins en ce qui concerne des traits tels que la taille. La taille (avec le QI) était autrefois saluée comme l'un des traits les plus sensibles sur le plan génétique et des scores polygéniques ont été développés qui prétendaient prédire la taille d'une personne à quelques fractions de millimètre près. Eh bien, comme l'indique l'étude ci-dessous, ces « signaux » se sont avérés n'être que du bruit, ou en réalité des biais introduits par l'homme dans les calculs. Comme l'a dit l'un des auteurs – « Peut-être que les Néerlandais boivent plus de lait et c'est pourquoi ils sont plus grands ». Sans blague ! Et si quelque chose d'aussi (supposé) génétiquement déterminé que la taille n'a pas de preuve à l'appui de cette affirmation, alors qu'en est-il de traits encore moins plausibles sur le plan évolutif tels que le risque de maladies spécifiques ? Certains des auteurs des études remettant en cause les GWAS expriment de telles craintes. Et à juste titre – leurs carrières dépendent de l'applicabilité médicale des GWAS.

https://elifesciences.org/articles/39702

https://www.quantamagazine.org/new-turmoil-over-predicting-the-effects-of-genes-20190423/

« … Une percée clé a été le développement récent des études d'association pangénomiques (GWAS, communément prononcées « gee-wahs »). La génétique des traits simples peut souvent être déduite des pédigrées, et les gens ont utilisé cette approche pendant des millénaires pour sélectionner des légumes qui ont meilleur goût et des vaches qui produisent plus de lait. Mais de nombreux traits ne sont pas le résultat de quelques gènes qui ont des effets clairs et forts ; ils sont plutôt le produit de dizaines de milliers de signaux génétiques plus faibles, souvent trouvés dans l'ADN non codant. En ce qui concerne ces types de caractéristiques — celles qui intéressent le plus les scientifiques, de la taille, à la pression artérielle, aux prédispositions à la schizophrénie — un problème survient. Bien que les facteurs environnementaux puissent être contrôlés dans les contextes agricoles afin de ne pas brouiller la recherche des influences génétiques, il n'est pas si simple de séparer les deux chez les humains ».

« … Sans se laisser décourager, au cours des deux dernières décennies, des experts ont mis au point des techniques statistiques robustes pour traiter ce problème, en utilisant des données recueillies auprès de milliers d'individus. Cette approche est devenue particulièrement prévalente en génétique humaine, alors que les chercheurs espèrent prédire, par exemple, le risque qu'une personne a de développer une maladie en fonction de son génome. Certains groupes ont même utilisé ces méthodes pour examiner comment la sélection naturelle aurait pu conduire aux différences observées en termes de taille (et d'autres traits) parmi les populations. Les résultats ont suscité un nouvel enthousiasme pour les applications potentielles en médecine et en biologie évolutive des GWAS. Mais maintenant, deux résultats publiés le mois dernier ont jeté le doute sur ces résultats, et ont illustré que les problèmes d'interprétation des résultats des GWAS sont bien plus répandus que quiconque ne l'avait réalisé. Le travail a des implications sur la manière dont les scientifiques pensent aux interactions entre les effets génétiques et environnementaux. Il soulève également « les fantômes de la possibilité que nous surestimons … à quel point la génétique est importante dans la contribution aux différences entre les personnes », a déclaré Rasmus Nielsen, un biologiste de l'Université de Californie, Berkeley. »

« … Ce qui était également ressorti de cette recherche comme un « prolongement évident et séduisant », selon Nick Barton, un biologiste évolutif de l'Institut des Sciences et Technologies d'Autriche, était une prédiction spécifique connue sous le nom de « score polygénique ». Au-delà des associations elles-mêmes, les GWAS pouvaient fournir des estimations de la manière dont les variantes individuelles dans le génome correspondaient à des changements mesurables dans un trait ; les scores polygéniques constituaient la somme de tous ces petits effets. Par exemple, pour la taille, avoir une base guanine au lieu d'une cytosine dans une région particulière de l'ADN pourrait corrélation avec être 0,1 millimètre plus grand que la moyenne. Le score polygénique prendrait toutes ces approximations, les additionnerait et donnerait une prédiction pour la taille réelle d'un individu ».

« … Il y a cinq ans, une série d'analyses sur une base de données européenne a rendu ces rêves accessibles. Les personnes d'ascendance nord-européenne sont en moyenne plus grandes que celles d'ascendance sud-européenne. Les chercheurs voulaient explorer si ces différences étaient le résultat de la sélection naturelle. Ils ont découvert que les scores polygéniques pour la taille augmentaient effectivement du sud au nord de l'Europe, bien plus que ce qui serait attendu des fluctuations aléatoires des fréquences des variantes appelées dérive génétique. Ce schéma soutenait l'idée que la génétique pouvait expliquer une partie importante de la raison pour laquelle une personne d'origine suédoise était susceptible d'être plus grande qu'une personne d'origine italienne — et, il semblait que ces différences génétiques reflétaient un certain processus de sélection naturelle et d'adaptation ».

« … Et puis les deux articles récents dans eLife, tous deux s'appuyant sur une base de données plus récente appelée UK Biobank, ont vu ce signal disparaître. Cette base de données était plus grande et plus homogène que celle qui avait conduit aux résultats précédents, et avait été compilée de manière beaucoup plus systématique, réduisant certains de ses biais. En conséquence, elle a donné des estimations légèrement différentes pour les petites tailles d'effet associées à chacune des variantes, qui n'étaient pas un gros problème dans les cas individuels mais s'additionnaient à des scores polygéniques globaux significativement différents ».

« Les nouvelles études sont vraiment assez inquiétantes », a déclaré Barton, car elles ont démontré que les scientifiques avaient confondu des biais dans les calculs des scores polygéniques avec quelque chose de biologiquement intéressant. Leurs méthodes statistiques de prise en compte de la structure de la population n'étaient pas si adéquates après tout. Bien qu'il ait toujours été compris que c'était un problème, « personne n'avait réalisé à quel point c'était un gros problème », a déclaré Shamil Sunyaev, un généticien computationnel de la Harvard Medical School qui a réalisé l'une des nouvelles analyses eLife avec son étudiant diplômé Mashaal Sohail et leurs collègues. « C'était juste ce genre de sentiment où le monde se déplace légèrement sous vos pieds », a déclaré Coop, qui avec Berg et leurs collègues a coécrit l'autre article eLife pour tenter de confirmer leurs recherches antérieures. « C'est assez humble de voir tout ce travail disparaître ».

« Peut-être que les Néerlandais boivent simplement plus de lait, et c'est pourquoi ils sont plus grands », a ajouté Sunyaev. « Nous ne pouvons pas dire le contraire avec cette analyse. » Et lorsque le trait étudié n'est pas la taille, cela peut être dangereux. Cela signifie que tenter d'utiliser des estimations faites sur les effets des variantes sur les maladies dans une population pourrait ne pas s'appliquer aux individus d'une autre population. Cela est particulièrement préoccupant car la grande majorité des études d'association pangénomiques reposent sur des données de personnes d'ascendance européenne blanche. « Les gens ne sont pas homogènes, et cela peut vous revenir en boomerang », a déclaré Magnus Nordborg, un généticien des populations à l'Académie autrichienne des sciences. »

« … Étant donné que certains experts veulent mettre en œuvre des scores polygéniques en clinique, il est déjà clair que ce défaut pourrait creuser les inégalités dans les soins de santé. Dans une étude publiée le mois dernier, les chercheurs ont découvert que la tentative de traduire les informations tirées des données européennes pour faire des prédictions de santé chez les personnes d'ascendance africaine a entraîné une baisse d'exactitude allant jusqu'à 4,5 fois. D'autres ont tenté d'utiliser des scores polygéniques pour faire des affirmations mal étayées sur les différences de traits comportementaux et sociaux entre les populations (comme le QI et la réussite éducative, qui sont bien plus difficiles à définir et à décomposer que la taille, mais qui sont utilisées pour potentiellement informer les décisions de politique future). « C'est un peu effrayant », a déclaré Sarah Tishkoff, une généticienne de l'Université de Pennsylvanie qui a souligné à quel point il est crucial de recueillir plus d'informations génomiques sous-représentées. »

« Les méthodes développées jusqu'à présent pensent vraiment à la génétique et à l'environnement comme séparées et orthogonales, comme des facteurs indépendants. Alors qu'en réalité, ils ne sont pas indépendants. L'environnement a eu un impact fort sur la génétique, et il interagit probablement avec la génétique », a déclaré Gil McVean, un généticien statistique de l'Université d'Oxford. « Nous ne faisons pas vraiment un bon travail de … compréhension de cette interaction. »