Pistoia Alliance lance un nouveau DataFAIRy : un projet de bioessai pour rendre plus de données lisibles par m

Science

L'Alliance Pistoia, une alliance mondiale à but non lucratif qui plaide pour une plus grande collaboration dans la R&D en sciences de la vie, lance aujourd'hui la deuxième phase de son projet DataFAIRy : Bioassay, qui vise à convertir les données d'essais biologiques en formats lisibles par machine qui adhèrent à la Principes directeurs FAIR de Trouvable, Accessible, Interopérable et Réutilisable. La phase pilote actuelle a été parrainée par AstraZeneca, Bristol Myers Squib, Novartis et Roche, et a annoté avec succès 496 tests à l'aide d'un modèle de traitement du langage naturel qui a été conçu sur mesure pour reconnaître le langage des sciences de la vie. Cette deuxième phase vise à multiplier par 10 à 100 le processus d'annotation et, à terme, à promouvoir le modèle de données pour qu'il devienne la norme de l'industrie. Les tests biologiques sont des méthodes analytiques cruciales pour tester les composés envisagés pour de nouveaux médicaments, ainsi que pour surveiller la toxicité environnementale. Il existe actuellement plus de 1,3 million de protocoles d'essais biologiques qui existent dans des formats de texte brut, tels que des articles publiés ou des notes de fournisseur. La sélection et la validation des tests nécessitent actuellement une recherche laborieuse, prenant jusqu'à 12 semaines par test aux scientifiques. L'adhésion au modèle DataFAIRy réduira le temps que les scientifiques consacrent à la recherche et à la planification d'expériences de dosage. De plus, les métadonnées d'analyse sont un type de données populaire pour l'exploration de données post-hoc. Mais la plupart de ces données et métadonnées publiées ne sont pas sous une forme adaptée à l'exploration automatisée. Elles sont partiellement annotées dans des banques de données publiques, mais le volume, la profondeur et la qualité de ces annotations sont insuffisants pour répondre à de nombreuses questions commerciales actuelles et futures. Pourtant, Gartner prédit que 85 % des projets d'IA produiront des résultats erronés en raison de problèmes de données, par exemple des informations non lisibles par une machine. Des projets tels que DataFAIRy sont donc essentiels au succès de l'adoption de l'IA dans les sciences de la vie. « Au cours de ma carrière, qui s'étend sur les trente dernières années, les données non structurées ont été un problème majeur pour les scientifiques. Alors que le volume, la variété et la complexité des informations sur les analyses continuent d'augmenter, les organisations doivent gérer leurs données plus efficacement, afin que les chercheurs puissent tirer le meilleur parti de leur temps et que les organisations puissent pleinement profiter des avantages de la transformation numérique », explique le Dr Vladimir Makarov, Chef de projet du centre d'excellence IA et ML de l'Alliance Pistoia. « Le modèle DataFAIRY que nous avons développé ne réduira pas seulement le temps que les scientifiques de laboratoire passent à rechercher des informations sur les tests. Cela peut également leur permettre de sauter des expériences connues pour avoir échoué dans le passé. À son tour, cela réduira les coûts pour les entreprises et accélérera la recherche vitale. » Bien que la numérisation ait rendu les entreprises plus conscientes de l'importance d'une gestion robuste des données, le manque de normes de l'industrie est toujours un obstacle à la réussite de l'annotation et de la gestion des protocoles, y compris les analyses . L'adoption des principes FAIR est la première étape pour permettre un plus grand partage de données entre les organisations et aider les scientifiques à faire face au volume et à la complexité croissants des données générées. De plus, les modèles de données actuels ne sont pas conçus pour reconnaître le langage scientifique, un nouveau modèle doit donc être créé pour automatiser l'annotation de ces précieuses ressources. La deuxième étape du projet DataFAIRy développera davantage un modèle de ce type d'une manière collaborative à l'échelle de la communauté. « Les outils de traitement de l'IA et du langage naturel doivent être conçus en tenant compte de la terminologie scientifique pour réussir », poursuit le Dr Makarov. « Le modèle DataFAIRy que nous avons construit automatisera le processus d'annotation afin que les tests soient consultables et réutilisables, accélérant ainsi des recherches précieuses. Nous espérons que ce modèle deviendra la norme communautaire pour la publication de nouveaux tests et pour la gestion des tests existants parmi les fournisseurs, les agences de réglementation et les éditeurs, en plus de la pharma et de la biotechnologie. Si vous êtes intéressé à soutenir la prochaine étape de le projet DataFAIRy, veuillez contacter projectteamdatafairy@pistoiaalliance.org. Ou, pour obtenir de l'aide sur l'adoption de FAIR dans votre organisation, vous pouvez télécharger la boîte à outils gratuite FAIR de l'Alliance Pistoia, qui contient des outils méthodologiques, des formations et des cas d'utilisation, permettant aux organisations de tirer des enseignements des réussites du secteur. Ginny Alexander Spark Communications ginny.alexander@sparkcomms.co.uk

“Le modèle DataFAIRY que nous avons développé ne réduira pas seulement le temps que les scientifiques de laboratoire passent à rechercher des informations sur les tests. Cela peut également leur permettre de sauter des expériences connues pour avoir échoué“
See all the latest jobs in Science
Retour aux nouvelles