Bloom: A 176b-parameter open-access multilingual language model T Le Scao, A Fan, C Akiki, E Pavlick, S Ilić, D Hesslow, R Castagné, ... | 1209 | 2023 |
Bigbio: A framework for data-centric biomedical natural language processing J Fries, L Weber, N Seelam, G Altay, D Datta, S Garda, S Kang, R Su, ... Advances in Neural Information Processing Systems 35, 25792-25806, 2022 | 41 | 2022 |
DrBERT: A robust pre-trained model in French for biomedical and clinical domains Y Labrak, A Bazoge, R Dufour, M Rouvier, E Morin, B Daille, PA Gourraud bioRxiv, 2023.04. 03.535368, 2023 | 28 | 2023 |
Multi-label classification for biomedical literature: an overview of the BioCreative VII LitCovid Track for COVID-19 literature topic annotations Q Chen, A Allot, R Leaman, R Islamaj, J Du, L Fang, K Wang, S Xu, ... Database 2022, baac069, 2022 | 24 | 2022 |
BioMistral: A Collection of Open-Source Pretrained Large Language Models for Medical Domains Y Labrak, A Bazoge, E Morin, PA Gourraud, M Rouvier, R Dufour arXiv preprint arXiv:2402.10373, 2024 | 21 | 2024 |
FrenchMedMCQA: A French multiple-choice question answering dataset for medical domain Y Labrak, A Bazoge, R Dufour, M Rouvier, E Morin, B Daille, PA Gourraud arXiv preprint arXiv:2304.04280, 2023 | 15 | 2023 |
A zero-shot and few-shot study of instruction-finetuned large language models applied to clinical and biomedical tasks Y Labrak, M Rouvier, R Dufour arXiv preprint arXiv:2307.12114, 2023 | 14 | 2023 |
Antilles: An open french linguistically enriched part-of-speech corpus Y Labrak, R Dufour International Conference on Text, Speech, and Dialogue, 28-38, 2022 | 5 | 2022 |
Team LIA/LS2N at BioCreative VII LitCovid Track: multi-label document classification for COVID-19 literature using keyword based enhancement and few-shot learning Y Labrak, R Dufour BioCreative VII challenge evaluation workshop, 2021 | 3 | 2021 |
MORFITT: A multi-label corpus of French scientific articles in the biomedical domain Y Labrak, M Rouvier, R Dufour 30e Conférence sur le Traitement Automatique des Langues Naturelles (TALN …, 2023 | 2 | 2023 |
Correction automatique d'examens écrits par approche neuronale profonde et attention croisée bidirectionnelle Y Labrak, P Turcotte, R Dufour, M Rouvier DEFT-Traitement Automatique des Langues Naturelles, 2022 | 1 | 2022 |
How Important Is Tokenization in French Medical Masked Language Models? Y Labrak, A Bazoge, B Daille, M Rouvier, R Dufour arXiv preprint arXiv:2402.15010, 2024 | | 2024 |
DrBenchmark: A Large Language Understanding Evaluation Benchmark for French Biomedical Domain Y Labrak, A Bazoge, OE Khettari, M Rouvier, N Grabar, B Daille, ... arXiv preprint arXiv:2402.13432, 2024 | | 2024 |
Actes de CORIA-TALN 2023. Actes du Défi Fouille de Textes@ TALN2023 A Bazoge, B Daille, R Dufour, Y Labrak, E Morin, M Rouvier Actes de CORIA-TALN 2023. Actes du Défi Fouille de Textes@ TALN2023, 2023 | | 2023 |
DrBERT: Un modèle robuste pré-entraîné en français pour les domaines biomédical et clinique Y Labrak, A Bazoge, R Dufour, M Rouvier, E Morin, B Daille, PA Gourraud 18e Conférence en Recherche d'Information et Applications\\16e Rencontres …, 2023 | | 2023 |
Tâches et systèmes de détection automatique des réponses correctes dans des QCMs liés au domaine médical: Présentation de la campagne DEFT 2023 Y Labrak, A Bazoge, B Daille, R Dufour, E Morin, M Rouvier 18e Conférence en Recherche d'Information et Applications--16e Rencontres …, 2023 | | 2023 |
MORFITT: Un corpus multi-labels d'articles scientifiques français dans le domaine biomédical Y Labrak, M Rouvier, R Dufour 18e Conférence en Recherche d'Information et Applications--16e Rencontres …, 2023 | | 2023 |