Catalina Torres, Arianna Caporali et Gilles Pison

Projet financé par l’Agence nationale de la Recherche, la base de données sur les naissances multiples (HMBD) a reçu le prix Science ouverte des données de la recherche 2023, dans la catégorie « créer les conditions de la réutilisation ». L’équipe de l’Ined qui travaille sur cette base de données a répondu à nos questions.

(Entretien réalisé en décembre 2023)

Pourquoi avoir développé une base de données sur les naissances gémellaires et les autres naissances multiples ?

Nous menons des recherches sur l‘évolution du taux de gémellité depuis plusieurs années ; elles visent à connaître le taux de gémellité dans les différents pays et à en comprendre l’évolution. Ce projet est mené dans le cadre d’un partenariat entre l’Institut national d’études démographiques (Ined) et le Muséum national d’histoire naturelle et bénéficie du soutien financier de l’Agence nationale de la recherche. 

Pour mener ce projet, nous avons recherché toutes les informations publiées par les instituts nationaux de statistiques dans ce domaine, dans leurs annuaires statistiques autrefois, et sur leur site internet aujourd’hui, et les avons rassemblées dans une base de données. Ce travail a mobilisé notamment le DataLab de l’Ined qui s’est impliqué dès le départ du projet.

Pourquoi s’intéresser aux naissances multiples ?

Depuis cinquante ans, on observe une augmentation sans précédent de la fréquence des naissances de jumeaux et des autres naissances multiples dans les pays développés. Le taux de naissances gémellaires a par exemple doublé en France, passant de moins de 9 accouchements de jumeaux pour mille accouchements au total au début des années 1970 à plus de 17 au début des années 2010. 

D’où vient cette hausse du taux de gémellité ?

Deux facteurs sont à l’origine du boom des jumeaux : les femmes ont d’abord leurs enfants de plus en plus tard, or la probabilité d’une grossesse gémellaire augmente avec l’âge des mères. Second facteur, le recours à l’assistance médicale à la procréation est de plus en plus fréquent, or les grossesses obtenues ainsi sont plus fréquemment multiples que les autres grossesses, obtenues sans assistance.

Ce boom des jumeaux pose-t-il problème ?

Le boom des jumeaux est un problème de santé publique. Ces enfants sont en effet plus fragiles que les enfants singletons : ils sont plus souvent prématurés et ont plus souvent un petit poids à la naissance ; les complications de l’accouchement sont par ailleurs plus fréquentes dans leur cas. Il peut en résulter des conséquences à long terme sur leur santé. 

Que contient la base de données ?

La base de données fournit, pour 25 pays disposant de statistiques fiables sur le sujet, des séries temporelles longues sur le nombre annuel de naissances de singletons, de jumeaux, de triplets et de quadruplets et plus, ainsi que les taux de naissances gémellaires et multiples. 

Pourquoi cette base de données a-t-elle reçu le prix science ouverte des données de la recherche 2023 ?

Dès la conception de la base de données, nous avons fait le choix de la rendre entièrement libre d’accès. Pour faciliter l’utilisation des informations, nous avons rédigé une documentation très détaillée. Elle indique pour chaque série nationale sa qualité, les définitions utilisées, ainsi que les sources et leur localisation. Les codes des programmes développés pour la vérification et le traitement des données sont également téléchargeables librement, ce qui permet de reconstituer les séries corrigées. Enfin, nous avons doté la base d’un outil de visualisation interactive des données facilitant leur exploration en ligne.

Quels sont les projets et développements futurs relatifs à la base HMBD ?

Nous espérons que le prix va contribuer à mieux faire connaître la base de données. Il nous encourage aussi à poursuivre le travail et mettre à jour les données, ce qui nécessite de prolonger les séries nationales avec les données des dernières années au fur et à mesure que les instituts nationaux de statistique les publient. Cette base de données est pour le DataLab de l’Ined un modèle à suivre dans le développement d’autres bases de données.

Qui est appelé à utiliser cette base de données ?

Les données de cette base ciblent la communauté scientifique s’intéressant à la biologie de la reproduction, la médecine, et les comportements, avec un intérêt notamment pour l’évolution des naissances et de la famille, la santé des enfants, et l’assistance médicale à la procréation. Elles visent également un public plus large, par exemple les associations de parents de jumeaux, lesquelles ont un intérêt naturel pour tout ce qui a trait aux naissances multiples. Deux d’entre elles sont d’ailleurs partenaires du projet : l’association française Fédération Jumeaux et plus, et l’International Council of Multiple Birth Organisations, qui fédère les associations nationales des différents pays du monde.