Gallicagram : un outil de lexicométrie pour explorer de grands corpus diachroniques

le Lundi 27 Mai 2024 à l’Ined de 11h30 à 12h30, en présentiel en salle Sauvy & en visioconférence via ZOOM

Gallicagram : un outil de lexicométrie pour explorer de grands corpus diachroniques

Intervenant : Benoit de Courson (doctorant en sciences sociales à l’institut Max Planck de Freiburg, Allemagne) ; discutant.e : à venir

Gallicagram est un logiciel de lexicométrie, destiné à mesurer l’évolution au cours de temps de la fréquence de mots ou syntagmes dans de grands corpus. Pour parer aux écueils, largement documentés, de Ngram Viewer, il se concentre sur des corpus de périodiques homogènes et, dans la mesure du possible, sur des corpus ouverts. On y trouvera notamment la presse de Gallica, les archives du journal Le Monde, ou encore les revues de la plateforme Persée (la RFS, les Annales, les Actes...). Ses bases de données de fréquences d’occurrence sont accessibles par API. La séance illustrera les mérites et limites de l’application. Elle développera (selon le temps disponible) trois exemples : les grèves sous la IIIe République entre Gallica et Charles Tilly, le taux de masculinité dans Le Monde depuis 1945 et une illustration de la récente thèse de Bernard Lahire, "l’oubli du réel" en sociologie.

Biographie de Benoît de Courson :

Benoît de Courson est doctorant en sciences sociales à l’institut Max Planck de Freiburg. Sa thèse porte sur le lien entre pauvreté et criminalité. En dehors de sa thèse, il a créé avec Benjamin Azoulay la plateforme Gallicagram.