Enquêtes internationales : analyse de réponses libres en plusieurs langues. Application de l’analyse factorielle multiple

le Lundi 30 Mai 2022 à l’Ined dans la salle Sauvy de 11h30 à 12h30 en Hybride (présentiel + possibilité de connexion).

Présenté par : Monica Becue (Universitat Politècnica de Catalunya) ; Discutante : Elisabeth MORAND (INED, Service méthodes statistiques)

Résumé

L’usage d’enquêtes internationales se développe, ce qui pose la question du traitement de réponses libres formulées en différentes langues. Dans le cadre de la statistique textuelle, il devient nécessaire de disposer de méthodes permettant d’analyser conjointement l’ensemble des réponses. En général, les répondants ont aussi répondu à de nombreuses questions fermées, les mêmes dans toutes les langues.

Pour traiter ce type de données, nous avons proposé d’appliquer l’analyse factorielle multiple pour tableaux de contingence (AFMTC). Pour cela, on construit dans chacun des échantillons (=des langues) un tableau lexical agrégé croisant les mots et les catégories d’une variable qualitative, issue des réponses aux questions fermées. Les tableaux lexicaux (=un par échantillon) sont ensuite concaténés pour former le tableau de contingence multiple à analyser par l’AFMTC, méthode qui offre les résultats très riches de l’AFM.

Nous avons élargi cette approche de façon à tenir compte de plusieurs variables, quantitatives ou qualitatives. Dans chaque échantillon, un tableau lexical agrégé généralisé (TALG), croisant variables et mots, est construit. Les mots sont positionnés sur les variables en fonction des valeurs prises par les répondants qui les ont prononcés. Ces tableaux sont ensuite concaténés. Une extension de l’AFM, appelée AFM pour TALG (AFM-TLAG), permet d’analyser ce tableau multiple.  On obtient des résultats de même nature que ceux offerts par l’AFMTC qui est un cas particulier de cette nouvelle méthode.

Nous présenterons ces méthodes en les appliquant à une enquête internationale multilingue. Les résultats sont obtenus au moyen du package Xplortext de R.

Biographie de Monica Becue

Mónica Bécue-Bertaut a été enseignante-chercheur à la “Universitat Politènica de Catalunya”. Elle participe actuellement à l’équipe de développement du Package Xplortext (R cran), dédié à l’analyse textuelle. 

Outre de nombreux articles, elle a publié plusieurs ouvrages sur l’analyse textuelle (en français, espagnol ou anglais). Elle a participé à la conception de logiciels d’analyse textuelle (SPAD.T et Xplortext). Elle est éditrice associée au « Journal of Classification » (Springer).

Elle a été à l’origine des Journées d’Analyse de Données Textuelles qui a eu sa première édition à Barcelone en 1990 et aura sa 16ème en juillet 2022 à Naples.