🔍

Analyse des données
Comment construire une base de données adaptée ?

Structure et organisation d'une base de données

En MPR, une grande diversité de données est collectée, reflétant la nature multidimensionnelle et pluridisciplinaire de la prise en charge des patients :

Une particularité de la recherche en MPR est la prédominance des mesures répétées dans les protocoles d'étude. Ces mesures répétées sont nécessaires pour plusieurs raisons :

Face à cette complexité, l'analyse de vos données nécessite la construction d'une ou plusieurs bases de données, généralement sous forme de tableaux Excel. C'est le type d'analyse statistique visé qui conditionnera la structure de votre base de données.

Deux formats principaux de tableaux s'imposent pour organiser efficacement les données

Le choix entre ces deux structures détermine directement la faisabilité de votre traitement de données.

Format LARGE

Définition : Chaque participant occupe une seule ligne, et les mesures répétées sont représentées par plusieurs colonnes.

Structure

  • Une ligne = un participant
  • Plusieurs colonnes pour une mĂŞme variable = mesures rĂ©pĂ©tĂ©es (ex: PLUS-M_T1, PLUSM_T2)
  • Variables fixes (âge, sexe, groupe) apparaissent une seule fois

Exemple

ID Sexe Age Groupe PLUS-M_T1 PLUS-M_T2
01 F 45 Controle 78 85
02 M 62 Amputé 65 72
03 M 78 Amputé 54 62
04 F 56 Controle 45 52

Type d'analyse statistique adaptées

  • Tests de comparaisons
    • Tests paramĂ©triques (T-Test de Student)
    • Tests non paramĂ©triques (Mann-Whitney)
    • ANOVA Ă  un facteur / MANOVA
    • Test de Kruskal-Wallis (Ă©quivalent non paramĂ©trique de l'ANOVA)
  • Analyses multivariĂ©es
    • Analyse en composantes principales (ACP)
    • Analyse factorielle
    • Cluster et Classification
  • Analyse de corrĂ©lation
    • Coefficien de corrĂ©lation de Pearson
    • Coefficien de corrĂ©lation de Spearman (non paramĂ©trique)
    • Matrice de corrĂ©lation
  • RĂ©gressions
    • RĂ©gression linĂ©aire
    • RĂ©gression logistique (variables catĂ©gorielles)
    • Analyse de covariance (ANCOVA)
  • Analyses FrĂ©quentielles
    • Tables de contingence (Chi²)

Format LONG

Définition : Chaque variable mesurée occupe une seule colonne et les participants possèdent autant de lignes que sont répétées les mesures

Structure

  • Plusieurs lignes par patient (une ligne par mesure)
  • Une seule colonne par variable
  • Identifiant patient rĂ©pĂ©tĂ© sur chaque ligne
  • Variables fixes (âge, sexe, groupe) apparaissent Ă  chaque ligne patient

Exemple

ID Sexe Age Groupe Visite PLUS-M
01 F 45 Controle T1 78
01 F 45 Controle T2 85
02 M 62 Amputé T1 65
02 M 62 Amputé T2 72

Types d'analyses statistiques adaptées

  • Analyses de mesures rĂ©pĂ©tĂ©es
    • ANOVA Ă  mesures rĂ©pĂ©tĂ©es
    • ANOVA mixtes (facteurs inter et intra-suejets)
    • Test de Friedman (Ă©quivalent non paramĂ©trique)

  • Modèles longitudinaux
    • Modèles lin"aires mixtes (LMM)
    • Modèles linĂ©aires gĂ©nĂ©ralisĂ© mixtes (GLMM)
    • Test de Friedman (Ă©quivalent non paramĂ©trique)

Recommandations pratico-pratiques