ruthson zimmerman FVwG5OzPuzo unsplash scaled

Les statistiques inférentielles : Le quoi et le comment

Transformez votre processus de génération d’informations

Utilisez notre guide de sondage en ligne détaillé pour créer un processus d’enquête de collecte de commentaires exploitable.

PARTAGEZ L’ARTICLE SUR

Table des matières

Qu’est-ce que la statistique inférentielle?

Dans la recherche quantitative, les statistiques inférentielles complètent les statistiques descriptives. Alors que les statistiques descriptives aident à résumer les caractéristiques d’un échantillon de population, les statistiques inférentielles se concentrent sur l’utilisation de ces données résumées et prévoient les caractéristiques pour l’ensemble de la population.

Inferential Statistics1

Les statistiques inférentielles permettent donc à un chercheur de faire des hypothèses basées sur des populations réduites, pour des populations plus larges. Elles utilisent les mesures du groupe d’échantillon et fait des généralisations basées sur celles-ci pour les groupes plus grands. En résumé, si vous voulez déterminer si les statistiques actuelles sont descriptives ou inférentielles, la clé est que les statistiques descriptives fonctionnent sur votre ensemble de données d’échantillon actuel et que les statistiques d’inférence fonctionnent sur les données finales en plus de votre ensemble de données d’échantillon qui est relativement énorme.

Exemple:

Vous voulez connaître les professions des habitants d’un village. Vous collectez des échantillons de données auprès de divers villageois. Après avoir effectué des statistiques descriptives à ce sujet, les statistiques inférentielles vous donneront une idée des professions exercées par le reste des villageois.

Quels sont les problèmes rencontrés lors de la collecte d’échantillons dans les statistiques inférentielles?

  • Vous devez vous assurer que l’échantillon de données que vous sélectionnez est divers et aléatoires. Vous éviterez ainsi que les résultats soient biaisés. L’échantillon de données doit être représentatif de l’ensemble de la population pour que vos hypothèses soient exactes.
  • Des erreurs d’échantillonnage peuvent se produire lorsque vous ne couvrez pas certaines données de la population dans vos données. Cela crée une différence entre les valeurs réelles de la population et les valeurs que vous avez mesurées. Cela peut se produire indépendamment du premier point. Néanmoins, il existe différentes méthodes d’échantillonnage probabiliste pour permettant d’éviter ce problème, comme l’échantillonnage systématique, l’échantillonnage en grappes, l’échantillonnage stratifié en tant qu’échantillonnage aléatoire simple.

Les façons d’estimer les paramètres de population à partir des statistiques de l’échantillon :

De façon idéale, cela nous explique comment convertir des statistiques descriptives en statistiques d’inférence. Comme le titre le suggère, il y a deux caractéristiques:

  • Le paramètre – Décrit l’ensemble de la population (moyenne de la population).
  • La statistique – Décrit les données de l’échantillon (moyenne de l’échantillon).

Les statistiques d’inférence nous aident à utiliser la statistique de l’échantillon et à décrire le paramètre de population en tenant compte de l’erreur d’échantillonnage et en minimisant la différence entre les deux.

Les types d’estimation de la population :

  • L’estimation ponctuelle – Elle utilise les données de l’échantillon pour calculer une valeur ou un point unique, une statistique qui est la meilleure estimation d’un paramètre de population. Elle identifie un point dans un espace de paramètre.
  • L’estimation d’intervalle – Contrairement à l’estimation ponctuelle, l’estimation d’intervalle donne une plage à laquelle le paramètre est censé appartenir.
  • L’intervalle de confiance : C’est le type le plus utilisé pour l’estimation d’intervalle. Il s’agit d’une plage de valeurs où l’on s’attend à ce que les estimations tombent à nouveau lors de la répétition de l’expérience ou lors d’un nouvel échantillonnage. Par conséquent, c’est la moyenne des estimations qui peut tomber du côté positif ou du côté négatif de la variance (limites supérieure et inférieure). Le niveau de confiance indique le pourcentage de fois où l’on peut s’attendre à ce que la valeur tombe entre les limites. Plus le niveau de confiance est élevé, plus les estimations sont susceptibles se situer dans les mêmes limites supérieure et inférieure de l’intervalle de confiance.

Qu’est-ce que le test d’hypothèse dans les statistiques inférentielles?

Ce test est un processus suivi statistiquement pour tester les hypothèses formulées en fonction des données de l’échantillon de Morris. Prenons un exemple ainsi que les cinq étapes à suivre lors de la réalisation de tests d’hypothèses;

Inferential Statistics2

Étape 1) L’état de l’hypothèse nulle (H0) :

C’est un fait déjà accepté. Les analystes essaient d’éliminer ou d’annuler l’hypothèse nulle.

Étape 2) L’état de l’hypothèse alternative (Ha) :

C’est le contraire de l’hypothèse nulle et les analystes essaient de prouver statistiquement que l’hypothèse alternative est juste. S’il est prouvé que l’hypothèse alternative est correcte, l’hypothèse nulle est automatiquement rejetée. Et vice versa.

Étape 3) Déterminer le niveau de signification (α) :

C’est un déterminant qui indique la probabilité que l’hypothèse alternative soit correcte. Il utilise un niveau de signification qui indique à quel point vous êtes confiant dans votre conclusion. En général, il est de 0,05 (5%) pour commencer. Si α = 0,05, cela signifie que vous pouvez soutenir à 5% l’hypothèse alternative (ce qui signifie rejeter l’hypothèse nulle). Mais cela signifierait que vous avez eu tort de rejeter l’hypothèse nulle.

Étape 4) Calculer la valeur de p:

C’est une valeur de probabilité en faveur de l’hypothèse nulle. Le niveau de signification soutient l’hypothèse alternative, la valeur de p soutient l’hypothèse nulle.

  • Un niveau de signification élevé -> hypothèse alternative (L’hypothèse nulle rejetée)
  • Une valeur p élevée-> hypothèse nulle (L’hypothèse alternative rejetée).

Étape 5) Conclusion :

Sur la base des conditions ci-dessus, vous pouvez accepter ou rejeter l’hypothèse en examinant le pourcentage de la valeur de p et le niveau de signification.

Exemple:

(H0) – Les personnes obèses ne sont pas rassurées par leur poids.

(Ha)- Les personnes obèses ne laissent pas leur poids réduire leur confiance en soi.

(α)- 0,05

Valeur de P- 0,02

Conclusion : en interrogeant plusieurs personnes obèses, vous avez découvert que beaucoup d’entre elles ont une attitude positive vis-à-vis de leur corps et sont bien dans leur peau. La valeur de P est de 0,02, ce qui est bien inférieur au niveau de signification de 0,05, vous n’avez pas réussi à prouver l’hypothèse nulle et à accepter ainsi l’hypothèse alternative disant que les personnes obèses ne laissent pas leur poids diminuer leur confiance en soi.

Que sont les tests statistiques dans les statistiques inférentielles?

Ils sont utiles pour tester les prédictions et les hypothèses et permettent également d’éliminer les erreurs d’échantillonnage. Les tests statistiques paramétriques – plus puissants en raison de leur détection de défauts. Ils le font en faisant des hypothèses concernant la distribution normale des résultats, la définition de la population par les données de l’échantillon, etc. Les tests statistiques non paramétriques – ne font aucune hypothèse et sont des tests sans distribution.

Online Surveys

Quels sont les types de tests statistiques dans les statistiques inférentielles?

Les tests de comparaison-

Ils recherchent les différences dans la moyenne et les médianes ou les scores. Pour savoir quelle approche de test conviendra à l’objectif, vous devez vérifier si vos données remplissent les conditions pour les tests respectifs.

Le type de test de comparaison

Paramétrique?

Qu’est-ce qui est comparé?

Échantillons

t-test

Oui

Moyens

2 échantillons

ANOVA

Oui

Moyens

3+ échantillons

Médiane de l’humeur

Non

Médianes

2+ échantillons

Rang signé Wilcoxon

Non

Distributions

2 échantillons

Somme de rang de Wilcoxon (Mann-Whitney U)

Non

Sommes des classements

2 échantillons

Kruskal-Wallis H

Non

Classements moyens

3+ échantillons

Les tests de corrélation-

Ils indiquent le niveau d’association entre deux variables.

Le type de test de corrélation

Paramétrique?

Variables

Le r de Pearson

Oui

Variables d’intervalle/ratio

Le r de Spearman

Non

Variables ordinales/intervalles/ratios

Test d’indépendance du Chi carré

Non

Variables nominales/ordinales

Explorez tous les types de questions d’enquête possibles sur Voxco

Les tests de régression-

Ils montrent que si vous modifiez les variables prédites, cela entraînera ou non une modification des variables de sortie. En fonction du nombre de variables dont vous disposez, vous pouvez décider de passer ou non les tests de régression.

Les types de test de régression

Prédicteur

Résultat

Régression linéaire simple

1 variable intervalle/rapport

1 variable intervalle/rapport

Régression linéaire multiple

2+ variable(s) d’intervalle/ratio

1 variable intervalle/rapport

Régression logistique

1+ toute variable(s)

1 variable binaire

Régression nominale

1+ toute variable(s)

1 variable nominale

Régression ordinale

1+ toute variable(s)

1 variable ordinale

Read more