Dot PlotaLe tracé de points (ou Dot Plot)

PARTAGER L’ARTICLE SUR

Le tracé de points (ou Dot Plot) Le tracé de points
Table of Contents
Un dot plot, également connu sous le nom de diagramme à points (ou diagramme de points), est un type de graphique statistique qui se compose de points de données affichés sur une échelle relativement basique, utilisant généralement des cercles remplis. Le dot plot est disponible en deux variantes populaires, mais tout à fait distinctes. Le premier a été utilisé pour montrer des distributions dans des graphiques dessinés à la main (avant l’âge de l’ordinateur) datant de 1884. William S. Cleveland décrit l’autre version comme une alternative au graphique à barres dans lequel des points sont utilisés pour indiquer des valeurs quantitatives (par exemple, des nombres) liées à des variables catégorielles. Le diagramme à points le plus connu est peut-être les prévisions trimestrielles de taux d’intérêt de la Réserve fédérale.

Qu’est-ce qu’un dot plot ?

Un dot plot organise visuellement le nombre de points de données dans une collection de données en fonction des valeurs. Cela fournit une représentation visuelle de la distribution des données, semblable à un histogramme ou à une fonction de distribution de probabilité. Les diagrammes à points permettent une étude visuelle rapide des données pour découvrir la tendance centrale, la dispersion, l’asymétrie et la modalité des données.

Les diagrammes à points sont généralement configurés avec un axe affichant la plage de valeurs ou de catégories le long de laquelle les points de données sont catégorisés et un deuxième axe affichant le nombre de points de données dans chaque catégorie. Les points peuvent être empilés verticalement ou horizontalement pour afficher le nombre de points dans chaque groupe pour une comparaison visuelle simple.

Ceci est similaire à un graphique linéaire. La principale distinction est que les points sur un diagramme de points ne sont pas liés par une ligne. Les graphiques linéaires, d’autre part, relient les points avec une ligne. Comme un diagramme à points, un graphique linéaire possède un axe « x » et un axe « y ».

Guide de recherche exploratoire

Mener des recherches exploratoires semble délicat, mais un guide efficace peut aider.

Histoire

Une matrice de similitude, souvent connue sous le nom de diagramme à points, est une approche pour montrer la similitude entre deux séquences de protéines ou d’acides nucléiques. Ce sont des matrices bidimensionnelles qui comparent des séquences de protéines le long des axes vertical et horizontal, décrites pour la première fois par Gibbs et McIntyre en 1970. Les cellules individuelles de la matrice peuvent être colorées en noir si les résidus sont identiques, de sorte que les segments de séquence correspondants apparaissent sous forme de lignes diagonales à travers la matrice pour une représentation visuelle simple de la similitude entre deux séquences.

Construction d’un diagramme de points

Les points de données sont empilés dans une colonne au-dessus d’une catégorie lors de la création d’un diagramme de points. La fréquence d’observation dans une catégorie spécifique est représentée par la hauteur de la colonne. Les nombres 0 à 9 sont les catégories du diagramme à points, où 0 se produit trois fois, 1 se produit sept fois, 2 se produit sept fois, 3 et 4 se produisent six fois, 6 se produit quatre fois, 7 et 9 se produisent neuf fois, et 8 se produit deux fois.

Le diagramme à points ci-dessus illustre la quantité totale de points de données et la façon dont ils sont répartis en plusieurs catégories.

Utilisations du diagramme à points

Bioinformatique :

Gibbs et Mclntyre ont inventé le dot plot en 1970 pour visualiser la similitude de deux séquences d’acides nucléiques (protéines). Typiquement, les protéines sont comparées le long des axes x et y.

Nous savons par notre connaissance en science mathématique des graphes que des protéines identiques formeront une diagonale à partir des points. En conséquence, les restes ou les points isolés sont colorés pour faciliter l’identification.

Institution monétaire

Lors d’un certain nombre de réunions du Federal Open Market Committee, la Réserve fédérale des États-Unis (Fed) utilise des diagrammes à points pour transmettre les projections de taux d’intérêt sur les fonds fédéraux. Les membres de ce comité dessinent des points sur le graphique à points pour représenter leurs estimations futures des taux d’intérêt.

Recherche

Les diagrammes à points sont utilisés dans la recherche pour étudier les similitudes entre une ou plusieurs variables. Les conclusions tirées de l’analyse des données à l’aide de graphiques à points peuvent aider à prédire les tendances et à y remédier de manière appropriée.

Analyse du diagramme de points

Un diagramme à points ou dot plot est composé d’une échelle horizontale (une ligne numérique) avec des points organisés pour indiquer les valeurs numériques d’une collecte de données. Si les valeurs d’un ensemble de données se reproduisent, les points à cette position sont rassemblés. Pour chaque répétition, un point est tracé. Les diagrammes à points sont utilisés pour montrer la dispersion des données.

Par rapport à une grande liste de chiffres, l’analyse du diagramme à points d’un ensemble de données en particulier est simple. La figure du diagramme de points ci-dessous montre que les points sont uniformément espacés, avec un pic à environ 8 lettres. Le centre du graphique est compris entre 6 et 7 lettres. Les points vont de 3 à 9 lettres.

Vous pouvez compter rapidement le nombre de fois que chaque catégorie ou nombre est répété à l’aide d’un diagramme à points. Un diagramme à points est la meilleure technique pour organiser les nombres et les valeurs.

Interprétation d’un diagramme à points

  • Chaque point d’un diagramme à points indique un nombre défini d’observations provenant d’une collection de données donnée (sauf indication contraire, chaque point représente une observation). Si un point représente plus d’une observation, le nombre d’observations doit être noté sur le graphique.
  • Les points sont placés dans une colonne au-dessus de la catégorie, la hauteur de la colonne représentant la fréquence absolue ou relative de l’observation dans la catégorie.
  • Ce n’est que lorsque les catégories sont quantitatives que le modèle de données créé dans un diagramme à points peut être articulé avec précision en termes de symétrie et d’asymétrie; lorsque les catégories sont qualitatives, un diagramme à points est insuffisant pour définir ces concepts.
  • Les diagrammes à points, par rapport à d’autres types de graphiques, sont fréquemment utilisés pour représenter les comptages de fréquence dans un petit nombre de catégories, et donc une petite collection de données.

Pour une distribution symétrique

En tant que représentation d’une distribution, un diagramme à points se compose d’un ensemble de points de données dessinés sur une échelle de base. Pour les données continues, quantitatives et univariées, des diagrammes à points sont utilisés. S’il y a peu de points de données, ils peuvent être étiquetés.

Les diagrammes à points sont l’un des graphiques statistiques les plus élémentaires, et ils fonctionnent bien avec des ensembles de données de petite à moyenne taille. Ils sont utiles pour identifier les clusters, les lacunes et les valeurs aberrantes. Un autre avantage est la préservation de l’information numérique. Lorsque vous travaillez avec des ensembles de données plus volumineux (environ 20 à 30 points de données ou plus), un diagramme en tige, un diagramme en boîte ou un histogramme peut être plus efficace, car les diagrammes à points peuvent devenir excessivement encombrés à ce stade. Les diagrammes de points sont différents des histogrammes. En effet, les contrairement à l’histogramme, les points ne sont pas uniformément espacés le long de l’axe horizontal.

Bien que le graphique semble être simple, ni son calcul ni la théorie statistique qui le sous-tend ne le sont. La procédure de création d’un diagramme à points est étroitement liée à l’approche d’estimation de la densité du noyau. La taille des points a un effet sur l’apparence du tracé. La sélection de la taille des points est analogue à la sélection de la bande passante pour une estimation de la densité du noyau.

Ce type de mise en page est également connu sous le nom de stripchart ou stripplot dans le langage de programmation R.

Types de diagramme de points

Les diagrammes à points de Cleveland et de Wilkinson sont les formes les plus courantes de diagrammes à points. Les deux utilisent des points, mais il y a des distinctions significatives, avec Cleveland ressemblant à un graphique à barres et Wilkinson à un histogramme.

Le Cleveland Dot Plot

Il s’agit d’un graphique de type nuage de points, créé par William Cleveland qui affiche les points de données verticalement dans une dimension. En raison de sa représentation unidimensionnelle verticale, il est parfois comparé à un histogramme.

La distinction est que, contrairement à un histogramme, qui utilise la longueur pour coder les valeurs de données, un diagramme à points de Cleveland utilise la position pour coder les valeurs de données. Par conséquent, lorsque vous tracez un diagramme à points, vous n’avez pas besoin de démarrer l’axe de données à l’origine et il est adaptable pour superposer plusieurs variables.

Bien qu’ils soient similaires aux diagrammes à barres, Cleveland a fait remarquer en 1985 que « les diagrammes à points sont mieux considérés comme des nuages de points horizontaux et unidimensionnels où les valeurs liées sont perturbées ou affichées verticalement » contrairement aux histogrammes. Il a ensuite divisé l’estimation graphique en trois parties : la discrimination, le classement et le rationnement.

Découvrez le logiciel d’enquête Voxco en action avec une démonstration gratuite.

Découvrez le logiciel d’enquête Voxco en action avec une démonstration gratuite.

Le Wilkinson Dot Plot

Il est nommé d’après Leland Wilkinson et se distingue en utilisant un déplacement local perpendiculaire à l’échelle pour empêcher les points de se chevaucher. Il était professeur adjoint de statistique à l’Université Northwestern à Evanston au moment où il a publié cette technique de diagramme à points.

Malgré le fait que d’autres versions de dot plot ont été produites dans le passé, les recherches de Wilkinson se sont concentrées sur l’introduction d’un nouvel algorithme pour faire des dot plots sur un ordinateur. Il a dit dans cette étude que les programmes existants ne recréent pas avec précision les diagrammes à points.

Au lieu de cela, ils ont utilisé des intervalles de classe réguliers pour générer des graphiques ressemblant à des histogrammes astérisques d’imprimante de ligne de la vieille école.

Cleveland et Wilkinson ont également collaboré au livre The Grammar of Graphics. Ce livre a eu un impact sur le développement de Graph Builder (créateur de graphiques).

Le FOMC Dot Plot

Les diagrammes à points sont bien reconnus comme l’approche utilisée par la Fed pour communiquer ses prévisions de taux d’intérêt de référence des fonds fédéraux lors des réunions du Federal Open Market Committee (FOMC). Les membres du FOMC placent des points sur le graphique à points pour représenter leurs estimations des taux d’intérêt futurs dans les années à venir et à long terme.

En règle générale, la projection globale du FOMC pour les taux d’intérêt au cours d’une année donnée est fournie comme médiane des points sur le graphique à points. Par exemple, la médiane pour 2020 pour le graphique FOMC dans la section suivante (exemple réel d’un diagramme à points) est d’environ 0,1%, et la médiane pour 2020 est également d’environ 0,1%. En attendant, la médiane à long terme est de 2,5%.

Les investisseurs et les économistes surveillent avec impatience les estimations du graphique à points de la Fed à la recherche d’indices sur l’évolution future des taux d’intérêt. Chaque point sur le graphique reflète la prédiction d’un membre quant à l’endroit où le taux des fonds fédéraux devrait être à la fin des différentes années civiles représentées, ainsi qu’à « plus long terme » (le sommet du taux des fonds fédéraux après que la Fed a fini de resserrer ou de « normaliser » la politique par rapport à ses niveaux actuels).

Considération spéciale (pour le graphique FOMC)

Lorsque vous regardez le graphique du FOMC, gardez à l’esprit que chaque point indique l’opinion d’un membre sur l’endroit où les taux devraient être en ce moment. Leur point est situé au milieu de la gamme. En d’autres termes, les points ne doivent pas être interprétés comme indiquant qu’un membre vise un certain nombre. Notamment, on ne sait pas quel point correspond à quel membre du FOMC.

Il est également crucial de se rappeler que la Fed est principalement axée sur les données, ce qui signifie qu’elle modifie continuellement ses prévisions et ses taux en réponse aux tendances économiques et aux événements mondiaux. Dans le cas d’un incident important, comme une attaque terroriste, une grave récession économique ou une augmentation rapide de l’inflation, le graphique à points le plus récent peut ne plus refléter avec précision les prévisions des membres.

Par conséquent, les estimations à long terme du graphique à points ont moins de poids que celles qui se rapprochent du présent. Les changements dans la direction de la Fed – l’expiration des mandats, les personnes qui démissionnent et d’autres qui se mobilisent pour remplacer les postes vacants – augmentent la possibilité d’ajustements de politique à long terme.

Avantages du dot plot

  • Il s’agit d’une bonne technique pour exprimer les fréquences et les proportions.
  • Ils sont plus détaillés car ils affichent la distribution de la densité des points de données et les valeurs aberrantes.
  • Vous pouvez augmenter la densité de données dans les diagrammes de points en faisant varier la couleur et la taille de l’OD, ce qui donne ce que nous appelons des points à bulles.
  • En ajoutant des points colorés, ils peuvent être utilisés pour raconter une belle histoire.
  • Ils sont capables de représenter jusqu’à un millier de points de données. Bien que cela devienne désordonné et disgracieux à mesure que le nombre augmente, il existe une solution de contournement.

Inconvénients du dot plot

  • Lorsqu’il s’agit d’une énorme collecte de données, la conception peut prendre beaucoup de temps.
  • Il est souvent difficile de déterminer la fréquence d’un jeu de données à partir d’un diagramme à points. Lorsqu’il s’agit d’une fréquence élevée, les données devront être comptées une par une, ce qui peut être impossible à faire.
  • Les grands ensembles de données ne sont pas recommandés car les points deviennent encombrés et difficiles à lire.
Online survey tools 10 1

See why 450+ clients trust Voxco!

Subscription Pop Up (#10)

By providing this information, you agree that we may process your personal data in accordance with our Privacy Policy.

Read more