Geigenplot

SHARE THE ARTICLE ON

Geigenplot Lineare Regression-Voxco
Table of Contents

Ein Violindiagramm ist eine Kombination aus einem Boxdiagramm und einem Kerndichtediagramm, das Datenspitzen anzeigt. Er wird verwendet, um zu zeigen, wie numerische Daten verteilt sind. Im Gegensatz zu einem Boxplot, der nur zusammenfassende Statistiken liefern kann, zeigen Violinplots sowohl zusammenfassende Statistiken als auch die Dichte der einzelnen Variablen.

Was ist ein Violinplot?

Ein Violindiagramm ist eine Art der quantitativen Datenvisualisierung. Sie ähnelt einem Box-Plot, jedoch befindet sich auf jeder Seite ein rotierendes Kernel-Dichte-Diagramm. In der Regel enthält ein Violinplot alle Daten, die auch in einem Boxplot enthalten sind: eine Markierung für den Median der Daten, eine Box oder eine Markierung, die den Interquartilsbereich darstellt, und, sofern die Anzahl der Stichproben nicht zu groß ist, alle Stichprobenpunkte.

Violinplots sind als Erweiterungen für eine Vielzahl von Softwarepaketen verfügbar, darunter CRAN’s Data Visualization und PyPI’s md-plot package.

Violinplots werden wie Boxplots verwendet, um eine Variablenverteilung (oder Stichprobenverteilung) über verschiedene „Kategorien“ hinweg zu untersuchen (z. B. die Temperaturverteilung im Vergleich zwischen Tag und Nacht oder die Verteilung von Autopreisen im Vergleich zwischen verschiedenen Autoherstellern). Einem Violindiagramm können Ebenen hinzugefügt werden. Die äußere Form stellt zum Beispiel alle denkbaren Ergebnisse dar. Die Werte, die in 95 % der Fälle auftreten, können durch die nächste innere Schicht dargestellt werden. Im Inneren kann die folgende Ebene (falls vorhanden) die Werte darstellen, die in 50 % der Fälle auftreten.

Sie sind weniger verbreitet als Boxplots, obwohl sie informativer sind. Aufgrund ihrer Unklarheit kann ihre Bedeutung für viele Leser, die mit der Darstellung der Geigengeschichte nicht vertraut sind, schwer zu verstehen sein. In diesem Szenario kann die Darstellung einer Reihe von gestapelten Histogrammen oder Kerndichteverteilungen eine zugänglichere Option sein.

Leitfaden für Sondierungsforschung

Sondierungsforschung scheint schwierig zu sein, aber ein effektiver Leitfaden kann helfen.

Wie liest man ein Geigenplot?

  • Der weiße Punkt stellt den Median dar.
  • Der Interquartilsbereich wird durch den breiten grauen Balken in der Mitte angezeigt.
  • Mit Ausnahme der Punkte, die bei einer auf dem Interquartilsbereich basierenden Technik als „Ausreißer“ gelten, spiegelt die dünne graue Linie den Rest der Verteilung wider.
  • Eine Kernel-Dichte-Schätzung wird auf beiden Seiten der grauen Linie gezeigt, um die Verteilungsform der Daten anzuzeigen. Die breiteren Teile der Geigengrafik spiegeln eine größere Wahrscheinlichkeit wider, dass Individuen der Population den gegebenen Wert annehmen, während die dünneren Abschnitte eine geringere Wahrscheinlichkeit implizieren.

Bestes Verfahren zur Verwendung eines Geigenplots

BERÜCKSICHTIGEN SIE DIE REIHENFOLGE DER GRUPPEN

Wenn die Gruppen in einem Violin-Diagramm keine eigene Reihenfolge haben, kann die Reihenfolge, in der die Gruppen dargestellt werden, geändert werden, um es einfacher zu machen, Erkenntnisse aus den Daten abzuleiten. Wenn Sie die Gruppen beispielsweise nach dem Medianwert sortieren, wird die Reihenfolge der Gruppen klar ersichtlich.

Gemeinsame Violinplot-Option

ÜBERLAGERUNG MIT ZUSÄTZLICHEM DIAGRAMMTYP

Violinplots können für sich genommen recht restriktiv sein. Es kann schwierig sein, genaue Vergleiche von Dichtekurven zwischen Gruppen durchzuführen, wenn sich Symmetrie, Schiefe oder andere Form- und Variabilitätsmerkmale zwischen den Gruppen ändern. Aus diesem Grund werden Violindiagramme oft mit einem anderen Diagrammtyp überlagert.

Das Boxplot ist die typischste Ergänzung zum Violinplan. Dieser Zusatz wird häufig standardmäßig angenommen; das Violin-Diagramm wird manchmal als eine Mischung aus KDE und Box-Plot beschrieben. Um das visuelle Rauschen zu verringern, wird in manchen Fällen nur eine Teilmenge der Boxplot-Elemente dargestellt, z. B. drei Linien, die Quartilpositionen ohne Whisker darstellen.

Anstelle eines Box-Plots können auch alternative Verteilungsdiagramme eingeblendet werden. Bei einem Rugplot oder Stripplot wird, wie bei einem 1-d-Scatterplot, jeder Datenpunkt als Häkchen oder Punkt zur zentralen Linie hinzugefügt. Um Überschneidungen zu vermeiden, werden bei einem Schwarmdiagramm die Datenpunkte von der Mittellinie aus versetzt. Ein alternativer Ansatz, der einfacher zu implementieren ist, aber keine Überlappungsvermeidung gewährleistet, ist die Verschiebung der Punkte von der Mittellinie.

Diese alternativen Diagrammüberlagerungen funktionieren gut, wenn jede Gruppe eine kleine bis mittlere Anzahl von Datenpunkten hat. Die Anzeige einzelner Datenpunkte hilft zwar bei der Veranschaulichung, wie die Dichtekurven konstruiert wurden, und liefert Informationen über die Gruppengröße, die in einer Geigengrafik im Allgemeinen nicht sichtbar sind, aber ihre Anwesenheit fügt dem Diagramm Rauschen hinzu und kann ablenken. Sobald die Gruppengröße hoch genug ist, sind die Verteilungsschätzungen aus der Dichtekurve und dem Boxplot stabil genug, um nützliche Informationen zu liefern.

Arten von Geigenplots

GRUNDLEGENDES VIOLINPLOT

It comprises observations on the specific feed type, sex, and weight of 71 six-week-old baby chickens (called chicks). This violin plot depicts the link between feed type and chick weight. The box plot features reveal that horsebean-fed chicks have a lower median weight than other feed types. The distribution’s form (very slender on each end and broad in the center) shows that the weights of sunflower-fed chicks are significantly concentrated around the median.

HORIZONTAL VIOLIN PLOT

Er umfasst Beobachtungen über die spezifische Futterart, das Geschlecht und das Gewicht von 71 sechs Wochen alten Küken (genannt Küken). Dieser Violinplot zeigt den Zusammenhang zwischen der Futterart und dem Gewicht der Küken. Die Merkmale des Boxplots zeigen, dass mit Pferdebohnen gefütterte Küken ein geringeres Durchschnittsgewicht haben als andere Futterarten. Die Form der Verteilung (sehr schmal an den Enden und breit in der Mitte) zeigt, dass das Gewicht der mit Sonnenblumen gefütterten Küken deutlich um den Median herum konzentriert ist.

HORIZONTALER VIOLINPLOT

Horizontale Violin-Diagramme eignen sich wie horizontale Balkendiagramme hervorragend für die Darstellung einer Vielzahl von Kategorien. Durch Umschalten der Achse erhalten die Kategorienbeschriftungen zusätzlichen Raum zum Atmen. Die üblichen Boxplot-Teile und die Darstellung können weggelassen werden, und jede Beobachtung kann als Punkt dargestellt werden. Wenn Ihr Datensatz Beobachtungen für eine vollständige Population enthält, sind Punkte sehr nützlich (und nicht nur eine ausgewählte Stichprobe). Wenn die gesamte Grundgesamtheit zur Verfügung steht, müssen keine Schlussfolgerungen für eine ungesehene Grundgesamtheit gezogen werden. Wenn die Kernel-Bandbreite verringert wird, werden die Diagramme klumpiger, was bei der Identifizierung kleiner Cluster helfen kann, z. B. der Schwanz von mit Kasein gefütterten Küken.

VERTIKALES VS. HORIZONTALES VIOLINDIAGRAMM

Geigenplots können entweder mit vertikalen oder horizontalen Dichtekurven angeordnet werden. Horizontal ausgerichtete Violinplots sind nützlich, um lange Gruppennamen darzustellen oder wenn eine große Anzahl von Gruppen geplottet wird. Wenn wir genügend Fläche benötigen, um die Kontur einer Dichtekurve richtig zu untersuchen, ist es häufig besser, eine Darstellung auf der vertikalen Achse zu vergrößern als auf der horizontalen Achse.

GRUPPIERTE GEIGENGRAFIK

Eine kategoriale Variable zweiter Ordnung kann auch durch ein Violinplot dargestellt werden. Innerhalb jeder Kategorie können Gruppen gebildet werden. Beispielsweise kann eine Darstellung erstellt werden, die zwischen männlichen und weiblichen Küken innerhalb jeder Mahlzeitentypgruppe unterscheidet.

Weibliche Küken wiegen laut der gruppierten Geigengrafik in jeder Futterartkategorie weniger als männliche. Darüber hinaus können Rückschlüsse darauf gezogen werden, wie sich das Geschlechterdelta zwischen den Kategorien verändert: Der mittlere Gewichtsunterschied ist bei mit Leinsamen gefütterten Küken größer als bei mit Sojabohnen gefütterten Küken.

GRUPPIERTER VIOLINPLOT MIT GETEILTER VIOLINE

Anstatt separate Diagramme für jede Gruppe innerhalb einer Kategorie zu erstellen, können Sie geteilte Geigen verwenden und das Box-Diagramm durch gestrichelte Linien ersetzen, die die Quartile für jede Gruppe anzeigen.

Die Verteilungen der einzelnen Gruppen können mit Hilfe der geteilten Violinen leicht verglichen werden. Zum Beispiel haben weibliche Küken, die mit Sonnenblumen gefüttert wurden, eine Long-Tail-Verteilung unterhalb des ersten Quartils, aber männliche Küken haben eine Long-Tail-Verteilung oberhalb des dritten Quartils.

Sehen Sie die Voxco Umfrage-Software in Aktion mit einer kostenlosen Demo.

Vorteile von Violin Plot

  • Violinplots ermöglichen eine schnelle Annäherung an den Mittelpunkt der Daten und ihre Verteilung.

Da ein Violinplot einen Boxplot enthält, können Zentrum und Verteilung ähnlich wie bei einem Boxplot interpretiert werden.

  • Violinplots, die eine Wahrscheinlichkeitsdichtefunktion enthalten, zeigen die Form der Verteilung an.

Ein Violinplot ist ein Boxplot, dem eine Wahrscheinlichkeitsdichtefunktion (PDF) überlagert ist. Eine PDF ist einfach ein geglättetes Histogramm, das die Häufigkeit angibt, mit der jeder Wert auftritt. Eine PDF liefert im Gegensatz zu einem Histogramm eine glattere Verteilung, indem sie das Rauschen glättet. Die PDF wird gedreht und symmetrisch entlang der Länge eines Boxplots in einem Violindiagramm ausgerichtet, so dass die Breite der PDF widerspiegelt, wie häufig dieser Wert im Datensatz auftritt. Eine ausgeprägtere Dichtefunktion bedeutet, dass der Wert häufiger vorkommt. Eine kleinere Dichtefunktion deutet darauf hin, dass der Wert weniger häufig vorkommt.

 

Durch die Verwendung einer kontinuierlichen Funktion entfällt die Notwendigkeit, Bins auszuwählen, was ein wesentlicher Vorteil von PDFs gegenüber Histogrammen ist. Unabhängig von der Anzahl der verwendeten Bins ergibt dies eine natürlicher wirkende Verteilung.

  • Das Violinplot ist ideal für bimodale Daten

Boxplots können allein nicht zwischen unimodalen und bimodalen Daten unterscheiden. Betrachten Sie den folgenden Vergleich von drei Boxplots und drei Violinplots. Die Boxplots für bimodale (blau) und uniforme (lila) Datensätze sind praktisch nicht zu unterscheiden, die Violinplots heben jedoch die beiden Modi des bimodalen Datensatzes deutlich hervor und können auch zeigen, dass der uniforme Datensatz gleichmäßig verteilt ist.

  • Violinplots können zum Vergleich von Daten verwendet werden

Violinplots eignen sich wie Histogramme, Boxplots und Balkendiagramme hervorragend für den Vergleich zweier Datensätze, um zu verstehen, wie sie sich unterscheiden.



Read more

Geigenplot Lineare Regression-Voxco

 Methodik der Kundenbefragung

Methodik der Kundenbefragung SHARE THE ARTICLE ON Table of Contents Was ist die Methodik der Kundenbefragung? Die Kundenstimme ist eine Methode, mit der die Erwartungen

Read More »
Geigenplot Lineare Regression-Voxco

Balkendiagramm

Balkendiagramm SHARE THE ARTICLE ON Table of Contents Ein Balken- oder Säulendiagramm ist ein Diagramm, bei dem rechteckige Balken verwendet werden, deren Höhe oder Länge

Read More »