Matthews' Korrelationskoeffizient: Definition, Formel und Vorteile Matthews' Korrelationskoeffizient-Voxco

Matthews' Korrelationskoeffizient: Definition, Formel und Vorteile

SHARE THE ARTICLE ON

Table of Contents

Wie hoch ist der Korrelationskoeffizient von Matthew?

Der Matthew-Korrelationskoeffizient, auch als MCC abgekürzt, wurde 1975 von Brian Matthews erfunden. MCC ist ein statistisches Instrument zur Modellbewertung. Seine Aufgabe ist es, die Differenz zwischen den vorhergesagten und den tatsächlichen Werten zu messen und entspricht der Chi-Quadrat-Statistik für eine 2 x 2 Kontingenztabelle.

Transformieren Sie Ihren Erkenntnisgewinnung Prozess

Erstellen Sie einen umsetzbaren Prozess zur Sammlung von Feedback.

online survey

Matthews Formel für den Korrelationskoeffizienten

MCC ist eine Metrik für die beste einwertige Klassifizierung, die dabei hilft, die Konfusionsmatrix oder eine Fehlermatrix zusammenzufassen. Eine Konfusionsmatrix besteht aus vier Einheiten:

  • Wahr-Positive (TP)
  • Wahr-Negative (TN)
  • Falsch-positive Ergebnisse (FP)
  • Falsch Negative (FN)

Und wird nach der folgenden Formel berechnet:

Matthews' Korrelationskoeffizient: Definition, Formel und Vorteile Matthews' Korrelationskoeffizient-Voxco

Wenn die Vorhersage gute Werte für alle vier dieser Entitäten liefert, gilt sie als zuverlässig und liefert hohe Werte. Und um den meisten Korrelationskoeffizienten gerecht zu werden, liegt MCC ebenfalls zwischen +1 und -1 als:

  • +1 ist die beste Übereinstimmung zwischen den vorhergesagten und den tatsächlichen Werten.
  • 0 bedeutet keine Übereinstimmung. Das heißt, die Vorhersage ist zufällig und entspricht den tatsächlichen Werten.

Download Marktforschungs-Toolkit

Holen Sie sich den Leitfaden für Marktforschung Trends, den Leitfaden für Online-Befragungen, den Leitfaden für agile Marktforschung & 5 Marktforschungsfragen

Making the most of your B2B market research in 2021 PDF 3 s 1.png

Beispiel für MCC

Konfusionsmatrix mit Einträgen: TP = 90, FP = 4; TN = 1, FN = 5. Wenn wir diese Werte in die Formel einsetzen, erhalten wir 0,14.

0,14 bedeutet, dass der Klassifikator sehr nahe an einem Zufalls Klassifikator (0) liegt.

Es scheint also, dass der MCC uns hilft, die Unzulänglichkeit des Klassifikators bei der Klassifizierung insbesondere der negativen Proben zu erkennen.

See Voxco survey software in action with a Free demo.

Vorteile von MCC gegenüber dem F1-Score

Abstrakt

Hintergrund: Um binäre Klassifikationen und ihre Konfusionsmatrix zu bewerten, können wissenschaftliche Forscher je nach Ziel des Experiments, das sie untersuchen, verschiedene statistische Raten verwenden. Obwohl dies ein wichtiges Thema im Bereich des maschinellen Lernens ist, wurde bisher noch kein weitreichender Konsens über ein einheitliches, freiwillig gewähltes Maß erreicht. Die Genauigkeit und die F1-Punktzahl, die anhand von Konfusionsmatrix berechnet werden, waren (und sind immer noch) die am häufigsten verwendeten Metriken bei binären Klassifizierung Aufgaben. Diese statistischen Maße können jedoch gefährlich über optimistische Ergebnisse liefern, insbesondere bei unausgewogenen Datensätzen.

Die Ergebnisse: Der Matthews-Korrelationskoeffizient (MCC) hingegen ist ein zuverlässiges statistisches Maß, das nur dann eine hohe Punktzahl ergibt, wenn die Vorhersage in allen vier Kategorien der Konfusionsmatrix (echte Positive, falsche Negative, echte Negative und falsche Positive) gute Ergebnisse erzielt, und zwar proportional sowohl zur Größe der positiven Elemente als auch zur Größe der negativen Elemente im Datensatz.

Schlussfolgerungen: In diesem Artikel zeigen wir, wie MCC einen informativen und wahrheitsgetreuen Wert bei der Bewertung binärer Klassifizierungen liefert als die Genauigkeit und der F1-Wert, indem wir zunächst die mathematischen Eigenschaften und dann den Nutzen von MCC in sechs synthetischen Anwendungsfällen und in einem realen Genomik-Szenario erläutern. Wir sind der Meinung, dass der Matthews-Korrelationskoeffizient bei der Bewertung von binären Klassifizierung Aufgaben von allen wissenschaftlichen Gemeinschaften gegenüber der Genauigkeit und dem F1-Score bevorzugt werden sollte.

Erkunden Sie alle Fragetypen möglich auf Voxco

Read more

Voxco bringt Voxco Intelligence auf den Markt, eine codefreie Datenanalyseplattform ​