SHARE THE ARTICLE ON
Der Matthew-Korrelationskoeffizient, auch als MCC abgekürzt, wurde 1975 von Brian Matthews erfunden. MCC ist ein statistisches Instrument zur Modellbewertung. Seine Aufgabe ist es, die Differenz zwischen den vorhergesagten und den tatsächlichen Werten zu messen und entspricht der Chi-Quadrat-Statistik für eine 2 x 2 Kontingenztabelle.
Erstellen Sie einen umsetzbaren Prozess zur Sammlung von Feedback.
MCC ist eine Metrik für die beste einwertige Klassifizierung, die dabei hilft, die Konfusionsmatrix oder eine Fehlermatrix zusammenzufassen. Eine Konfusionsmatrix besteht aus vier Einheiten:
Und wird nach der folgenden Formel berechnet:
Wenn die Vorhersage gute Werte für alle vier dieser Entitäten liefert, gilt sie als zuverlässig und liefert hohe Werte. Und um den meisten Korrelationskoeffizienten gerecht zu werden, liegt MCC ebenfalls zwischen +1 und -1 als:
Holen Sie sich den Leitfaden für Marktforschung Trends, den Leitfaden für Online-Befragungen, den Leitfaden für agile Marktforschung & 5 Marktforschungsfragen
Konfusionsmatrix mit Einträgen: TP = 90, FP = 4; TN = 1, FN = 5. Wenn wir diese Werte in die Formel einsetzen, erhalten wir 0,14.
0,14 bedeutet, dass der Klassifikator sehr nahe an einem Zufalls Klassifikator (0) liegt.
Es scheint also, dass der MCC uns hilft, die Unzulänglichkeit des Klassifikators bei der Klassifizierung insbesondere der negativen Proben zu erkennen.
See Voxco survey software in action with a Free demo.
Hintergrund: Um binäre Klassifikationen und ihre Konfusionsmatrix zu bewerten, können wissenschaftliche Forscher je nach Ziel des Experiments, das sie untersuchen, verschiedene statistische Raten verwenden. Obwohl dies ein wichtiges Thema im Bereich des maschinellen Lernens ist, wurde bisher noch kein weitreichender Konsens über ein einheitliches, freiwillig gewähltes Maß erreicht. Die Genauigkeit und die F1-Punktzahl, die anhand von Konfusionsmatrix berechnet werden, waren (und sind immer noch) die am häufigsten verwendeten Metriken bei binären Klassifizierung Aufgaben. Diese statistischen Maße können jedoch gefährlich über optimistische Ergebnisse liefern, insbesondere bei unausgewogenen Datensätzen.
Die Ergebnisse: Der Matthews-Korrelationskoeffizient (MCC) hingegen ist ein zuverlässiges statistisches Maß, das nur dann eine hohe Punktzahl ergibt, wenn die Vorhersage in allen vier Kategorien der Konfusionsmatrix (echte Positive, falsche Negative, echte Negative und falsche Positive) gute Ergebnisse erzielt, und zwar proportional sowohl zur Größe der positiven Elemente als auch zur Größe der negativen Elemente im Datensatz.
Schlussfolgerungen: In diesem Artikel zeigen wir, wie MCC einen informativen und wahrheitsgetreuen Wert bei der Bewertung binärer Klassifizierungen liefert als die Genauigkeit und der F1-Wert, indem wir zunächst die mathematischen Eigenschaften und dann den Nutzen von MCC in sechs synthetischen Anwendungsfällen und in einem realen Genomik-Szenario erläutern. Wir sind der Meinung, dass der Matthews-Korrelationskoeffizient bei der Bewertung von binären Klassifizierung Aufgaben von allen wissenschaftlichen Gemeinschaften gegenüber der Genauigkeit und dem F1-Score bevorzugt werden sollte.
Read more
We use cookies in our website to give you the best browsing experience and to tailor advertising. By continuing to use our website, you give us consent to the use of cookies. Weiterlesen
Name | Domain | Zweck | Ablauf | Art |
---|---|---|---|---|
hubspotutk | www.voxco.com | HubSpot functional cookie. | 1 year | HTTP |
lhc_dir_locale | amplifyreach.com | --- | 52 years | --- |
lhc_dirclass | amplifyreach.com | --- | 52 years | --- |
Name | Domain | Zweck | Ablauf | Art |
---|---|---|---|---|
_fbp | www.voxco.com | Facebook Pixel advertising first-party cookie | 3 months | HTTP |
__hstc | www.voxco.com | Hubspot marketing platform cookie. | 1 year | HTTP |
__hssrc | www.voxco.com | Hubspot marketing platform cookie. | 52 years | HTTP |
__hssc | www.voxco.com | Hubspot marketing platform cookie. | Session | HTTP |
Name | Domain | Zweck | Ablauf | Art |
---|---|---|---|---|
_gid | www.voxco.com | Google Universal Analytics short-time unique user tracking identifier. | 1 days | HTTP |
MUID | bing.com | Microsoft User Identifier tracking cookie used by Bing Ads. | 1 year | HTTP |
MR | bat.bing.com | Microsoft User Identifier tracking cookie used by Bing Ads. | 7 days | HTTP |
IDE | doubleclick.net | Google advertising cookie used for user tracking and ad targeting purposes. | 2 years | HTTP |
_vwo_uuid_v2 | www.voxco.com | Generic Visual Website Optimizer (VWO) user tracking cookie. | 1 year | HTTP |
_vis_opt_s | www.voxco.com | Generic Visual Website Optimizer (VWO) user tracking cookie that detects if the user is new or returning to a particular campaign. | 3 months | HTTP |
_vis_opt_test_cookie | www.voxco.com | A session (temporary) cookie used by Generic Visual Website Optimizer (VWO) to detect if the cookies are enabled on the browser of the user or not. | 52 years | HTTP |
_ga | www.voxco.com | Google Universal Analytics long-time unique user tracking identifier. | 2 years | HTTP |
_uetsid | www.voxco.com | Microsoft Bing Ads Universal Event Tracking (UET) tracking cookie. | 1 days | HTTP |
vuid | vimeo.com | Vimeo tracking cookie | 2 years | HTTP |
Name | Domain | Zweck | Ablauf | Art |
---|---|---|---|---|
__cf_bm | hubspot.com | Generic CloudFlare functional cookie. | Session | HTTP |
Name | Domain | Zweck | Ablauf | Art |
---|---|---|---|---|
_gcl_au | www.voxco.com | --- | 3 months | --- |
_gat_gtag_UA_3262734_1 | www.voxco.com | --- | Session | --- |
_clck | www.voxco.com | --- | 1 year | --- |
_ga_HNFQQ528PZ | www.voxco.com | --- | 2 years | --- |
_clsk | www.voxco.com | --- | 1 days | --- |
visitor_id18452 | pardot.com | --- | 10 years | --- |
visitor_id18452-hash | pardot.com | --- | 10 years | --- |
lpv18452 | pi.pardot.com | --- | Session | --- |
lhc_per | www.voxco.com | --- | 6 months | --- |
_uetvid | www.voxco.com | --- | 1 year | --- |