reliability

Reliabilität vs. Validität: Bedeutung, Messmethoden, Möglichkeiten zur Verbesserung

Transformieren Sie Ihren Erkenntnisgewinnung Prozess

Nutzen Sie unseren ausführlichen Leitfaden für Online-Umfragen, um einen praktikablen Prozess zur Erfassung von Feedback zu entwickeln.

SHARE THE ARTICLE ON

Table of Contents

Die Bewertung der Qualität der Forschung hilft dabei, zu beurteilen, inwieweit die Forschung zum effektiven Verständnis des Stundenthemas beigetragen hat. Zwei der Messgrößen, auf die man sich bei dieser Bewertung stützt, sind Gültigkeit und Zuverlässigkeit.

Was ist Validität?

Validität bezieht sich auf die Genauigkeit, mit der eine Sache gemessen wird. Die Validität ist ein Maß für die Authentizität in dem Sinne, dass sie ein wahres und genaues Bild ohne jegliche Schönfärberei oder Verzerrung vermittelt.

Ein Beispiel: Eine Studie, die die Marktstimmung zu einem Produkt erfassen soll, das ein multinationaler Konzern auf den Markt bringen will, wird wahrscheinlich versuchen, möglichst viele Meinungen von Personen zu sammeln, die zu seinem Zielmarkt gehören. Diese Untersuchung wird als valide angesehen, wenn die Änderungen, die an dem Produkt auf der Grundlage der von der Stichprobenpopulation während der Studie gemachten Vorschläge und Ansichten vorgenommen werden, zu einer Verbesserung der Marktposition des Unternehmens in Bezug auf die Kundengewinnung, die Erhöhung des Marktanteils oder die Steigerung des Grenzertrags führen.

Was ist Verlässlichkeit?

Komplementäre Beziehung

Validity and reliability share a complementary relationship.

 This means that the existence of accuracy implies reliability. If a data is deemed accurate such that it reflects the intended metric in the most precise manner , it naturally becomes reliable and so can be used as input to strategize and make important follow-up decisions.This even reduces the risk factor associated with taking misdirected decisions which can land organizations in a predicament.

 The reverse is also true : if a data is reliable and has been used by other entities for their working , it indicates that the data measured is correct and potrays a true picture. The underlined idea here is that if other organizations trust the authenticity of the data to use it for achieving their own objectives , the data is correct and its validity is high.

Messung der Verlässlichkeit

Test – Wiederholungstest: :

Der Test-Retest-Mechanismus beruht auf der Idee, dass wiederholbare Daten über die Zeit hinweg konsistent bleiben. Dies bedeutet, dass die Ergebnisse eines Experiments oder einer Aktivität zuverlässig sind, vorausgesetzt, dass sie sich wiederholen, wenn dieselbe Aktivität an einem anderen Ort durchgeführt wird. Die kontinuierliche Lieferung einheitlicher Ergebnisse bietet die Gewissheit, dass die so gewonnenen Ergebnisse korrekt sind und für eine effiziente und effektive Entscheidungsfindung herangezogen werden können.

 

Ein Beispiel: Die Vorlieben für Filme und Serien bleiben im Laufe der Zeit gleich. Sobald eine Person also eine bestimmte Fernsehsendung oder einen Film gesehen hat, bildet sie sich eine Meinung dazu, die unabhängig von anderen Genres, die sie sich ansieht, konstant bleibt. Wenn die Marktforschung einer OTT-Plattform zeigt, dass die Leute einen Film gesehen und hoch bewertet haben, aber ihre Meinung zu einer drastisch schlechten Bewertung geändert haben, als sie danach gefragt wurden, spiegelt dies ein uneinheitliches Muster wider und wird daher nicht als zuverlässig angesehen. Nach der Test-Retest-Methode könnte die Marktforschung der OTT-Plattform nur dann als zuverlässig gelten, wenn die Ergebnisse der anschließenden Untersuchung auch gezeigt hätten, dass die Menschen den Film für gut befunden hätten, vorausgesetzt, die Untersuchung wird mit derselben Zielgruppe durchgeführt.

Interne Kohärenz :

Die Ergebnisse, die zu einem Aspekt erzielt wurden, müssen mit den Ergebnissen anderer Aspekte korreliert werden, wenn sie alle dieselbe zugrunde liegende Idee oder dasselbe Prinzip bewerten.

Ein Beispiel: Wenn die Preise eines LED-Fernsehers aufgrund von unregelmäßiger Nachfrage und Überproduktion gestiegen sind, müssen die Studien, die die Nachfrage der Kunden nach diesem LED-Fernseher und die Produktionszahlen für diesen Zeitraum erfassen, mit diesem Preisanstieg übereinstimmen, damit die Ergebnisse zuverlässig sind. Wenn die Produktionszahlen zeigen, dass die Herstellung des Fernsehers reduziert wurde, um die gesunkene Nachfrage zu befriedigen, dann gibt es einen Mangel an interner Konsistenz, aufgrund dessen die Produktionssteigerung nicht als plausible Ursache für den Preisanstieg identifiziert werden kann.

Die verschiedenen Aspekte müssen korreliert sein und eine gemeinsame Schlussfolgerung ergeben, auf die man sich bei der Entscheidungsfindung stützen kann.

Online Surveys

Interrater-Reliabilität :

Die Interrater-Reliabilität besagt, dass verschiedene Personen, die versuchen, dieselbe Sache zu messen, zu einheitlichen Ergebnissen kommen müssen. Dies beruht auf dem Konzept, dass verschiedene Personen ähnliche Konzepte in ähnlicher Weise beurteilen, vorausgesetzt, ihr Urteil und ihr Ansatz sind korrekt und standardisiert. Es handelt sich um eine Bestätigung Technik, bei der die Beobachtung oder das Urteil einer Person durch das Urteil weiterer Personen bestätigt wird, die die ursprüngliche Behauptung verifizieren. Wenn das nachfolgende Urteil nach dem ersten Urteil nicht dieselbe Idee beschreibt, bedeutet dies, dass das Urteil fehlerhaft und unzuverlässig ist.

Beispiel: Die Behauptung, dass ein Schüler ein hervorragender Badmintonspieler ist, kann nur dann verlässlich sein, wenn andere Personen, die über ein umfassendes Wissen über den Sport und seine Regeln verfügen, die ursprüngliche Behauptung bestätigen, indem sie ihre positive Meinung über die Fähigkeit des Schülers, Badminton zu spielen, abgeben. Wenn die Beurteilung verschiedener Personen unterschiedlich ausfällt, dann ist die Schlussfolgerung, dass der Schüler ein guter Badmintonspieler ist, fragwürdig.

Measuring Validity

Content validity:

Content validity is the extent to which a concept is covered thoroughly . This involves breaking down the concept which is to be measured into essential aspects that need to be studied for a complete understanding. Content validity ensures that flawed results are avoided as a result of incomplete study.

 For example: An assessment of the level of confidence in an individual involves gauging tone, manner of speaking and body langauge. The comprehensive overview of a person’s confidence levels must include and analyse individuals on all the three bases. Covering these areas can help combine results obtained from individual aspects into an accurate conclusion. Failing to cover even one of these aspects can make the results skew in the opposite direction leading to judgements that not precise and correct.

 Criterion validity:

Criterion validity measures how the results of a research correlate with other relevant outcomes . This shows the authencity of a result , judgement or opinion in making effective predictions and in delivering a standard result across related studies.

 For example : The validity of an exit poll conducted by a news channel during elections will be measured by how effectively the exit poll data has been used to predict the outcomes of the election. If the predicted winner of the election is in line with the actual declared result, then the validity of the exit poll is very high and the partcular news channel that conducted the poll becomes a good source of gaining accurate political updates.

Discriminant validity:

Unlike criterion validity , discriminant validity assesses the relationship between the concept under study and other concepts which have no relevance to it. This is to ensure that the results do not cover unnecessary subjects that have no value addition to the topic and can adversely affect end results.

 For example : Transactional feedback that is provided after every customer interaction is a great example for studying discriminant validity. Customers are asked to rate their entire journey with a brand on a scale of 1-10 after they make a purchase. A customer rates their experience as 9/10, meaning that they find the brand and its products highly suitable for their needs and their experience with the brand has been pleasant overall. Next week , the same customer answers the same question ,after having experienced poor service at the outlet, by giving 3/10 .

The variation on the ratings given by the customer within such a short interval of time clearly shows that customer has used their recent experience of purchase as the basis of answering questions related to their entire customer journey instead of keeping the overall journey in mind. This makes their review , an improper representation of holistic customer experiences and so is highly innacurate.

Explore all the survey question types possible on Voxco

Explore all the survey question types possible on Voxco

How to improve validity and reliability?

 In order to improve validity , focus on :

  • Correct methodology: There are a number of ways to gather market intelligence about the topic that you wish to study. Figure out the correct methodology that provides you with existing market knowledge in an unbiased manner. Further, make sure this methodology gets structurally implemented.
  • Target group : Your research must be conducted using the people that have the relevant knowledge base to answer your questions as deeply as possible. Make sure you have enough participants to conduct a nuanced analysis without causing sampling bias. 
  • Verfiy results : It is important to verif results that have been obtained through a study. Try to back up decisions using supporting sources that help in confirming your conclusions as well as gain consesus from stakeholders.

 For increasing reliability , pay attention to : 

  • Consistency : Once you’ve selected your procedure, stick to it. Adhering to similar practices is particularly necessary when multiple people are involved and helps verify results through multple tests without changing the procedure of selection , collection or analysis. 
  • Narrowing frame of reference : When trying to study a concept , break it down as much as possible. This will help you in focusing on individual aspects of the topic at hand and collaborate it to get a holistic overview that can be relied upon.

Zuverlässigkeit bezieht sich auf die Nützlichkeit von Daten für fundierte Entscheidungen. Wenn für das betrachtete Experiment durchgängig die gleichen Ergebnisse erzielt werden, ist dies ein Hinweis auf die Zuverlässigkeit.

 

Die Zuverlässigkeit ist ein qualitativer Maßstab, der die Richtung der Weiterverfolgung vorgibt. Je zuverlässiger die Daten sind, desto besser können sie den Fluss der intelligenten Entscheidungsfindung lenken.

 

Ein Beispiel: Eine Website für Produktfeedback lässt die ersten Reaktionen auf ein neu eingeführtes Produkt in einem guten Licht erscheinen. Die Kunden, die ihr Feedback abgegeben haben, bezeichnen das Produkt als hochwirksam und taschen freundlich. Auf der anderen Seite werden in Blogs und auf anderen Websites die großen Nachteile des Produkts hervorgehoben. Das Produkt soll fehlerhaft und minderwertig sein, und der Kundendienst der Marke, die es auf den Markt gebracht hat, wird als sehr schlecht bezeichnet.

 

Die Widersprüchlichkeit des Kundenfeedbacks zum Produkt im obigen Beispiel deutet darauf hin, dass die ursprünglich besuchte Produktbewertung Website kein wahrheitsgetreues Bild der Kundenmeinungen widerspiegelt und somit keine verlässliche Quelle für einen potenziellen Kunden ist, um Entscheidungen über seinen Produktkauf zu treffen.

Read more