PARTAGER L’ARTICLE SUR
Il est fort possible que les principaux progrès en tant que composante du prétraitement des données soient la reconnaissance et la prise en compte des valeurs aberrantes, car elles peuvent influencer de manière négative l’analyse mesurable et le cycle de préparation d’un calcul d’IA, ce qui réduit l’exactitude.
Mener des recherches exploratoires semble délicat, mais un guide efficace peut aider.
Dans l’analyse prédictive, les valeurs aberrantes sont des valeurs à l’intérieur d’un ensemble de données qui fluctuent de manière extraordinaire par rapport aux autres – elles sont soit beaucoup plus grandes, soit essentiellement plus modestes. Les valeurs aberrantes peuvent montrer des incohérences dans une estimation, des erreurs exploratoires ou de la curiosité. Dans un modèle certifiable, la taille normale d’une girafe est d’environ 4 m de hauteur. En tout cas, il y a eu des révélations en cours de deux girafes qui mesurent environ 2 m chacun. Ces deux girafes seraient considérées comme des valeurs aberrantes par rapport à la population globale de girafes.
Tout en suivant le cours de l’analyse prédictive, les valeurs aberrantes peuvent causer des particularités dans les résultats acquis. Cela implique qu’ils nécessitent une considération unique et, parfois, devraient être retirés pour décomposer l’information avec succès.
Il y a deux raisons principales qui expliquent pourquoi le fait de prendre en considération les valeurs aberrantes est une partie essentielle du processus d’analyse de l’information :
Malgré l’industrie, quelle que soit la source d’information, un cadre de découverte aberrant devrait traquer un large éventail de valeurs aberrantes dans les informations de séries chronologiques, en continu et à la taille de millions de mesures.
Les calculs de localisation des valeurs aberrantes ont été explorés dans la communauté scientifique et ont récemment commencé à s’ouvrir dans les administrations commerciales ainsi qu’en matière de programmation open source. Tous dépendent de calculs factuels et d’IA, de stratégies données, par exemple, ARIMA, Holt-Winters, modèles dynamiques d’espace d’état (HMM), analyse PCA, LSTM et RNN, etc. Au-delà des calculs de base, il existe de nombreuses réflexions supplémentaires dans la construction d’un tel cadre.
Un manuel exhaustif sur la façon de fabriquer un tel cadre est illustré dans le livre blanc en 3 sections sur la localisation des irrégularités. Les étapes clés de tous les calculs pour la localisation des valeurs aberrantes de base, qui aident à reconnaître les différents types de valeurs aberrantes, sont les suivantes :
Les valeurs aberrantes sont régulièrement des effets secondaires perceptibles de problèmes fondamentaux que vous souhaitez résoudre rapidement. Néanmoins, ces effets secondaires sont à peu près aussi apparents que votre cadre de reconnaissance des valeurs aberrantes.
Il peut sembler normal de devoir éliminer les valeurs aberrantes en tant que composant du processus de nettoyage des informations. Pourtant, en réalité, de temps en temps, il est préférable, voire totalement important, de conserver les valeurs aberrantes dans votre ensemble de données.
L’élimination des valeurs aberrantes exclusivement en raison de leur position dans les limites de votre ensemble de données peut entraîner des irrégularités dans vos résultats, ce qui serait contre-productif pour vos objectifs en tant qu’analyse de données. Ces irrégularités pourraient entraîner une diminution de l’importance factuelle dans l’analyse.
Découvrez le logiciel de sondage Voxco en action avec une démo gratuite.
Voici les étapes à suivre pour traiter les valeurs aberrantes ;
Les valeurs aberrantes ne sont pas fréquemment mentionnées dans les tests, cependant, en fonction de votre entreprise et de la mesure que vous améliorez, elles pourraient influencer vos résultats.
Quelques valeurs élevées dans un petit échantillon peuvent complètement incliner un test, vous amenant à choisir un choix à la lumière d’informations erronées.
Cependant, il existe de nombreuses façons de gérer les valeurs aberrantes dans l’information. Il n’y a pas de solution pratique qui fonctionne, peu importe comment vous la regardez, ce qui est la raison pour laquelle l’intérêt pour les bons experts continue de se développer.
Enfin, la décision fondamentale concernant les valeurs aberrantes peut se résumer comme suit :
« Une valeur aberrante donnée pourrait être ce qui perturbe le plus une analyse, mais peut également être en général la chose que vous recherchez. »
Nous utilisons des cookies sur notre site web pour vous offrir la meilleure expérience de navigation et pour adapter la publicité. En continuant à utiliser notre site web, vous nous donnez votre accord pour l'utilisation des cookies. Lire la suite
prénom | Domaine | Objectif | Expiration | Type |
---|---|---|---|---|
hubspotutk | www.voxco.com | HubSpot functional cookie. | 1 year | HTTP |
lhc_dir_locale | amplifyreach.com | --- | 52 years | --- |
lhc_dirclass | amplifyreach.com | --- | 52 years | --- |
prénom | Domaine | Objectif | Expiration | Type |
---|---|---|---|---|
_fbp | www.voxco.com | Facebook Pixel advertising first-party cookie | 3 months | HTTP |
__hstc | www.voxco.com | Hubspot marketing platform cookie. | 1 year | HTTP |
__hssrc | www.voxco.com | Hubspot marketing platform cookie. | 52 years | HTTP |
__hssc | www.voxco.com | Hubspot marketing platform cookie. | Session | HTTP |
prénom | Domaine | Objectif | Expiration | Type |
---|---|---|---|---|
_gid | www.voxco.com | Google Universal Analytics short-time unique user tracking identifier. | 1 days | HTTP |
MUID | bing.com | Microsoft User Identifier tracking cookie used by Bing Ads. | 1 year | HTTP |
MR | bat.bing.com | Microsoft User Identifier tracking cookie used by Bing Ads. | 7 days | HTTP |
IDE | doubleclick.net | Google advertising cookie used for user tracking and ad targeting purposes. | 2 years | HTTP |
_vwo_uuid_v2 | www.voxco.com | Generic Visual Website Optimizer (VWO) user tracking cookie. | 1 year | HTTP |
_vis_opt_s | www.voxco.com | Generic Visual Website Optimizer (VWO) user tracking cookie that detects if the user is new or returning to a particular campaign. | 3 months | HTTP |
_vis_opt_test_cookie | www.voxco.com | A session (temporary) cookie used by Generic Visual Website Optimizer (VWO) to detect if the cookies are enabled on the browser of the user or not. | 52 years | HTTP |
_ga | www.voxco.com | Google Universal Analytics long-time unique user tracking identifier. | 2 years | HTTP |
_uetsid | www.voxco.com | Microsoft Bing Ads Universal Event Tracking (UET) tracking cookie. | 1 days | HTTP |
vuid | vimeo.com | Vimeo tracking cookie | 2 years | HTTP |
prénom | Domaine | Objectif | Expiration | Type |
---|---|---|---|---|
__cf_bm | hubspot.com | Generic CloudFlare functional cookie. | Session | HTTP |
prénom | Domaine | Objectif | Expiration | Type |
---|---|---|---|---|
_gcl_au | www.voxco.com | --- | 3 months | --- |
_gat_gtag_UA_3262734_1 | www.voxco.com | --- | Session | --- |
_clck | www.voxco.com | --- | 1 year | --- |
_ga_HNFQQ528PZ | www.voxco.com | --- | 2 years | --- |
_clsk | www.voxco.com | --- | 1 days | --- |
visitor_id18452 | pardot.com | --- | 10 years | --- |
visitor_id18452-hash | pardot.com | --- | 10 years | --- |
lpv18452 | pi.pardot.com | --- | Session | --- |
lhc_per | www.voxco.com | --- | 6 months | --- |
_uetvid | www.voxco.com | --- | 1 year | --- |