Heatmap ou Carte de chaleur

PARTAGER L’ARTICLE SUR

Heatmap ou Carte de chaleur Heatmap
Table of Contents

Une carte de chaleur, ou heatmap en anglais, est un outil permettant d’afficher une carte ou une image. Il utilise les données de votre site Web pour vous informer sur le comportement de l’utilisateur sous forme graphique en utilisant différentes couleurs dans le rapport. Une carte de chaleur est une représentation visuelle de l’information. Les cartes de chaleur sont utilisées pour afficher l’activité des visiteurs sur vos sites Web ou vos pages Web ; elles servent à indiquer où les utilisateurs ont le plus cliqué sur une page ou jusqu’où les visiteurs ont fait défiler une page.

QU’EST-CE QU’UNE CARTE DE CHALEUR ?

Les cartes de chaleur sont des cartes colorées qui affichent les données de manière bidimensionnelle. Les cartes de chaleur produisent une variation de couleur en utilisant la teinte, la saturation ou la luminosité pour représenter diverses caractéristiques. Cette fluctuation de couleur informe les lecteurs sur l’ampleur des nombres numériques. Comme le cerveau humain comprend mieux les images que les chiffres, le texte ou d’autres données écrites, les cartes de chaleur remplacent les nombres par des couleurs. Les êtres humains étant des apprenants visuels, l’affichage des données sous quelque forme que ce soit est plus logique. Les cartes de chaleur sont des représentations visuelles de données qui sont simples à interpréter. Par conséquent, les méthodes de visualisation telles que les cartes de chaleur ont gagné en popularité.

Les cartes de chaleur peuvent représenter des modèles, des variances et même des anomalies en décrivant la densité ou l’intensité des données. Les relations entre les variables sont représentées à l’aide de cartes thermiques. Ces variables sont affichées sur les deux axes. Nous recherchons des motifs dans la cellule en observant comment la couleur change. Il accepte uniquement les données numériques et les affiche sur une grille, présentant différentes valeurs de données en modifiant l’intensité des couleurs.

Guide de recherche exploratoire

Menez une recherche exploratoire semble délicat, mais un guide efficace peut vous aider.

HISTOIRE

Les cartes de chaleur ont évolué à partir de représentations en 2D des valeurs de la matrice de données. Les petits carrés gris foncé ou noirs (pixels) signifiaient des valeurs plus importantes, tandis que les carrés plus clairs représentaient des valeurs inférieures. Toussaint Loua (1873) a visualisé les statistiques sociales dans les arrondissements de Paris à l’aide d’une matrice de coloration. Sneath (1957) a montré les résultats d’une analyse de grappes en permutant les lignes et les colonnes d’une matrice pour organiser des valeurs comparables proches les unes des autres en fonction du regroupement. Une représentation comparable a été utilisée par Jacques Bertin pour afficher des données correspondant à l’échelle de Guttman. Robert Ling a eu l’idée de connecter des arbres de clusters aux lignes et aux colonnes d’une matrice de données en 1973. Ling représentait plusieurs nuances de gris avec des caractères d’imprimante surpuissants, une largeur de caractère par pixel. En 1994, Leland Wilkinson a créé le premier logiciel informatique (SYSTAT) permettant de générer des cartes de chaleur de clusters avec des images couleur haute résolution. L’affichage présenté dans l’illustration d’Eisen et al. est une copie de l’ancienne conception SYSTAT.

Cormac Kinney, un inventeur de logiciels, a breveté l’expression « heatmap » en 1991 pour représenter un graphique en 2D montrant des données sur les marchés financiers. L’entreprise qui a acheté l’idée de Kinney en 2003 a par inadvertance laissé tomber la marque.

UTILISATIONS DE LA CARTE DE CHALEUR

ANALYSE COMMERCIALE : Une carte de chaleur est utilisée comme outil visuel d’analyse commerciale dans l’analyse commerciale. Une carte de chaleur fournit des indices visuels immédiats concernant les résultats actuels, les performances et les domaines potentiels de développement. Les cartes de chaleur peuvent évaluer les données actuelles pour identifier les régions à forte intensité qui peuvent indiquer où se trouve la majorité des consommateurs, les emplacements qui risquent de saturer le marché ou les sites froids et ceux ayant besoin d’aide. Les cartes de chaleur peuvent être mises à jour indéfiniment pour indiquer les progrès et les efforts. Ces cartes peuvent être intégrées au flux de travail d’une entreprise et utilisées dans des analyses continues. Pour interagir avec les membres de l’équipe ou les clients, les cartes de chaleur affichent les données dans un format visuel et facile à comprendre.

BIOLOGIE MOLÉCULAIRE : Les cartes de chaleur sont utilisées en biologie moléculaire pour examiner les modèles de différence et de similitude dans l’ADN, l’ARN et d’autres molécules.

GÉOVISUALISATION : Les cartes thermiques géospatiales peuvent montrer comment les zones géographiques d’une carte sont liées les unes aux autres en fonction de certains critères. Les cartes de chaleur peuvent être utilisées dans l’analyse des clusters ou des points chauds pour identifier les clusters à forte concentration d’activité, comme l’analyse des prix de location Airbnb.

ANALYSE EXPLORATOIRE DES DONNÉES : EDA (Exploratory Data Analysis) est une tâche effectuée par les data scientists (spécialistes des données) pour se familiariser avec les données. L’EDA fait référence à toute enquête préliminaire menée pour mieux comprendre les données. La pratique consistant à évaluer les ensembles de données avant la modélisation est connue sous le nom d’analyse exploratoire des données (EDA). Examiner une feuille de calcul pleine de chiffres et déterminer les qualités importantes dans un ensemble de données est une activité qui prend beaucoup de temps. Par conséquent, l’EDA est utilisé pour mettre en évidence leurs aspects essentiels, en utilisant fréquemment des approches visuelles telles que les cartes de chaleur. Les cartes de chaleur sont un outil puissant pour visualiser les corrélations entre les variables dans un espace à haute dimension. Il est possible d’y parvenir en utilisant des variables de caractéristiques comme en-têtes de ligne et de colonne, et la variable par rapport à elle-même sur la diagonale.

SITE WEB : Les cartes de chaleur sont utilisées sur les sites Web pour illustrer les données relatives à l’activité des visiteurs. Cette visualisation aide les propriétaires d’entreprises et les spécialistes du marketing à déterminer les parties les plus performantes et les moins performantes d’un site Web. Ces informations aident à l’optimisation.

MARKETING ET VENTES : La capacité de la carte de chaleur à détecter les emplacements chauds et froids est utilisée pour augmenter les taux de réponse marketing grâce à un marketing ciblé. Les cartes de chaleur permettent de découvrir les emplacements qui réagissent aux campagnes, aux marchés mal desservis, à la résidence des clients et aux tendances de vente élevées, ce qui facilite l’optimisation des gammes de produits, la capitalisation des ventes, la création de segments de clientèle ciblés et l’évaluation des données démographiques régionales.

MISE EN ŒUVRE LOGICIELLE DE LA CARTE DE CHALEUR

  • La visualisation de cartes de chaleur dans MATLAB offre une multitude de choix de configuration. Pour créer des cartes de chaleur sur mesure, Seaborn, une bibliothèque Python construite au-dessus du framework (cadre) matplotlib, est utilisée. Les cartes de chaleur Seaborn visualisent la matrice de corrélation, ce qui facilite l’EDA, la sélection des fonctionnalités et la résolution de problèmes.
  • Les cartes de chaleur peuvent être tracées dans l’environnement logiciel R à l’aide du package « Heatmaply R ».
  • Google Fusion Tables vous permet de générer une carte de chaleur à partir d’une feuille de calcul Google Sheets avec un maximum de 1000 points de données géographiques.
  • Openlayers3 peut créer une couche de carte thermique basée sur un certain attribut de toutes les caractéristiques géographiques dans une couche vectorielle.
  • js est un cadre de visualisation de données Java qui peut générer des graphiques de cartes de chaleur dynamiques.
  • Gnuplot est un logiciel de graphique en ligne de commande qui peut tracer des cartes de chaleur en 2D et en 3D.
  • Fusion Charts : Fusion Charts est une application de création et de visualisation de graphiques écrite en JavaScript. Elle peut générer 90 types de graphiques différents. Les utilisateurs peuvent créer des visualisations rapides en choisissant parmi une variété de modèles plutôt que de partir de zéro et de simplement d’introduire leurs sources de données selon les besoins.
  • Highcharts : Highcharts étant compatible avec plusieurs navigateurs, n’importe qui peut voir et exécuter ses visualisations interactives. Il permet une solution rapide et polyvalente avec peu d’expertise en visualisation de données.
  • Datawrapper : Datawrapper dispose d’une interface facile à utiliser pour télécharger des données CSV et créer des graphiques et des cartes clairs qui peuvent être incorporés dans des rapports. C’est une option populaire parmi les entreprises de médias, qui l’utilisent régulièrement pour créer des graphiques et rapporter des informations.

SCHÉMAS DE COULEURS

De nombreux schémas de couleurs différents peuvent être utilisés pour représenter la carte de chaleur, chacun ayant ses propres avantages et inconvénients en termes de perception. Les sélections de palettes de couleurs sont plus qu’une question d’esthétique puisque les couleurs de la carte de chaleur reflètent les modèles de données. La découverte de motifs peut être facilitée par de bons schémas de couleurs, mais elle peut également être entravée par de mauvaises sélections de couleurs.

Voici des directives générales pour l’utilisation des couleurs dans les cartes de chaleur :

Pour différencier les catégories, faites varier la teinte : Changez la couleur des pièces pour indiquer différents types d’histoires. La plupart des gens peuvent faire la distinction entre un nombre limité de teintes. Les couleurs sont le meilleur moyen d’indiquer les catégories.

Variez la luminance pour représenter les nombres : Faire varier la luminance vous permet de discerner la structure des données numériques. La variation de luminance améliore la visibilité des motifs discrets ou continus dans une distribution à deux variables. La palette de couleurs de luminosité met également en évidence la présence de deux pics forts.

MEILLEURES PRATIQUES POUR UTILISER UNE CARTE DE CHALEUR

Palette de couleurs : étant donné que la couleur est un élément important d’une carte de chaleur, la palette de couleurs doit correspondre au type de données. Entre la valeur et la couleur, une barre de couleur séquentielle est utilisée, les teintes plus claires correspondant à des quantités plus faibles et des teintes plus foncées correspondant à des valeurs plus importantes, ou vice versa. Lorsque les valeurs ont un point zéro, une palette de couleurs divergentes est utilisée.

Légende : étant donné que les couleurs n’ont pas de lien naturel avec les valeurs numériques, une légende est nécessaire pour que les spectateurs puissent comprendre le contenu de la carte de chaleur. Une clé est utile pour afficher le mappage des couleurs aux valeurs numériques.

Annoter : en raison d’un manque de précision dans le mappage de la couleur à la valeur, il est avantageux d’ajouter des annotations de valeur de cellule à la carte de chaleur.

Trier : il est conseillé de tracer les variables numériques sur la carte de chaleur dans un ordre trié ; cela aide les lecteurs à comprendre les modèles de données. Comme les catégories n’ont pas d’ordre naturel, une pratique courante consiste à les trier en fonction de leur valeur moyenne de leur cellule. La carte de chaleur en grappes regroupe les valeurs des catégories en fonction de leur proximité.

Marques de coche : les marques de coche correspondent normalement au nombre de bacs, qui varie en fonction du type de données. S’il y a peu de cases sur une variable d’axe numérique, il est permis de conserver des graduations sur chaque case. Cependant, lorsqu’il y a de nombreuses cases, il est préférable de mettre des coches entre les groupes de cases pour minimiser l’encombrement. Il est suggéré de conserver les graduations sur chaque case pour une variable d’axe catégoriel.

PALETTES DE COULEURS

Palettes de couleurs Seaborn : les palettes de couleurs sont un ensemble complet de couleurs numériques utilisées pour les visualisations Seaborn.

La fonction palette de couleurs () seaborn offre une interface pour créer des palettes de couleurs dans seaborn. Nom d’une palette seaborn (profonde, sourde, brillante, pastel, sombre, daltonienne), Nom d’une palette de couleurs matplotlib, ‘ch:cubehelix arguments>’, ‘husl’ ou ‘hsl’, ‘light:color>’, ‘dark:color>’, ‘blend:color>,color>’, ou Une séquence de couleurs dans n’importe quel format autorisé par matplotlib. La méthode set palette() définit la palette par défaut, qui appelle en interne color palette() et accepte les mêmes entrées.

PALETTE QUALITATIVE : les couleurs d’une palette qualitative incluent généralement des différences dans leur composante de teinte ; par conséquent, les palettes qualitatives sont appropriées pour représenter des données catégorielles. La palette de couleurs par défaut du seaborn est une « palette qualitative ». Profond, en sourdine, pastel, brillant, sombre et daltonien sont les six options de palette matplotlib disponibles dans Seaborn.

Le moyen le plus simple d’identifier des teintes uniques consiste à dessiner des couleurs équidistantes dans un espace colorimétrique circulaire pour un nombre arbitraire de catégories ; les espaces colorimétriques HSL et HUSL utilisent cette méthode.

PALETTE SÉQUENTIELLE : parce que la luminance est la dimension dominante de la variation dans une palette séquentielle, elle convient à l’affichage de données numériques. Lorsque les données vont de valeurs relativement faibles ou ennuyeuses à des informations relativement élevées ou fascinantes, la cartographie séquentielle des couleurs est idéale. Pour les données catégorielles, Seaborn utilise la version discrète de la palette séquentielle, tandis que pour les données numériques, il utilise la version continue. Des palettes de couleurs séquentielles discrètes peuvent également être utilisées pour visualiser des données catégorielles. Les palettes de couleurs séquentielles sont idéales pour les données qui augmentent progressivement et linéairement. Chaque palette de couleur séquentielle a une variante inversée, qui est désignée par le suffixe « _r ».

  • Palettes perceptuellement uniformes du point de vue de perception : Seaborn est livré avec quatre cartes de couleurs successives qui sont perceptuellement uniformes : « rocket », « mako », « flare » et « crest ». Les deux premiers ont une large plage de luminosité et sont idéaux pour des applications telles que la carte de chaleur.
  • Palettes cubehelix successives : le système « cubehelix » fournit un compromis basé sur RVB, produisant des palettes séquentielles avec une augmentation ou une baisse linéaire de la luminosité et une fluctuation continue de la couleur. Les palettes de couleurs qui en résultent ne sont pas exactement homogènes sur le plan de la perception, mais le processus de conception est paramétrable. L’apparence de la palette est contrôlée par cubehelix palette().
  • Palettes séquentielles personnalisées : une seule valeur de couleur est fournie à light palette() ou dark palette(), qui génère une palette qui commence par des valeurs désaturées claires ou foncées et progresse vers cette couleur.
  • Palettes séquentielles Color Brewer : la collection « Color Brewer » comprend des palettes avec une seule teinte primaire.

PALETTE DIVERGENTE : Les palettes divergentes peuvent être utilisées pour représenter des données numériques avec une bordure de catégorie. La palette de couleurs divergente génère une palette de couleurs en combinant la divergence de deux couleurs. Celles-ci sont utilisées pour les données qui ont à la fois des valeurs faibles et élevées qui sont exceptionnelles et couvrent une valeur moyenne qui doit être atténuée. Les palettes divergentes ont deux couleurs de coloriage dominantes, une à chaque pôle. Il est également essentiel que les valeurs de départ aient une luminosité et une saturation comparables.

Palettes divergentes perceptuellement uniformes : « vlag » et « icefire » sont deux palettes divergentes perceptuellement uniformes dans Seaborn.

Palettes divergentes faites sur commande : Diverging palette() est une fonction qui génère une palette de couleurs personnalisée pour les données divergentes. Il crée des palettes de couleur avec une seule couleur de chaque côté. Elle requiert deux couleurs comme paramètres, toutes deux convergentes vers une autre couleur au centre. Les corrélations vont de -1 à 1, elles ont donc deux directions, et dans ce cas, une palette divergente fonctionne mieux qu’une palette séquentielle.

ENTRÉES DE LA CARTE DE CHALEUR

Format large : Le format large, communément appelé format désordonné, est une matrice dans laquelle chaque ligne représente une personne et chaque colonne représente une observation. Dans ce scénario, la couleur d’une cellule de carte de la chaleur est corrélée à la valeur d’observation.

Matrice de corrélation : Une matrice de corrélation, communément appelée format carré, est générée en appliquant la fonction corr() sur un ensemble de données et est affichée sur une carte de chaleur. Ces cartes de chaleur aident à déterminer les facteurs qui sont liés les uns aux autres.

Format long : Le format long, souvent appelé format ordonné, correspond au moment où chaque ligne reflète une observation. L’individu, le nom de la variable et la valeur sont les trois colonnes (x, y et z). Ce type de données peut être utilisé pour générer une carte de chaleur, comme indiqué ci-dessous :

Découvrez le logiciel d’enquêteVoxco en action avec une démo gratuite.

ANALYSE DES DONNÉES DE LA CARTE DE CHALEUR

  • Le lien positif le plus important avec l’alcool se trouve dans la qualité du vin, suivi par les sulfates et l’acide citrique.
  • L’acidité volatile a le lien le plus négatif avec la qualité du vin, suivie de la densité et des chlorures.
  • Si nous devons réduire la dimensionnalité d’un modèle, nous pouvons supprimer les caractéristiques dont la corrélation est plus proche de zéro, comme le sucre résiduel, le dioxyde de soufre, le pH et l’acidité constante.
  • Pour la sélection des caractéristiques, l’une des caractéristiques ayant une association significative avec d’autres composants peut également être exclue. L’une des caractéristiques du « dioxyde de soufre libre » ou du « dioxyde de soufre total » peut être supprimée (en fonction d’une analyse plus approfondie).

TYPES DE CARTES DE CHALEUR

CARTE DE CHALEUR DE GRILLE

Une fonction basée sur la densité est utilisée pour disposer les grandeurs des valeurs affichées à travers les couleurs dans une matrice de lignes et de colonnes. Les cartes de chaleur de grille sont classées comme suit.

Carte de chaleur en cluster (en grappes) : L’objectif de la carte de chaleur en cluster est de créer des relations entre les points de données et leurs caractéristiques. Le clustering (la mise en grappes ou regroupement) est utilisé dans le cadre du processus de regroupement de caractéristiques comparables dans ce type de carte de chaleur. Les cartes de chaleur groupées sont couramment utilisées en sciences biologiques pour étudier les similitudes génétiques entre les personnes.

Corrélogramme : Un corrélogramme remplace chacune des variables sur les deux axes par des variables numériques dans l’ensemble de données. Chaque carré représente le lien entre deux variables qui se croisent, ce qui facilite le développement de modèles statistiques descriptifs ou prédictifs.

CARTE DE CHALEUR SPATIALE

Chaque case d’une carte de chaleur se voit attribuer une représentation en couleur basée sur la valeur des cellules voisines. L’ampleur de la valeur dans cet espace détermine le placement de la couleur. Ces cartes de chaleur sont des superpositions de canevas « peinture par numéros » basées sur des données superposées sur des images. Les cellules avec des valeurs plus élevées que les autres cellules sont colorées avec une couleur chaude, tandis que les cellules avec des valeurs plus faibles sont colorées avec une couleur froide.

CARTE CHOROPLÈTHE VS CARTE DE CHALEUR

Les cartes thermiques et les cartes choroplèthes sont souvent confondues. Une carte choroplèthe montre le pourcentage d’une variable d’intérêt en utilisant différents motifs d’ombrage à l’intérieur des limites géographiques. Une carte de chaleur, en revanche, n’est pas corrélée aux limites géographiques. Les cartes choroplèthes illustrent la variabilité d’une variable dans le temps ou sur une zone géographique. Au lieu des zones géographiques a priori des cartes choroplèthes, une carte de chaleur utilise des régions générées en fonction du modèle de la variable. La carte choroplèthe est divisée en entités géographiques bien connues, notamment des nations, des états, des provinces et des comtés.

CARTE DE CHALEUR AVANCÉE

CORRPLOT

Les cartes de chaleur régulières facilitent la distinction entre la corrélation négative, la corrélation positive et l’absence de corrélation, mais l’examen des valeurs de corrélation positive entre les variables positivement corrélées nécessite encore de parcourir la grille plusieurs fois. Pour rendre nos cartes plus lisibles, nous ajoutons la taille comme paramètre à notre carte de chaleur en plus de la couleur. La taille de chaque case colorée est proportionnelle à l’ampleur de l’association. Il fournit également un aperçu des distributions marginales sans nécessiter l’utilisation d’un graphique en couleur.

c = corrplot. Corrplot(data.corr())

c.plot(cmap=’coolwarm’, method=’square’, shrink=.9 ,rotation=45)

CARTE DE CHALEUR DU CLUSTER (EN GRAPPES)

Le clustering est utilisé dans le cadre du processus de regroupement de caractéristiques comparables dans ce type de carte de chaleur. Intrinsèquement, les méthodes de clustering sont utilisées pour regrouper les lignes associées sur une carte. L’ordre des colonnes est également choisi.

sns.clustermap(data.corr(), cmap= »coolwarm »)

AVANTAGES DE DE LA CARTE DE CHALEUR

  • Les cartes de chaleur aident les entreprises à prendre des décisions éclairées qui améliorent leurs résultats : les cartes de chaleur facilitent les décisions commerciales en aidant les gestionnaires à faire de meilleurs choix de conception Web qui augmentent l’engagement et les conversions qui mènent aux ventes. Enfin, les cartes thermiques visent à augmenter les revenus. Enfin, les clients apprécient leur retour sur investissement, comme en témoigne l’utilisation généralisée des outils de diagnostic en ligne des cartes de chaleur.
  • Des graphiques efficaces démontrent des conclusions claires : cet article du Wall Street Journal de 2015 présente des cartes de chaleur à la fois pratiques et attrayantes. Chaque graphique représente le nombre de cas de maladie infectieuse ainsi que la date à laquelle un vaccin a été mis sur le marché. Ces graphiques sont également interactifs dans le sens où vous pouvez les survoler pour obtenir plus d’informations.
  • Donne un aperçu direct des performances Web : une carte de chaleur des clics illustre les tendances des utilisateurs à cliquer. La visibilité moyenne des pages est révélée par des cartes de chaleur. L’attention révèle quelles parties de votre site Web sont les plus attrayantes pour les consommateurs. Les mouvements de la souris sont suivis. Enfin, les cartes de chaleur géographiques montrent quelles zones ou nations ont des taux de conversion élevés et lesquelles n’en ont pas.
  • Mieux comprendre votre vision et offrez-leur une meilleure expérience : les utilisateurs sont essentiels parce qu’ils font partie du dialogue, que l’objectif soit de vendre un service, un produit ou une idée. Cela implique que vous devez être intéressé à savoir comment les gens réagissent à votre message et si vous devez l’améliorer d’une nouvelle manière. Cela implique de déterminer ce qui irrite ou distrait vos consommateurs, d’où l’importance des scores de friction sur les cartes de chaleur. Une solution comme celle-ci peut automatiquement suivre les données pour vous montrer où et quand l’utilisateur est frustré. Les filtres de carte de chaleur peuvent démontrer la diversité des réactions de votre public à un même message. Écouter un public spécifique vous permet de lui offrir une meilleure expérience.

INCONVÉNIENTS DE LA CARTE DE CHALEUR

  • La couleur est difficile à transférer dans une échelle continue.

Il existe diverses exceptions à cette règle, ce n’est donc pas toujours un facteur de rupture, mais dans le cas des cartes de chaleur, le problème est particulièrement difficile car notre perception d’une couleur change en fonction des couleurs qui l’entourent. Par conséquent, même avec de minuscules ensembles de données, les cartes de chaleur ne conviennent pas à la visualisation des résultats individuels. Cela se traduit par :

  • Répondre à des requêtes particulières avec une approche de recherche de tableau n’est souvent pas réalisable car il est impossible de dériver la valeur numérique correspondant à une teinte donnée avec suffisamment de précision.
  • Souvent, les données ne sont pas regroupées de manière à ce que des modèles puissent être identifiés.
  • Sans un tel regroupement, il est souvent difficile, voire impossible, de déduire quoi que ce soit sur des modèles généraux.
  • Les cartes de chaleur sont fréquemment utilisées pour faire sensation ou simplement pour avoir fière allure, en particulier lors de l’utilisation d’un dégradé multicolore, mais il existe généralement de meilleures façons de présenter les données.
  • Le choix idéal est de tracer des données continues sur une échelle similaire. Un tracé linéaire est le choix naturel lorsqu’il y a une composante temporelle.

Read more