De plus de plus de données sont accessibles à partir de pages WEB.
Grâce à ce tutoriel capturons et transformons les données du WEB avec un minimum d’effort.
(Les copies-écrans du présent document sont issues d’EXCEL version 365)
QUELLES DONNEES WEB SONT RECUPERABLES DANS EXCEL ?
Avant de nous lancer dans la récupération de données capturées sur le WEB, nous devons nous assurer que ces données sont récupérables dans EXCEL.
D’une façon générale nous pourrons récupérer les données d’une page WEB se présentant sous la forme d’un tableau.
Pour nous en assurer, il suffit de nous rendre sur la page WEB visée, de copier le tableau de données voulu (ctrl+C) et le coller dans une feuille EXCEL vierge (ctrl+V).
Si, après cette opération, nous obtenons les données en colonnes avec entêtes dans EXCEL nous avons de bonnes chances de pouvoir utiliser avec succès les fonctions de récupération de données.
Pour simplifier, le site WEB utilisé se trouve en accès libre (accès anonyme). Il est tout à fait possible de récupérer également des données sur des pages WEB réclamant une connexion explicite « Code Utilisateur/Mot de passe ». Ce tutoriel ne détaille pas les étapes à suivre pour ce type de connexion (si besoin, se reporter à la page https://learn.microsoft.com/fr-fr/power-query/connector-authentication)
CREONS UN LIEN AVEC LE SITE WEB
Ouvrons un nouveau classeur EXCEL et dans l’onglet « Données » du ruban, cliquons sur l’icône ‘A partir du WEB’ :
Dans la fenêtre qui s’ouvre, indiquons l’adresse (l’URL) du site WEB désiré :
Cliquons sur OK.
Le formulaire « Navigateur » s’ouvre. Sélectionnons « Table » dans sa partie gauche :
Dans sa partie droite du formulaire « Navigateur » affiche un aperçu des données voulues puis, dans le bas du formulaire, sélectionnons « Charger dans… » de la liste déroulante :
Dans le fenêtre « Importation des données », choisissons « Insérer les données dans » la feuille existante en $A$1 puis cliquons ur OK :
Après le temps nécessaire pour le chargement des données, nous obtenons le tableau suivant dans le feuille EXCEL :
Dans le formulaire « Propriétés de la requête » sélectionnons :
- Activer l’actualisation en arrière-plan
- Actualiser toutes les 360 minutes (6 heures) ou indiquer une autre périodicité
- Actualiser les données lors de l’ouverture du fichier.
PERSONNALISONS LES DONNÉES RECUPÉRÉES
Maintenant que nos données sont récupérées, nous aimerions bien améliorer leur présentation :
- Nous voulons supprimer la première colonne (« Rang ») et la dernière colonne (« Détail ») sans intérêt pour nous.
- Nous voulons trier les cours sur la colonne « Variation (24h) » en ordre décroissant pour obtenir le hit-parade des crypto-monnaies relativement à leur variation d’un jour à l’autre.
Après avoir sélectionné une cellule quelconque de notre tableau, cliquons sur « Requêtes et connexions » dans l’onglet « Données » du ruban, puis sur « Table 0 » dans la partie droite ouverte dans le classeur :
L’ Editeur Power Query EXCEL s’ouvre .
-
- Commençons par supprimer les données indésirables : sélectionnons les colonnes « Rang » et « Détails » et cliquons sur l’icône « Supprimer les colonnes ».
Dans le cas où nous voudrions trier sur la colonne ‘Variation (24h)’ les choses seront plus complexes : cliquons sur l’entête ‘Variation (24h)’ et sélectionnons ‘tri décroissant’. Le résultat obtenu n’est pas celui attendu. Cela tient au fait que les données de cette colonne sont stockées sous format ‘Texte’ et non sous format ‘Numérique’.
Il nous faut alors avoir recours à la transformations de données et procéder en plusieurs étapes.
- Effaçons le signe « % » :
-
- Sélectionnons la commande « Remplacer les valeurs » :
Dans la fenêtre qui s’ouvre, saisissons le caractère ‘%’ dans le champ ‘Valeur à rechercher’ et laisson vide le champ ‘Remplacer par’ et cliquons sur ‘OK’ :
2. Remplaçons le séparateur décimal point ‘.’ par une virgule ‘, ‘
-
- Sélectionnons une nouvelle fois la commande « Remplacer les valeurs » :
3. Transformons les données de la colonne numérique décimal.
-
- Sélectionnons l’onglet ‘Transformer’ puis, dans la liste déroulante ‘Type de données’ choisissons ‘Nombre décimal’ :
4. Divisons les données par 100
-
- Dans l’onglet « Transformer», sélectionnons « Standard » puis dans la liste déroulante sur « Diviser ».
-
- Dans la fenêtre qui s’ouvre, indiquons la valeur ‘100’ et cliquons sur OK :
5. Sélectionnons l’onglet « Accueil » puis « Fermer et charger»:
Dans le feuille EXCEL, les données transformées se présentent ainsi :
Pour finaliser la présentation, cliquons sur la colonne ‘Variation (24h)’ puis, dans le volet « Accueil », partie « Nombre », choisissons « Pourcentage » :
Enfin, trions sur la colonne ‘Variation (24h)’ avec le chois ‘Trier du plus grand au plus petit‘ :
A l’issue des diverses transformations, nous obtenons le tableau suivant :