TUTO EXCELLONS : CAPTURONS et TRANSFORMONS les données du WEB

De plus de plus de données sont accessibles à partir de pages WEB.

Grâce à ce tutoriel capturons et transformons les données du WEB avec un minimum d’effort.

(Les copies-écrans du présent document sont issues d’EXCEL version 365)

QUELLES DONNEES WEB SONT RECUPERABLES DANS EXCEL ?

Avant de nous lancer dans la récupération de données capturées sur le WEB, nous devons nous assurer que ces données sont récupérables dans EXCEL.

D’une façon générale nous pourrons récupérer les données d’une page WEB se présentant sous la forme d’un tableau.

Pour nous en assurer, il suffit de nous rendre sur la page WEB visée, de copier le tableau de données voulu (ctrl+C) et le coller dans une feuille EXCEL vierge (ctrl+V).

Si, après cette opération, nous obtenons les données en colonnes avec entêtes dans EXCEL nous avons de bonnes chances de pouvoir utiliser avec succès les fonctions de récupération de données.

Site cours Crypto-monnaies
Pour ce tutoriel, nous nous proposons de récupérer les cours des crypto-monnaies (Bitcoin et autres…) à une fréquence quotidienne. Pour ce faire, nous utiliserons le site courscryptomonnaies.com  pour récupérer les données qu’il expose.

Pour simplifier, le site WEB utilisé se trouve en accès libre (accès anonyme). Il est tout à fait possible de récupérer également des données sur des pages WEB réclamant une connexion explicite « Code Utilisateur/Mot de passe ». Ce tutoriel ne détaille pas les étapes à suivre pour ce type de connexion (si besoin, se reporter à la page https://learn.microsoft.com/fr-fr/power-query/connector-authentication)

CREONS UN LIEN AVEC LE SITE WEB

Ouvrons un nouveau classeur EXCEL et dans l’onglet « Données » du ruban, cliquons sur l’icône ‘A partir du WEB’ :

Etablir avec lien avec le site WEB

Dans la fenêtre qui s’ouvre, indiquons l’adresse (l’URL) du site WEB désiré :

URL Site Cours Crypto

Cliquons sur OK.

Le formulaire « Navigateur » s’ouvre. Sélectionnons « Table » dans sa partie gauche :

Navigateur Site WEB

Dans sa partie droite du formulaire « Navigateur » affiche un aperçu des données voulues puis, dans le bas du formulaire, sélectionnons « Charger dans… » de la liste déroulante :

Charger Dans

Dans le fenêtre « Importation des données », choisissons « Insérer les données dans » la feuille existante en $A$1 puis cliquons ur OK :

Importation des Données

Après le temps nécessaire pour le chargement des données, nous obtenons le tableau suivant dans le feuille EXCEL :

Resultat Importation

PROGRAMMONS L’ ACTUALISATION DES DONNEES

 

Dans le ruban, après avoir sélectionné une cellule quelconque du tableau obtenu, cliquons la liste déroulante ‘Actualiser tout’ et choisissons ‘Propriétés de connexion… ‘ :

Proprietes de la Connexion

Dans le formulaire « Propriétés de la requête » sélectionnons :

  • Activer l’actualisation en arrière-plan
  • Actualiser toutes les 360 minutes (6 heures) ou indiquer une autre périodicité
  • Actualiser les données lors de l’ouverture du fichier.
Mise à jour des Proprietes

PERSONNALISONS LES DONNÉES RECUPÉRÉES

Maintenant que nos données sont récupérées, nous aimerions bien améliorer leur présentation :

  • Nous voulons supprimer la première colonne (« Rang ») et la dernière colonne (« Détail ») sans intérêt pour nous.
  • Nous voulons trier les cours sur la colonne « Variation (24h) » en ordre décroissant pour obtenir le hit-parade des crypto-monnaies relativement à leur variation d’un jour à l’autre.

Après avoir sélectionné une cellule quelconque de notre tableau, cliquons sur « Requêtes et connexions » dans l’onglet « Données » du ruban, puis sur « Table 0 » dans la partie droite ouverte dans le classeur :

Activer l'Editeur Power Query

L’ Editeur Power Query EXCEL s’ouvre .

    • Commençons par supprimer les données indésirables : sélectionnons les colonnes « Rang » et « Détails » et cliquons sur l’icône « Supprimer les colonnes ».
Editeur Power Query

Dans le cas où nous voudrions trier sur la colonne ‘Variation (24h)’ les choses seront plus complexes : cliquons sur l’entête ‘Variation (24h)’ et sélectionnons ‘tri décroissant’. Le résultat obtenu n’est pas celui attendu. Cela tient au fait que les données de cette colonne sont stockées sous format ‘Texte’ et non sous format ‘Numérique’.

Il nous faut alors avoir recours à la transformations de données et procéder en plusieurs étapes. 

  1. Effaçons le signe « % » :
    • Sélectionnons la commande « Remplacer les valeurs » :
Remplacer Valeurs

Dans la fenêtre qui s’ouvre, saisissons le caractère ‘%’ dans le champ ‘Valeur à rechercher’ et laisson vide le champ ‘Remplacer par’ et cliquons sur ‘OK’ :

Remplacer Valeurs

2. Remplaçons le séparateur décimal point ‘.’ par une virgule ‘, ‘

    • Sélectionnons une nouvelle fois la commande « Remplacer les valeurs » :
Remplacer Valeurs

3. Transformons les données de la colonne numérique décimal.

    • Sélectionnons l’onglet ‘Transformer’ puis, dans la liste déroulante ‘Type de données’ choisissons ‘Nombre décimal’ :
Transformer Decimal

4. Divisons les données par 100

    • Dans l’onglet « Transformer», sélectionnons « Standard » puis dans la liste déroulante sur « Diviser ».
Activer Diviser

 

    • Dans la fenêtre qui s’ouvre, indiquons la valeur ‘100’ et cliquons sur OK :
Diviser colonne Par 100

5. Sélectionnons l’onglet « Accueil » puis « Fermer et charger»:

Résultat Transformations

Dans le feuille EXCEL, les données transformées se présentent ainsi :

Résultats Excel

Pour finaliser la présentation, cliquons sur la colonne ‘Variation (24h)’ puis, dans le volet « Accueil », partie   « Nombre », choisissons « Pourcentage » :

Mise en forme Pourcentage

Enfin, trions sur la colonne ‘Variation (24h)’ avec le chois ‘Trier du plus grand au plus petit‘ :

Trier Descendant

A l’issue des diverses transformations, nous obtenons le tableau suivant :

Resultat Final

Q