Comment scraper avec Excel ?

作者 :

反应 :

评论

Saviez-vous qu’il était possible de faire du 网络搜刮 avec Excel ? Grâce à Power QueryVBA, vous pouvez importer, structurer et actualiser des données sans avoir recours à des outils complexes.

Il est tout à fait possible d'extraire des données du web sur Excel.
Il est tout à fait possible d’extraire des données du web sur Excel. ©Christina pour Alucare.fr

Comment scraper une page web vers Excel avec Power Query ?

✅ Power Query est un outil intégré à Excel. Il sert à importer, à transformer et à analyser des données. Avec lui, vous pouvez :

  • 🔥 Récupérer des données depuis le web, un fichier, une base de données, etc.
  • 🔥 Nettoyer ou transformer ces données.
  • 🔥 Charger automatiquement les données.

C’est la méthode la plus simple pour scraper avec Excel. Découvrez les étapes à suivre.

Étape 1 : Accéder à l’outil d’import

Dans Excel, allez dans Données > Obtenir des données > À partir du web.

Ouvrir une nouvelle feuille Excel, aller dans "Données", puis "Obtenir des données", ensuite "A partir du web".
Ouvrir une nouvelle feuille Excel, aller dans “Données”, puis “Obtenir des données”, ensuite “A partir du web”. ©Christina pour Alucare.fr

Étape 2 : Coller l’URL de la page web

Collez l’adresse du site ou de la page contenant les données que vous souhaitez extraire.

Coller l'adresse du site ou de la page cible.
Coller l’adresse du site ou de la page cible. ©Christina pour Alucare.fr

Étape 3 : Naviguer dans le “Navigateur”

Une fenêtre s’ouvre avec les tables détectées. Sélectionnez la table ou les données pertinentes. Exemple : un tableau HTML.

Sélectionner le tableau ou les données.
Sélectionner le tableau ou les données. ©Christina pour Alucare.fr

Étape 4 : Charger les données dans une feuille Excel

点击 Charger pour importer directement les données dans votre feuille Excel.

Charger pour importer les données.
Charger pour importer les données. ©Christina pour Alucare.fr

💡 Pour récupérer les dernières informations du site web, actualisez les données. Faites un clic droit dans votre tableau > Actualiser.

Comment scraper avec VBA et les macros Excel ?

✅ VBA 在哪里 Visual Basic for Applications est un langage de programmation intégré à Excel et aux autres logiciels Microsoft Office. Il sert à :

  • 🔥 Automatiser des tâches répétitives.
  • 🔥 Créer des macros, c’est-à-dire des petits programmes qui s’exécutent dans Excel.
  • 🔥 Ouvrir une page web, récupérer du texte ou des tableaux et les coller directement dans Excel.

Bien que plus complexe, VBA offre un contrôle avancé : navigation entre pages, connexion avec authentification, extraction de données dynamiques, etc.

Voici un exemple de macro qui récupère un tableau HTML depuis une page :

Sub ScraperTableau()

    ' Déclaration des objets
    Dim http As Object, html As Object
    Dim tableau As Object, ligne As Object, cellule As Object
    Dim i As Long, j As Long

    ' URL de la page à scraper
    Dim url As String
    url = "https://www.w3schools.com/html/html_tables.asp"
    
    ' Création d’un objet HTTP
    Set http = CreateObject("MSXML2.XMLHTTP")
    http.Open "GET", url, False
    http.Send

    ' Charger le contenu HTML
    Set html = CreateObject("HTMLFile")
    html.body.innerHTML = http.responseText

    ' Sélection du premier tableau trouvé
    Set tableau = html.getElementsByTagName("table")(0)

    ' Boucle sur les lignes et colonnes
    For i = 0 To tableau.Rows.Length - 1
        For j = 0 To tableau.Rows(i).Cells.Length - 1
            Cells(i + 1, j + 1).Value = tableau.Rows(i).Cells(j).innerText
        Next j
    Next i

End Sub

👉 Explication du code : 

  • Dim http As Object, html As Object : Création des objets pour gérer la requête web et le contenu HTML.
  • url = "..." : URL du site à scraper.
  • http.Open "GET", url, False : Envoi d’une requête HTTP pour charger la page.
  • html.body.innerHTML = http.responseText : On insère la réponse HTML dans un objet manipulable.
  • Set tableau = html.getElementsByTagName("table")(0) : On cible le premier tableau de la page
  • Double boucle For i … For j … : On lit chaque cellule du tableau et on la colle dans Excel (cellule correspondante).

👉 Cas d’usage de VBA pour le scraping

  • Pages nécessitant authentification (login/mot de passe).
  • Pages dynamiques où Power Query ne fonctionne pas.
  • Récupérer plusieurs tableaux d’une même page ou naviguer entre plusieurs pages.
  • Automatisation : programmer la mise à jour quotidienne des données avec un bouton ou un déclencheur.

Power Query vs. VBA : quelle méthode choisir pour scraper avec Excel ?

Le choix entre Power QueryVBA se fera en fonction de vos besoins. Voici un petit comparatif pour choisir la méthode la plus adaptée.

标准 Power Query VBA
Facilité d’usage Très simple Complexe, nécessite du code
灵活性 Limité aux données tabulaires Très flexible, contrôle total
Courbe d’apprentissage 虚弱的
Cas d’usage Extraction rapide de tableaux HTML Pages complexes, authentification,
automatisation avancée

➡ En gros, Power Query est parfait pour les débutants et la plupart des tâches de base, tandis que VBA est pour les utilisateurs avancés ayant des besoins spécifiques.

Quelles sont les alternatives à Excel pour le web scraping ?

Excel est pratique, mais limité. Pour des projets plus ambitieux, il existe des alternatives puissantes.

Outils No-code/Low-code

Ils permettent d’extraire des données web sans écrire de code.我们引述 :

  • 亮数据 : une solution professionnelle, puissante et scalable.
  • Octoparse : facile à utiliser, avec une interface visuelle simple, parfait pour les débutant.
Bright est une infrastructure de données web illimitée pour l'IA et la BI.
Bright est une infrastructure de données web illimitée pour l’IA et la BI. ©Christina pour Alucare.fr

Langages de programmation

Ils permettent de scraper des sites web de manière très flexible. Vous pouvez naviguer sur plusieurs pages automatiquement, gérer les sites avec authentification, etc.

Si vous cherchez une solution puissante, idéale pour les projets complexes, optez pour le 使用 Python 进行网络搜索.

👉 Voyons en un coup d’œil quelles solutions dépassent Excel en puissance, en flexibilité et en simplicité.

Outil/Langage 成本 Complexité 强大的
Excel (Power Query) Dépend du pack Office 简单的 基本的
Excel (VBA) Gratuit (avec une licence Office) 意思是 意思是
亮数据 每月订阅 意思是 Très élevée
Octoparse 每月订阅 简单的 意思是
Python (BeautifulSoup, Scrapy) 自由的 Très élevée

Quels outils et ressources peuvent aider à scraper avec Excel ?

Si vous souhaitez aller plus loin dans le scraping avec Excel, vous pouvez le combiner avec d’autres outils comme les 图书馆浏览器扩展.

例如 :

网络搜索合法吗?

web scraping est légal sous certaines conditions. Tout dépend du respect des CGU du site, de la propriété intellectuelle et de l’usage des données.

💬 Pour terminer, scraper avec Excel est possible et accessible, surtout avec Power Query. Pour des besoins plus poussés, le VBA offre un contrôle avancé, mais d’autres outils comme 亮数据 在哪里 Python sont parfois plus adaptés.

喜欢吗?分享它!

这些内容最初是 法语 (请参见下面的编辑器)。为了向尽可能多的国家提供帮助,我们使用 Deepl 和/或谷歌翻译 API 对该网站进行了多种语言的翻译和校对。我们每月的翻译费用高达数千欧元。如果它不是 100 % 完美,请给我们留言,以便我们进行修正。如果您对校对和提高翻译文章的质量感兴趣,请使用联系表格向我们发送电子邮件!
我们感谢您的反馈意见,以改进我们的内容。如果您想提出改进建议,请使用我们的联系表或在下面留言。 您的意见有助于我们提高网站质量 Alucare.fr


Alucare 是一家独立媒体。请将我们添加到您的谷歌新闻收藏夹,以支持我们:

在讨论区发表评论