Come eseguire lo scraping con Excel?

Autore :

Reagire :

Commento

Sapevate che era possibile fare scraping del web con Excel? Grazie a Power Query e VBA, è possibile importare, strutturare e aggiornare i dati senza ricorrere a strumenti complessi.

È assolutamente possibile estrarre dati dal web su Excel.
È possibile estrarre dati dal web su Excel. ©Christina per Alucare.fr

Come estrarre i dati da una pagina web in Excel con Power Query?

✅ Power Query è uno strumento integrato in Excel. Serve per importare, trasformare e analizzare i dati. Con esso è possibile:

  • 🔥 Recuperare dati dal web, da un file, da un database, ecc.
  • 🔥 Pulire o trasformare questi dati.
  • 🔥 Caricare automaticamente i dati.

Questo è il metodo più semplice per eseguire lo scraping con Excel. Scopri i passaggi da seguire.

Passaggio 1: Accedere allo strumento di importazione

In Excel, vai su Données > Ottenere dati > Dal web.

Aprire un nuovo foglio Excel, andare su "Dati", poi "Ottieni dati", quindi "Dal web".
Aprire un nuovo foglio Excel, andare su “Dati”, poi “Ottieni dati”, quindi “Dal web”. ©Christina per Alucare.fr

Passaggio 2: incollare l'URL della pagina web

Incolla l'indirizzo del sito o della pagina contenente i dati che desideri estrarre.

Incolla l'indirizzo del sito o della pagina di destinazione.
Incolla l'indirizzo del sito o della pagina di destinazione. ©Christina per Alucare.fr

Fase 3: Navigare nel “Browser”

Si aprirà una finestra con le tabelle rilevate. Selezionare la tabella o i dati pertinenti. Esempio: una tabella HTML.

Selezionare la tabella o i dati.
Selezionare la tabella o i dati. ©Christina per Alucare.fr

Fase 4: Caricare i dati in un foglio Excel

Clicca su Caricare per importare direttamente i dati nel foglio Excel.

Caricare per importare i dati.
Caricare per importare i dati. ©Christina per Alucare.fr

💡 Per recuperare le ultime informazioni dal sito web, aggiorna i dati. Fai clic con il tasto destro del mouse sulla tabella > Aggiornare.

Come eseguire lo scraping con VBA e le macro di Excel?

✅ VBA Dove Visual Basic for Applications è un linguaggio di programmazione integrato in Excel e in altri software Microsoft Office. Serve a:

  • 🔥 Automatizzare le attività ripetitive.
  • 🔥 Creare macro, ovvero piccoli programmi che vengono eseguiti in Excel.
  • 🔥 Aprire una pagina web, recuperare testo o tabelle e incollarli direttamente in Excel.

Sebbene più complesso, VBA offre un controllo avanzato : navigazione tra le pagine, connessione con autenticazione, estrazione di dati dinamici, ecc.

Ecco un esempio di macro che recupera una tabella HTML da una pagina:

Sub ScraperTableau() ' Dichiarazione degli oggetti Dim http As Object, html As Object Dim tableau As Object, ligne As Object, cellule As Object Dim i As Long, j As Long

    ' URL della pagina da scrappare Dim url As String url = "https://www.w3schools.com/html/html_tables.asp" ' Creazione di un oggetto HTTP Set http = CreateObject("MSXML2.XMLHTTP") http.Open "GET", url, False
    http.Send ' Carica il contenuto HTML Set html = CreateObject("HTMLFile") html.body.innerHTML = http.responseText ' Seleziona la prima tabella trovata Set tabella = html.getElementsByTagName("table")(0) ' Ciclo su righe e colonne
    For i = 0 To tableau.Rows.Length - 1 For j = 0 To tableau.Rows(i).Cells.Length - 1 Cells(i + 1, j + 1).Value = tableau.Rows(i).Cells(j).innerText Next j Next i End Sub

👉 Spiegazione del codice: 

  • Dim http As Object, html As Object : Creazione di oggetti per gestire la richiesta web e il contenuto HTML.
  • url = "..." : URL del sito da sottoporre a scraping.
  • http.Open "GET", url, False : Invio di una richiesta HTTP per caricare la pagina.
  • html.body.innerHTML = http.responseText : Si inserisce la risposta HTML in un oggetto manipolabile.
  • Set tabella = html.getElementsByTagName("table")(0) : Ci concentriamo sul primo quadro della pagina
  • Doppio anello Per i … Per j … : Si legge ogni cella della tabella e la si incolla in Excel (cella corrispondente).

👉 Casi d'uso di VBA per lo scraping

  • Pagine che richiedono l'autenticazione (login/password).
  • Pagine dinamiches dove Power Query non funziona.
  • Recuperare più tabelle della stessa pagina o navigare tra più pagine.
  • Automazione : programmare l'aggiornamento quotidiano dei dati con un pulsante o un trigger.

Power Query vs. VBA: quale metodo scegliere per lo scraping con Excel?

La scelta tra Power Query e VBA sarà effettuata in base alle vostre esigenze. Ecco un piccolo confronto per scegliere il metodo più adatto.

Criteri Power Query VBA
Facilità d'uso Molto semplice Complesso, richiede codice
Flessibilità Limitato ai dati tabulari Molto flessibile, controllo totale
Curva di apprendimento Debole Alto
Casi d'uso Estrazione rapida di tabelle HTML Pagine complesse, autenticazione,
automazione avanzata

➡ In sostanza, Power Query è perfetto per i principianti e per la maggior parte delle attività di base, mentre VBA è destinato agli utenti avanzati con esigenze specifiche.

Quali sono le alternative a Excel per il web scraping?

Excel è pratico, ma limitato. Per progetti più ambiziosi esistono alternative più potenti.

Strumenti No-code/Low-code

Consentono di estrarre dati dal web senza scrivere codice. Citiamo :

  • Dati luminosi : una soluzione professionale, potente e scalabile.
  • Octoparse : facile da usare, con un'interfaccia visiva semplice, perfetto per i principianti.
Bright è un'infrastruttura dati web illimitata per l'IA e la BI.
Bright è un'infrastruttura dati web illimitata per l'IA e la BI. ©Christina per Alucare.fr

Linguaggi di programmazione

Consentono di scraper siti web in modo molto flessibile. È possibile navigare automaticamente su più pagine, gestire siti con autenticazione, ecc.

Se cercate una soluzione potente, ideale per progetti complessi, scegliete il scraping del web con Python.

👉 Vediamo in breve quali soluzioni superano Excel in termini di potenza, flessibilità e semplicità.

Strumento/Linguaggio Costo Complessità Potere
Excel (Power Query) Dipende dal pacchetto Office Facile Di base
Excel (VBA) Gratuito (con licenza Office) Significare Significare
Dati luminosi Abbonamento mensile Significare Molto elevata
Octoparse Abbonamento mensile Facile Significare
Python (BeautifulSoup, Scrapy) Gratuito Alto Molto elevata

Quali strumenti e risorse possono aiutare a eseguire lo scraping con Excel?

Se desiderate approfondire lo scraping con Excel, potete combinarlo con altri strumenti come i biblioteche e il estensioni del browser.

Per esempio :

Il web scraping è legale?

il Il web scraping è legale a determinate condizioni. Tutto dipende dal rispetto delle condizioni generali di utilizzo del sito, dalla proprietà intellettuale e dall'uso dei dati.

💬 Per concludere, lo scraping con Excel è possibile e accessibile, soprattutto con Power Query. Per esigenze più complesse, VBA offre un controllo avanzato, ma altri strumenti come Dati luminosi Dove Pitone sono talvolta più adatti.

Vi piace? Condividetelo!

Questo contenuto è originariamente in francese (Vedere l'editor appena sotto). È stato tradotto e corretto in varie lingue utilizzando Deepl e/o l'API di Google Translate per offrire aiuto al maggior numero possibile di Paesi. Questa traduzione ci costa diverse migliaia di euro al mese. Se non è 100 % perfetta, lasciateci un commento in modo da poterla correggere. Se sei interessato a correggere e migliorare la qualità degli articoli tradotti, inviaci un'e-mail tramite il modulo di contatto!
Apprezziamo il vostro feedback per migliorare i nostri contenuti. Se desiderate suggerire miglioramenti, utilizzate il nostro modulo di contatto o lasciate un commento qui sotto. I vostri commenti ci aiutano sempre a migliorare la qualità del nostro sito Alucare.fr


Alucare è un media indipendente. Sosteneteci aggiungendoci ai preferiti di Google News:

Pubblicare un commento sul forum di discussione