Bagaimana cara melakukan scraping dengan Excel?

Penulis :

Bereaksi :

Komentar

Tahukah Anda bahwa Anda bisa melakukan pengikisan web Dengan Excel? Berkat Power Query dan VBAAnda dapat mengimpor, mengorganisir, dan memperbarui data tanpa perlu menggunakan alat yang rumit.

Sangat mungkin untuk mengekstrak data dari web ke Excel.
Sangat mungkin untuk mengekstrak data dari web ke Excel. ©Christina untuk Alucare.fr

Bagaimana cara mengekstrak data dari halaman web ke Excel menggunakan Power Query?

✅ Power Query adalah alat yang terintegrasi dengan Excel. Alat ini digunakan untuk mengimpor, mengubah, dan menganalisis data. Dengan alat ini, Anda dapat:

  • 🔥 Mengambil data dari web, file, database, dll.
  • 🔥 Membersihkan atau mengubah data tersebut.
  • 🔥 Memuat data secara otomatis.

Ini adalah metode paling sederhana untuk melakukan scraping dengan Excel. Ikuti langkah-langkah berikut.

Langkah 1: Akses alat impor

Di Excel, buka Données > Mendapatkan data > Dari web.

Buka lembar Excel baru, pilih "Data", lalu "Dapatkan Data", kemudian "Dari Web".
Buka lembar Excel baru, pergi ke "Data", lalu "Dapatkan Data", kemudian "Dari Web". ©Christina untuk Alucare.fr

Langkah 2: Tempelkan URL halaman web

Tempelkan alamat situs web atau halaman yang berisi data yang ingin Anda ekstrak.

Tempelkan alamat situs atau halaman tujuan.
Tempelkan alamat situs web atau halaman tujuan. ©Christina untuk Alucare.fr

Langkah 3: Menavigasi di "Browser"

Sebuah jendela akan terbuka dengan tabel yang terdeteksi. Pilih tabel atau data yang relevan. Contoh: tabel HTML.

Pilih tabel atau data.
Pilih tabel atau data. ©Christina untuk Alucare.fr

Langkah 4: Memuat data ke dalam lembar Excel

Klik Muat untuk mengimpor data secara langsung ke lembar Excel Anda.

Muat untuk mengimpor data.
Muat untuk mengimpor data. ©Christina untuk Alucare.fr

💡 Untuk mendapatkan informasi terbaru dari situs web, perbarui data. Klik kanan pada tabel Anda > Perbarui.

Bagaimana cara melakukan scraping dengan VBA dan makro Excel?

✅ VBA Di mana Visual Basic for Applications adalah bahasa pemrograman yang terintegrasi dengan Excel dan perangkat lunak Microsoft Office lainnya. Digunakan untuk:

  • 🔥 Otomatisasi tugas-tugas berulang.
  • 🔥 Membuat makro, yaitu program kecil yang dijalankan di Excel.
  • 🔥 Buka halaman web, salin teks atau tabel, dan tempelkan langsung ke Excel.

Meskipun lebih kompleks, VBA menawarkan sebuah kontrol lanjutan : navigasi antar halaman, login dengan otentikasi, ekstraksi data dinamis, dll.

Berikut adalah contoh makro yang mengambil tabel HTML dari sebuah halaman:

Sub ScraperTableau() ' Deklarasi objek Dim http As Object, html As Object Dim tableau As Object, ligne As Object, cellule As Object Dim i As Long, j As Long

    ' URL halaman yang akan discrape Dim url As String url = "https://www.w3schools.com/html/html_tables.asp" ' Pembuatan objek HTTP Set http = CreateObject("MSXML2.XMLHTTP") http.Open "GET", url, False
    http.Send ' Memuat konten HTML Set html = CreateObject("HTMLFile") html.body.innerHTML = http.responseText ' Memilih tabel pertama yang ditemukan Set tableau = html.getElementsByTagName("table")(0) ' Loop pada baris dan kolom
    For i = 0 To tabel.Baris.Panjang - 1 For j = 0 To tabel.Baris(i).Sel.Panjang - 1 Sel(i + 1, j + 1).Nilai = tabel.Baris(i).Sel(j).innerText Next j Next i End Sub

👉 Penjelasan kode: 

  • Dim http As Object, html As Object Pembuatan objek untuk mengelola permintaan web dan konten HTML.
  • url = "..." URL situs yang akan di-scrape.
  • http.Open "GET", url, False : Mengirimkan permintaan HTTP untuk memuat halaman.
  • html.body.innerHTML = http.responseText : Tanggapan HTML dimasukkan ke dalam objek yang dapat dimanipulasi.
  • Set tabel = html.getElementsByTagName("table")(0) : Kami menargetkan Tabel pertama dari halaman
  • Ganda Untuk i … Untuk j … : Setiap sel pada tabel dibaca dan disalin ke Excel (sel yang sesuai).

👉 Kasus penggunaan VBA untuk scraping

  • Halaman yang memerlukan otentikasi (login/kata sandi).
  • Halaman dinamiss di mana Power Query tidak berfungsi.
  • Mengambil beberapa tabel dari halaman yang sama atau menavigasi antara beberapa halaman.
  • Otomatisasi : Jadwalkan pembaruan data harian dengan tombol atau pemicu.

Power Query vs. VBA: Metode mana yang sebaiknya dipilih untuk melakukan scraping dengan Excel?

Pilihan antara Power Query dan VBA akan disesuaikan dengan kebutuhan Anda. Berikut ini adalah perbandingan singkat untuk memilih metode yang paling sesuai.

Kriteria Power Query VBA
Kemudahan penggunaan Sangat sederhana Kompleks, memerlukan kode
Fleksibilitas Terbatas pada data tabel Sangat fleksibel, kontrol penuh
Kurva pembelajaran Rendah Tinggi
Kasus penggunaan Ekstraksi cepat tabel HTML Halaman kompleks, otentikasi,
otomatisasi canggih

➡ Secara umum, Power Query sangat cocok untuk pemula dan sebagian besar tugas dasar, sedangkan VBA Ditujukan untuk pengguna tingkat lanjut yang memiliki kebutuhan khusus.

Apa saja alternatif Excel untuk web scraping?

Excel praktis, tetapi terbatas. Untuk proyek yang lebih ambisius, ada alternatif yang lebih kuat.

Alat Tanpa Kode/Kode Rendah

Mereka memungkinkan untuk mengekstrak data web. tanpa menulis kode. Kami mengutip:

  • Data Cerah : solusi profesional, kuat, dan skalabel.
  • Octoparse : Mudah digunakan, dengan antarmuka visual yang sederhana, sempurna untuk pemula.
Bright adalah infrastruktur data web tak terbatas untuk kecerdasan buatan (AI) dan analitik bisnis (BI).
Bright adalah infrastruktur data web tak terbatas untuk kecerdasan buatan (AI) dan analitik bisnis (BI). ©Christina untuk Alucare.fr

Bahasa pemrograman

Mereka memungkinkan untuk menggores situs web dengan sangat fleksibel. Anda dapat menavigasi beberapa halaman secara otomatis, mengelola situs dengan otentikasi, dll.

Jika Anda mencari solusi yang kuat dan ideal untuk proyek-proyek kompleks, pilihlah scraping web dengan Python.

👉 Mari kita lihat sekilas solusi apa saja yang lebih unggul dari Excel dalam hal kekuatan, fleksibilitas, dan kemudahan penggunaan.

Alat/Bahasa Biaya Kompleksitas kuat
Excel (Power Query) Tergantung pada paket Office Mudah Dasar
Excel (VBA) Gratis (dengan lisensi Office) Berarti Berarti
Data Cerah Langganan bulanan Berarti Sangat tinggi
Octoparse Langganan bulanan Mudah Berarti
Python (BeautifulSoup, Scrapy) Gratis Tinggi Sangat tinggi

Apa saja alat dan sumber daya yang dapat membantu melakukan scraping dengan Excel?

Jika Anda ingin memperdalam teknik scraping dengan Excel, Anda dapat menggabungkannya dengan alat lain seperti... perpustakaan dan ekstensi browser.

Contohnya :

Apakah web scraping legal?

itu Web scraping adalah legal. dengan syarat tertentu. Semua tergantung pada kepatuhan terhadap Ketentuan Penggunaan Situs, hak kekayaan intelektual, dan penggunaan data.

💬 Untuk menyimpulkan, mengekstrak data dengan Excel adalah mungkin dan mudah dilakukan, terutama dengan Power QueryUntuk kebutuhan yang lebih kompleks, VBA menawarkan kontrol lanjutan, tetapi alat lain seperti Data Cerah Di mana Python kadang-kadang lebih sesuai.

Suka? Bagikan!

Konten ini aslinya adalah di Perancis (Lihat editor tepat di bawah). Buku ini telah diterjemahkan dan dikoreksi dalam berbagai bahasa menggunakan Deepl dan/atau Google Translate API untuk menawarkan bantuan di sebanyak mungkin negara. Penerjemahan ini menghabiskan biaya beberapa ribu euro per bulan. Jika terjemahan ini tidak 100 % sempurna, tinggalkan komentar agar kami dapat memperbaikinya. Jika Anda tertarik untuk mengoreksi dan meningkatkan kualitas artikel yang diterjemahkan, silakan kirim email kepada kami menggunakan formulir kontak!
Kami menghargai umpan balik Anda untuk meningkatkan konten kami. Jika Anda ingin memberikan saran perbaikan, silakan gunakan formulir kontak kami atau tinggalkan komentar di bawah ini. Komentar Anda selalu membantu kami meningkatkan kualitas situs web kami Alucare.fr


Alucare adalah media independen. Dukung kami dengan menambahkan kami ke favorit Google News Anda:

Kirimkan komentar di forum diskusi