Melakukan Crawling Google Scholar Menggunakan Octoparse

Octoparse merupakan salah satu aplikasi untuk melakukan crawling data Google Scholar yang mudah digunakan. Berikut hal-hal yang harus dilakukan untuk menggunakan Octoparsee dalam crawling data scholar:

Instalasi Octoparse

  1. Buka https://www.octoparse.com/download/windows untuk pengguna Windows atau https://www.octoparse.com/download/mac untuk pengguna Mac OS pada browser
  2. Pilih versi Octoparse yang ingin diunduh
  3. Setelah berhasil diunduh, lakukan instalasi Octoparse
  4. Jika instalasi sudah selesai, maka akan tampil halaman seperti gambar dibawah ini. Jika belum memiliki akun, lakukan sign in untuk memiliki akun
    Instalasi 4
  5. Setelah memiliki akun dan melakukan login, maka akan tampil halaman seperti ini

Instalasi Octaparse

Memulai Crawling Data Scholar

  1. Klik tombol New, kemudian klik Advanced Mode.
    Crawling
  2. Pilih akun Google Scholar. Kemudian, copy link akun scholar yang akan di crawling.
    Crawling 2
  3. Paste link yang telah dicopy pada bagian berikut. Kemudian klik save
    Crawling 3
  4. Setelah klik tombol save, maka akan muncul tampilan seperti gambar dibawah ini
    Crawling 4 1
  5. Klik Create Workflow, kemudian pilih data mana saja yang akan dicrawling
    Crawling 5 2
  6. Data pertama yang akan dicrawling adalah judul artikel dari akun Scholar. Klik judul Artikel. Kemudian, klik select all. Setelah klik select all, klik extract text of the selected link

Crawling 6Crawling 6 1

  1. Selanjutnya, pilih data cited by. Lakukan hal yang sama dengan saat kita memilih judul artikel, yaitu klik select all, kemudian klik extract text of the selected link.

Crawling 7

  1. Selanjutnya, cari judul artikel yang memiliki tanda bintang pada angka sitasi nya

Crawling 8

  1. Klik pada div htm, bukan pada text tahun
    Crawling 9
  2. Setelah klik div htm, klik tanda bintang pada angka sitasi
    Crawling 10
  3. Klik select all, kemudian extract data
    Crawling 11Crawling 11 1
  4. Selanjutnya, pilih judul artikel yang duplikat atau yang terdapat tanda coret pada angka sitasi nya. kemudian klik select all, lalu extract outer HTML. Jika tidak ditemukan judul artikel yang duplikat atau tanda coret pada angka sitasi, kamu dapat melewati step ini
  5. Langkah terakhir, scroll browser viewer pada octoparse hingga terlihat text show more

Crawling 13

  1. Klik tombol show more, kemudian klik Loop Single Button

Crawling 14

  1. Ubah nama field pada tabel dibawah browser viewer. Field1_text menjadi Judul, Field2_text menjadi jmlhSitasi, Field3 menjadi Tahun, Field4_text menjadi Bintang.

Crawling 15

  1. Jika sudah selesai, maka workflow akan menjadi seperti gambar dibawah ini. Klik tombol save untuk menyimpan file ini

Crawling 16

  1. Untuk memulai proses crawling, klik tombol Run, kemudian pilih Run task on your device untuk menyimpan data dikomputer Anda. Klik tombol Stop untuk menghentikan proses crawling.

Crawling 17Crawling 17 1

  1. Klik tombol extract data untuk mengekstrak data hasil crawling, kemudian pilih format penyimpanan data. Lalu klik tombol ok
    Crawling 18Crawling 18 1
  2. Pilih tempat menyimpan hasil crawling, kemudian klik Save.

Crawling 19

  1. Klik Open file untuk melihat hasil dari data yang dicrawling
    Crawling 20Crawling 20 1Demikian penjelasan mengenai Crawling Google Scholar. Semoga bermanfaat. Terima kasih

Was this helpful?