Octoparse merupakan salah satu aplikasi untuk melakukan crawling data Google Scholar yang mudah digunakan. Berikut hal-hal yang harus dilakukan untuk menggunakan Octoparsee dalam crawling data scholar:
Setelah berhasil diunduh, lakukan instalasi Octoparse
Jika instalasi sudah selesai, maka akan tampil halaman seperti gambar dibawah ini. Jika belum memiliki akun, lakukan sign in untuk memiliki akun
Setelah memiliki akun dan melakukan login, maka akan tampil halaman seperti ini
Memulai Crawling Data Scholar
Klik tombol New, kemudian klik Advanced Mode.
Pilih akun Google Scholar. Kemudian, copy link akun scholar yang akan di crawling.
Paste link yang telah dicopy pada bagian berikut. Kemudian klik save
Setelah klik tombol save, maka akan muncul tampilan seperti gambar dibawah ini
Klik Create Workflow, kemudian pilih data mana saja yang akan dicrawling
Data pertama yang akan dicrawling adalah judul artikel dari akun Scholar. Klik judul Artikel. Kemudian, klik select all. Setelah klik select all, klik extract text of the selected link
Selanjutnya, pilih data cited by. Lakukan hal yang sama dengan saat kita memilih judul artikel, yaitu klik select all, kemudian klik extract text of the selected link.
Selanjutnya, cari judul artikel yang memiliki tanda bintang pada angka sitasi nya
Klik pada div htm, bukan pada text tahun
Setelah klik div htm, klik tanda bintang pada angka sitasi
Klik select all, kemudian extract data
Selanjutnya, pilih judul artikel yang duplikat atau yang terdapat tanda coret pada angka sitasi nya. kemudian klik select all, lalu extract outer HTML. Jika tidak ditemukan judul artikel yang duplikat atau tanda coret pada angka sitasi, kamu dapat melewati step ini
Langkah terakhir, scroll browser viewer pada octoparse hingga terlihat text show more
Klik tombol show more, kemudian klik Loop Single Button
Ubah nama field pada tabel dibawah browser viewer. Field1_text menjadi Judul, Field2_text menjadi jmlhSitasi, Field3 menjadi Tahun, Field4_text menjadi Bintang.
Jika sudah selesai, maka workflow akan menjadi seperti gambar dibawah ini. Klik tombol save untuk menyimpan file ini
Untuk memulai proses crawling, klik tombol Run, kemudian pilih Run task on your device untuk menyimpan data dikomputer Anda. Klik tombol Stop untuk menghentikan proses crawling.
Klik tombol extract data untuk mengekstrak data hasil crawling, kemudian pilih format penyimpanan data. Lalu klik tombol ok
Pilih tempat menyimpan hasil crawling, kemudian klik Save.
Klik Open file untuk melihat hasil dari data yang dicrawling Demikian penjelasan mengenai Crawling Google Scholar. Semoga bermanfaat. Terima kasih
Discover more from FAQ Telkom University
Subscribe now to keep reading and get access to the full archive.