Login

Penambangan Data vs Scraping Layar

Penambangan data tidak menggores layar. Saya tahu bahwa beberapa orang di ruangan itu mungkin tidak setuju dengan pernyataan itu, tetapi mereka sebenarnya dua konsep yang hampir sama sekali berbeda.

Singkatnya, Anda mungkin menyatakannya seperti ini: pengikisan layar memungkinkan Anda untuk mendapatkan informasi, di mana penambangan data memungkinkan Anda untuk menganalisis informasi. Itu penyederhanaan yang cukup besar, jadi saya akan menguraikan sedikit.

Istilah "skrap layar" berasal dari masa lalu terminal mainframe di mana orang bekerja pada komputer dengan layar hijau dan hitam yang hanya berisi teks. Menggaruk layar digunakan untuk mengekstraksi karakter dari layar sehingga mereka dapat dianalisis. Maju cepat ke dunia web saat ini, skrap layar sekarang paling umum merujuk pada penggalian informasi dari situs web. Yaitu, program komputer dapat "menjelajah" atau "laba-laba" melalui situs web, mengeluarkan data. Orang sering melakukan ini untuk membangun hal-hal seperti mesin belanja perbandingan, mengarsipkan halaman web, atau cukup mengunduh teks ke spreadsheet sehingga dapat disaring dan dianalisis.

Penambangan data, di sisi lain, didefinisikan oleh Wikipedia sebagai "praktik pencarian pola penyimpanan data yang besar secara otomatis." Dengan kata lain, Anda sudah memiliki data, dan sekarang Anda menganalisisnya untuk mempelajari hal-hal yang berguna tentangnya. Penambangan data sering melibatkan banyak algoritma kompleks berdasarkan metode statistik. Ini tidak ada hubungannya dengan bagaimana Anda mendapatkan data di tempat pertama. Dalam penggalian data, Anda hanya peduli menganalisis apa yang sudah ada.

Kesulitannya adalah orang-orang yang tidak tahu istilah "screen-scraping" akan mencoba Google untuk apa pun yang mirip dengannya. Kami menyertakan sejumlah istilah ini di situs web kami untuk membantu orang-orang seperti itu; misalnya, kami membuat halaman yang berjudul Penambangan Data Teks, Pengumpulan Data Otomatis, Ekstraksi Data Situs Web, dan bahkan Situs Web Ripper (saya kira "pengikisan" adalah semacam "ripping"). Jadi ini menghadirkan sedikit masalah – kita tidak perlu ingin melanggengkan kesalahpahaman (mis., Screen-scraping = data mining), tetapi kita juga harus menggunakan terminologi yang akan digunakan orang.

October 21, 2019

0 responses on "Penambangan Data vs Scraping Layar"

Leave a Message

Your email address will not be published.

top
Template Design © VibeThemes. All rights reserved.
X
Skip to toolbar