Login

Data Mining vs Screen Scraping

Penambangan data bukan skrap layar. Saya tahu bahwa beberapa orang di ruangan itu mungkin tidak setuju dengan pernyataan itu, tetapi mereka sebenarnya dua konsep yang hampir sama sekali berbeda.

Singkatnya, Anda mungkin menyatakannya seperti ini: pengikisan layar memungkinkan Anda untuk mendapatkan informasi, di mana penambangan data memungkinkan Anda untuk menganalisis informasi. Itu penyederhanaan yang cukup besar, jadi saya akan sedikit menguraikan.

Istilah "skrap layar" berasal dari masa lalu terminal mainframe di mana orang bekerja pada komputer dengan layar hijau dan hitam yang hanya berisi teks. Menggaruk layar digunakan untuk mengekstraksi karakter dari layar sehingga mereka dapat dianalisis. Maju cepat ke dunia web saat ini, skrap layar sekarang paling umum merujuk pada penggalian informasi dari situs web. Yaitu, program komputer dapat "menjelajah" atau "laba-laba" melalui situs web, mengeluarkan data. Orang sering melakukan ini untuk membangun hal-hal seperti mesin belanja perbandingan, mengarsipkan halaman web, atau cukup mengunduh teks ke spreadsheet sehingga dapat disaring dan dianalisis.

Penambangan data, di sisi lain, didefinisikan oleh Wikipedia sebagai "praktik pencarian pola penyimpanan data yang besar secara otomatis." Dengan kata lain, Anda sudah memiliki data, dan kini Anda menganalisisnya untuk mempelajari hal-hal berguna tentangnya. Penambangan data sering melibatkan banyak algoritma kompleks berdasarkan metode statistik. Ini tidak ada hubungannya dengan bagaimana Anda mendapatkan data di tempat pertama. Dalam penggalian data, Anda hanya peduli menganalisis apa yang sudah ada di sana.

Kesulitannya adalah orang yang tidak tahu istilah "pengikisan layar" akan mencoba Google untuk apa pun yang mirip dengannya. Kami menyertakan sejumlah istilah ini di situs web kami untuk membantu orang-orang seperti itu; misalnya, kami membuat halaman yang berjudul Penambangan Data Teks, Pengumpulan Data Otomatis, Ekstraksi Data Situs Web, dan bahkan Situs Web Ripper (saya kira "pengikisan" adalah semacam "ripping"). Jadi ini menimbulkan sedikit masalah – kita tidak perlu ingin melanggengkan kesalahpahaman (mis., Screen-scraping = data mining), tetapi kita juga harus menggunakan terminologi yang benar-benar akan digunakan orang.

September 17, 2019

0 responses on "Data Mining vs Screen Scraping"

Leave a Message

Your email address will not be published.

top
Template Design © VibeThemes. All rights reserved.
X
Skip to toolbar