Perbezaan Antara KDD Dan Perlombongan Data

Perbezaan Antara KDD Dan Perlombongan Data
Perbezaan Antara KDD Dan Perlombongan Data

Video: Perbezaan Antara KDD Dan Perlombongan Data

Video: Perbezaan Antara KDD Dan Perlombongan Data
Video: SEJARAH PERLOMBONGAN BIJIH TIMAH DI TANAH MELAYU 2024, Mungkin
Anonim

Perlombongan data vs KDD

KDD (Penemuan Pengetahuan dalam Pangkalan Data) adalah bidang sains komputer, yang merangkumi alat dan teori untuk membantu manusia dalam mengekstrak maklumat yang berguna dan sebelumnya tidak diketahui (iaitu pengetahuan) dari koleksi besar data digital. KDD terdiri daripada beberapa langkah, dan Perlombongan Data adalah salah satu daripadanya. Perlombongan Data adalah penerapan algoritma tertentu untuk mengekstrak pola dari data. Walaupun begitu, KDD dan Data Mining digunakan secara bergantian.

Apa itu KDD?

Seperti yang disebutkan di atas, KDD adalah bidang sains komputer, yang berkaitan dengan pengambilan maklumat yang sebelumnya tidak diketahui dan menarik dari data mentah. KDD adalah keseluruhan proses untuk memahami data dengan mengembangkan kaedah atau teknik yang sesuai. Proses ini menangani pemetaan data tahap rendah ke bentuk lain yang lebih padat, abstrak dan berguna. Ini dicapai dengan membuat laporan pendek, memodelkan proses menghasilkan data dan mengembangkan model ramalan yang dapat meramalkan kes-kes yang akan datang. Oleh kerana pertumbuhan data yang eksponensial, terutama dalam bidang seperti bisnis, KDD telah menjadi proses yang sangat penting untuk mengubah kekayaan data yang besar ini menjadi kecerdasan perniagaan, kerana pengekstrakan pola secara manual telah menjadi mustahil dalam beberapa dekade terakhir. Sebagai contoh,kini digunakan untuk pelbagai aplikasi seperti analisis rangkaian sosial, pengesanan penipuan, sains, pelaburan, pembuatan, telekomunikasi, pembersihan data, sukan, pengambilan maklumat dan sebahagian besarnya untuk pemasaran. KDD biasanya digunakan untuk menjawab soalan seperti apa produk utama yang dapat membantu memperoleh keuntungan tinggi tahun depan di Wal-Mart ?. Proses ini mempunyai beberapa langkah. Ia dimulakan dengan mengembangkan pemahaman tentang domain aplikasi dan tujuan dan kemudian membuat set data sasaran. Ini diikuti dengan pembersihan, praprosesan, pengurangan dan unjuran data. Langkah seterusnya adalah menggunakan Data Mining (dijelaskan di bawah) untuk mengenal pasti corak. Akhirnya, pengetahuan yang ditemui disatukan dengan menggambarkan dan / atau menafsirkan.sukan, pencarian maklumat dan sebahagian besarnya untuk pemasaran. KDD biasanya digunakan untuk menjawab soalan seperti apa produk utama yang mungkin dapat memperoleh keuntungan yang tinggi tahun depan di Wal-Mart ?. Proses ini mempunyai beberapa langkah. Ini dimulakan dengan mengembangkan pemahaman tentang domain aplikasi dan tujuan dan kemudian membuat set data sasaran. Ini diikuti dengan pembersihan, praprosesan, pengurangan dan unjuran data. Langkah seterusnya adalah menggunakan Data Mining (dijelaskan di bawah) untuk mengenal pasti corak. Akhirnya, pengetahuan yang ditemui disatukan dengan menggambarkan dan / atau menafsirkan.sukan, pencarian maklumat dan sebahagian besarnya untuk pemasaran. KDD biasanya digunakan untuk menjawab soalan seperti apa produk utama yang dapat membantu memperoleh keuntungan tinggi tahun depan di Wal-Mart ?. Proses ini mempunyai beberapa langkah. Ia dimulakan dengan mengembangkan pemahaman tentang domain aplikasi dan tujuan dan kemudian membuat set data sasaran. Ini diikuti dengan pembersihan, praprosesan, pengurangan dan unjuran data. Langkah seterusnya adalah menggunakan Perlombongan Data (dijelaskan di bawah) untuk mengenal pasti corak. Akhirnya, pengetahuan yang ditemui disatukan dengan menggambarkan dan / atau menafsirkan. Ia dimulakan dengan mengembangkan pemahaman tentang domain aplikasi dan tujuan dan kemudian membuat set data sasaran. Ini diikuti dengan pembersihan, praprosesan, pengurangan dan unjuran data. Langkah seterusnya adalah menggunakan Data Mining (dijelaskan di bawah) untuk mengenal pasti corak. Akhirnya, pengetahuan yang ditemui disatukan dengan menggambarkan dan / atau menafsirkan. Ia dimulakan dengan mengembangkan pemahaman tentang domain aplikasi dan tujuan dan kemudian membuat set data sasaran. Ini diikuti dengan pembersihan, praprosesan, pengurangan dan unjuran data. Langkah seterusnya adalah menggunakan Data Mining (dijelaskan di bawah) untuk mengenal pasti corak. Akhirnya, pengetahuan yang ditemui disatukan dengan menggambarkan dan / atau menafsirkan.

Apakah Perlombongan Data?

Seperti disebutkan di atas, Perlombongan Data hanyalah satu langkah dalam keseluruhan proses KDD. Terdapat dua tujuan Perlombongan Data utama seperti yang ditentukan oleh tujuan aplikasi, dan ia adalah pengesahan atau penemuan. Pengesahan adalah mengesahkan hipotesis pengguna mengenai data, sementara penemuan secara automatik mencari corak yang menarik. Terdapat empat tugas perlombongan data utama: pengelompokan, klasifikasi, regresi, dan pergaulan (ringkasan). Pengelompokan mengenal pasti kumpulan serupa dari data tidak berstruktur. Klasifikasi adalah peraturan pembelajaran yang dapat diterapkan pada data baru. Regresi adalah mencari fungsi dengan ralat minimum untuk memodelkan data. Dan pergaulan mencari hubungan antara pemboleh ubah. Kemudian, algoritma perlombongan data tertentu perlu dipilih. Bergantung pada tujuan, algoritma yang berbeza seperti regresi linear, regresi logistik,pokok keputusan dan Naïve Bayes boleh dipilih. Kemudian corak minat dalam satu atau lebih bentuk representasi dicari. Akhirnya, model dinilai sama ada menggunakan ketepatan ramalan atau kebolehfahaman.

Apakah perbezaan antara KDD dan perlombongan Data?

Walaupun, dua istilah KDD dan Data Mining banyak digunakan secara bergantian, mereka merujuk kepada dua konsep yang berkaitan namun sedikit berbeza. KDD adalah keseluruhan proses mengekstrak pengetahuan dari data sementara Data Mining adalah langkah dalam proses KDD, yang berkaitan dengan mengenal pasti pola dalam data. Dengan kata lain, Perlombongan Data hanya penerapan algoritma tertentu berdasarkan tujuan keseluruhan proses KDD.

Disyorkan: