Perlombongan Data vs OLAP
Kedua-dua perlombongan data dan OLAP adalah dua teknologi Business Intelligence (BI) biasa. Kepintaran perniagaan merujuk kepada kaedah berasaskan komputer untuk mengenal pasti dan mengekstrak maklumat berguna dari data perniagaan. Perlombongan data adalah bidang sains komputer yang berkaitan dengan pengambilan corak menarik dari kumpulan data yang besar. Ia menggabungkan banyak kaedah dari kepintaran buatan, statistik dan pengurusan pangkalan data. OLAP (pemprosesan analitik dalam talian) seperti namanya adalah penyusunan cara untuk bertanya pangkalan data pelbagai dimensi.
Perlombongan data juga dikenali sebagai Knowledge Discovery in data (KDD). Seperti yang disebutkan di atas, ini adalah bidang sains komputer, yang berkaitan dengan pengambilan maklumat yang sebelumnya tidak diketahui dan menarik dari data mentah. Oleh kerana pertumbuhan data yang eksponensial, terutama dalam bidang seperti bisnis, perlombongan data telah menjadi alat yang sangat penting untuk mengubah kekayaan data yang besar ini menjadi kecerdasan perniagaan, kerana pengekstrakan pola secara manual telah menjadi mustahil dalam beberapa dekad terakhir. Sebagai contoh, ia kini digunakan untuk pelbagai aplikasi seperti analisis rangkaian sosial, pengesanan penipuan dan pemasaran. Perlombongan data biasanya berkaitan dengan empat tugas berikut: pengelompokan, klasifikasi, regresi, dan pergaulan. Pengelompokan mengenal pasti kumpulan serupa dari data tidak berstruktur. Klasifikasi adalah peraturan pembelajaran yang dapat diterapkan pada data baru dan biasanya meliputi langkah-langkah berikut: memproses data, merancang pemodelan, pemilihan / pemilihan fitur dan penilaian / pengesahan. Regresi adalah mencari fungsi dengan ralat minimum untuk memodelkan data. Dan pergaulan mencari hubungan antara pemboleh ubah. Perlombongan data biasanya digunakan untuk menjawab soalan seperti produk utama apa yang dapat membantu memperoleh keuntungan tinggi tahun depan di Wal-Mart. Perlombongan data biasanya digunakan untuk menjawab soalan seperti apa produk utama yang dapat membantu memperoleh keuntungan tinggi tahun depan di Wal-Mart. Perlombongan data biasanya digunakan untuk menjawab soalan seperti produk utama apa yang dapat membantu memperoleh keuntungan tinggi tahun depan di Wal-Mart.
OLAP adalah kelas sistem, yang memberikan jawapan kepada pertanyaan pelbagai dimensi. Biasanya OLAP digunakan untuk pemasaran, penganggaran, ramalan dan aplikasi serupa. Sudah tentu, pangkalan data yang digunakan untuk OLAP dikonfigurasi untuk pertanyaan kompleks dan ad-hoc dengan mempertimbangkan prestasi yang cepat. Biasanya matriks digunakan untuk memaparkan output OLAP. Baris dan lajur dibentuk oleh dimensi pertanyaan. Mereka sering menggunakan kaedah penggabungan pada beberapa jadual untuk mendapatkan ringkasan. Sebagai contoh, ia boleh digunakan untuk mengetahui tentang penjualan tahun ini di Wal-Mart berbanding tahun lalu? Apakah ramalan penjualan pada suku berikutnya? Apa yang boleh dikatakan mengenai trend dengan melihat perubahan peratusan?
Walaupun jelas bahawa perlombongan data dan OLAP serupa kerana mereka beroperasi pada data untuk mendapatkan kecerdasan, perbezaan utama berasal dari bagaimana mereka beroperasi pada data. Alat OLAP menyediakan analisis data multidimensi dan mereka memberikan ringkasan data tetapi sebaliknya, perlombongan data memfokuskan pada nisbah, corak dan pengaruh dalam kumpulan data. Itu adalah kesepakatan OLAP dengan agregasi, yang bermuara pada pengoperasian data melalui "penambahan" tetapi penambangan data sesuai dengan "pembagian". Perbezaan penting lain adalah bahawa sementara alat perlombongan data memodelkan data dan mengembalikan peraturan yang dapat ditindaklanjuti, OLAP akan melakukan teknik perbandingan dan kontras sepanjang dimensi perniagaan dalam waktu nyata.