Semester 3 : Data Mining

  

ASSALAMMU'ALAIKUM WR. WB


          Data mining merupakan 2 kata yang berasal dari kata "data" dan "mining". Data merupakan sekumpulan informasi, fakta, serta pengetahuan bersifat real atau fakta. Sedangkan mining berarti memperoleh atau mengelola data yang telah dicari dan diproses menjadi pengetahuan. Data mining memiliki banyak sekali metode-metodenya adapun diantaranya klasifikasi, klastering, asosiasi, dan beberapa lainnya. 

          Contoh kecil penggunaan data mining dalam kehidupan perkuliahan adalah mendata kelas bagi mahasiswa. Dimana akan diperlukan nim dan nama dan akan digunakan untuk pengurutan absen dikelas tersebut. 


Komposisi Penilaian

Komponen Nilai

Nilai

Tugas/Quiz

30%

UTS

30%

UAS

30%

Presensi

10% 


 Pertemuan 0 dan kontrak belajar : Download

PERTEMUAN 1 - PENGANTAR


ASSALAMMU'ALAIKUM WR. WB

Apa kabar teman-teman semua? Semoga teman-teman diberi kesehatan selalu ya.. Pada pertemuan ke 1 ini kita akan membahas pengantar data mining.

Pada abad ke-21 ini data sudah terbuat dan/atau terkumpul dari berbagai sumber. Data terbuat terus dari detik ke detik dalam 24 jam dalam sehari. Pada tahun 2020 ini, diprediksi dihasilkan sekitar 35 zettabytes (10 bytes atau 1.000.000.000.000.000.000.000 bytes) dari seluruh dunia (IBM Cognitive Class-2, 2020). Fenomena ini menyebabkan "Ledakan Data", akan tetapi banyak yang tidak menyadari dari data-data tersebut kita dapat menggali informasi / memanfaatkan potensi dari suatu data, kita kaya akan data tetapi miskin informasi.

Data Mining merupakan Disiplin ilmu yang mempelajari metode untuk mengekstrak pengetahuan atau menemukan pola dari suatu data yang besar. Dengan contoh kasus yang dibahas pada pertemuan kali ini akan memberikan gambaran kepada teman-teman bagaimana data mining dapat memberikan kita informasi yang berguna sehingga dapat menjadi pendukung pengambilan keputusan.


Modul Pengantar Data Mining : Modul Pengantar Data Mining

Tugas Pertemuan 1 : Download

PERTEMUAN 2 - PERAN UTAMA DATA MINING

ASSALAMMU'ALAIKUM WR. WB

Hai teman-teman, kita bertemu kembali di pertemuan ke 2. Kali ini kita akan membahas tentang :

  1. Data untuk data mining
  2. Peran utama data mining
  3. Metode data mining
  4. Preprocessing data CRISP–DM


Tetap semangat mengikuti perkuliahan ya teman-teman


Modul Peran Utama Data Mining : Modul Peran Utama Data Mining

Tugas Pertemuan 2 : Download

PERTEMUAN 3 - PROCESSING DATA

 



Assalammu'alaikum wr. wb.

Hai teman-teman, kita bertemu kembali di pertemuan ke 3 yaa.. kali ini kita akan membahas Preprocessing Data. Preprocessing data sangat penting karena kesalahan, redundan, missing value, dan data yang tidak konsisten menyebabkan berkurangnya akurasi hasil analisis. Jadi, sebelum mengolah data, kita harus memastikan bahwa data yang akan kita gunakan merupakan data "bersih".


Modul Processing Data : Modul Processing Data

Tugas Pertemuan 3 : Download

PERTEMUAN 4 - METODE LEARNING

Assalammu'alaikum wr. wb.

Tugas data mining sebenarnya adalah analisis otomatis atau semi-otomatis jumlah besar data untuk mengekstrak pola yang menarik yang sebelumnya tidak diketahui seperti kelompok catatan data (analisis cluster), catatan yang tidak biasa (deteksi anomali) dan dependensi (aturan asosiasi pertambangan). 

Hal ini biasanya melibatkan menggunakan teknik database seperti indeks spasial. Pola ini kemudian dapat dilihat sebagai semacam ringkasan dari input data, dan dapat digunakan dalam analisis lebih lanjut atau, misalnya, dalam pembelajaran mesin dan analisis prediktif. Misalnya, langkah data mining mungkin mengidentifikasi beberapa kelompok dalam data.

Dalam pertemuan ke 4 ini kita akan membahas beberapa metode yang diterapkan dalam data mining. 


Modul Metode Learning : Download

PERTEMUAN 5 - NAIV BAYES



Assalammu'alaikum wr. wb.

Pertemuan ke 5 ini kita akan membahas mengenai Bayesian Classification. Bayesian Classification adalah pengklasifikasian statistic yang dapat digunakan untuk memprediksi probabilitas keanggotaan suatu class. Algoritma yang digunakan salah satunya adalah Naive Bayes. Bayesian Classification terbukti memiliki akurasi dan kecepatan yang tinggi saat diaplikasikan ke dalam database dengan data yang besar.
Salah satu contoh penggunaan algoritma Naive Bayes adalah memprediksi apakah seseorang dengan kriteria tertentu akan membeli komputer atau tidak berdasarkan nilai probabilitas keanggotaan classnya.

Pada pertemuan kali ini akan ada 2 sesi, yaitu :
1.  SESI MATERI
 Merupakan sesi untuk membahas perhitungan manual dari suatu kasus dengan menggunakan algoritma Naive Bayes.


2. SESI PRAKTIKUM
Merupakan sesi untuk membahas penggunaan tools pada Python untuk contoh kasus algoritma Naive Bayes dengan menggunakan Google Colabs. Teman - teman dapat mendownload dataset Social Network Ads. csv yang sudah tersedia pada LMS yang akan kita gunakan dalam sesi praktikum.


Modul Naive Bayes : Download
Tugas pertemuan 5 : Download

Data Set Social Network Ads : Download

PERTEMUAN 6 - K-Nearest Neighbor (KNN)


ASSALAMMU'ALAIKUM WR. WB.

 

Salah satu algoritma yang dapat digunakan untuk metode learning Klasifikasi adalah K - Nearest Neighbor (KNN). KNN merupakan pendekatan untuk mencari kasus lama, yaitu berdasarkan pada pencocokan bobot dari sejumlah fitur yang ada.

Salah satu contoh KNN adalah untuk mencari solusi terhadap pasien baru dengan menggunakan solusi dari pasien terdahulu dengan menghitung kedekatan kasus pasien baru dengan semua kasus pasien lama. Kasus pasien lama dengan kedekatan terbesarlah yang akan diambil solusinya untuk digunakan pada kasus pasien baru.

Yuk kita sama-sama pelajari bagaimana algoritma KNN bekerja. Pada pertemuan kali ini akan dibagi menjadi 2 sesi, yaitu :

1. Sesi Materi

Merupakan sesi untuk membahas perhitungan manual dari suatu kasus dengan menggunakan algoritma KNN.

2. Sesi Praktikum

Merupakan sesi untuk membahas penggunaan tools pada Python untuk contoh kasus algoritma KNN dengan menggunakan Google Colabs. Teman - teman dapat mendownload dataset Social Network Ads. csv yang sudah tersedia pada LMS yang akan kita gunakan dalam sesi praktikum.

Video Praktikum


Modul KNN                             :Download 
Dataset social Network Ads    : Download

Tugas pertemuan 6                 : Download


PERTEMUAN 7 - Decision Tree

ASSALAMMU'ALAIKUM WR. WB


Alhamdulillah kita kita masih diberi kesempatan untuk bertemu pada pertemuan ke 7. Masih semangat ya teman-teman..

Pada pertemuan kali ini kita akan membahas tentang algoritma C4.5. Algoritma C4.5 merupakan algoritma yang digunakan untuk membentuk pohon keputusan (Decision Tree). Pohon keputusan merupakan metode klasifikasi dan prediksi yang terkenal. Pohon keputusan berguna untuk mengekspolari data, menemukan hubungan tersembunyi antara sejumlah calon variable input dengan sebuah variable target.

Salah satu contoh penggunaan algoritma C4.5 adalah membuat pohon keputusan untuk menentukan main tenis atau tidak dengan melihat keadaan cuaca, temperatur, kelembaban dan keadaan angin.

Pertemuan ini dibagi menjadi 2 sesi, yaitu :

1. Sesi Materi

Merupakan sesi untuk membahas perhitungan manual dari suatu kasus dengan menggunakan algoritma Decision Tree C.45


2. Sesi Praktikum

Merupakan sesi untuk membahas penggunaan tools pada Python untuk contoh kasus algoritma Decision Tree C.45 dengan menggunakan Google Colabs. Teman - teman dapat mendownload dataset Dataset Iris.csv yang sudah tersedia pada LMS yang akan kita gunakan dalam sesi praktikum.


Modul decision Tree                 : Download

Tugas topik 7                             : Download


PERTEMUAN 8 - UTS


CPMK 01 : -
CPMK 01 : Download
PERTEMUAN 9 - CLUSTERING



Clustering merupakan bagian dari metode learning unsupervised learning. Cluster berguna untuk mengelompokkan objek-objek data yang memiliki kemiripan ke dalam satu grip dan yang berbeda dikelompokkan ke dalam grup lainnya. Algoritma yang digunakan dalam metode learning ini adalah K - Means, K- Medoids, dan Hierarchical Clustering.

VIDEO PEMBELAJRAN CLUSTERING

Modul Clustering     : Download 
Tugas Kuis 9           : Download  
PERTEMUAN 10 - K-MEANS

Algoritma Clustering adalah meletakkan nilai yang serupa dalam satu segmen, dan meletakkan nilai yang berbeda dalam cluster yang berbeda (Wu & Kumar, 2009). Algoritma K-Means diterapkan pada objek yang diwakili dalam bentuk titik didalam ruangan vector berdimensi-d. K-Means mengcluster semua data didalam setiap dimensi dimana titik dalam segmentasi yang sama diberi cluster ID. Nilai dari K adalah masukan dasar dari algoritma yang menentukan jumlah segmentasi yang ingin dibentuk. Partisi akan dibentuk dari sekumpulan objek n kedalam cluster k sehingga terbentuk kesamaan objek dalam setiap segmentasi k.

Pertemuan ini dibagi menjadi 2 sesi, yaitu :

1. Sesi Materi

Merupakan sesi untuk membahas perhitungan manual dari suatu kasus dengan menggunakan algoritma K - Means.

Rekaman Clustering dengan K-Means



2. Sesi Praktikum

Merupakan sesi untuk membahas penggunaan tools pada Python untuk contoh kasus algoritma K - Means dengan menggunakan Google Colabs. Pada sesi praktikum ini kita menggunakan dataset bawaan dari phyton yaitu dataset iris.csv.

Tutorila Praktikum

Modul K-Means : Download 
Kuis 10                 : Download

Tatap Maya : Sinkronous 18 Desember 2023

PERTEMUAN 11 - Agglomerative Hierarchial Clustering (AHC)

Hierarchical Clustering adalah metode analisis kelompok yang berusaha untuk membangun sebuah hirarki kelompok data. Strategi pengelompokannya umumnya ada 2 jenis yaitu Agglomerative (Bottom-Up) dan Devisive (Top-Down). Pada bagian ini hanya akan dibatasi menggunakan konsep Agglomerative (Bottom-Up). Pada pertemuan kali ini kita akan membahas tentang

Agglomerative  Hierarchical Clustering . 

Pertemuan ini dibagi menjadi 2 sesi, yaitu :


1. Sesi Materi

Merupakan sesi untuk membahas perhitungan manual dari suatu kasus dengan menggunakan algoritma AHC.


2. Sesi Praktikum

Merupakan sesi untuk membahas penggunaan tools pada Python untuk contoh kasus algoritma AHC dengan menggunakan Google Colabs.  Teman - teman dapat mendownload dataset AHC.xlsx yang sudah tersedia pada LMS yang akan kita gunakan dalam sesi praktikum.



Modul AHC     : Download
Dataset AHC     : Download 
Tugas Kuis AHC : Download

PERTEMUAN 12 - REGRESI

ASSALAMMU'ALAIKUM WR. WB

Regresi dapat digunakan untuk memprediksi nilai dari variable terikat apabila terdapat kenaikan atau penurunan pada variable bebas. Pada regresi terdapat istilah korelasi yang digunakan untuk mengukur hubungan antara dua variable. Metode dalam regresi adalah regresi linear berganda, metode ini dapat kita gunakan salah satunya untuk memprediksi pengeluaran rumah tangga dalam seminggu berdasarkan variabel pendapatan dalam seminggu dan variabel jumlah anggota rumah tangga.


Pertemuan ini dibagi menjadi 2 sesi, yaitu :

1. Sesi Materi

Merupakan sesi untuk membahas perhitungan manual dari suatu kasus dengan menggunakan algoritma Regresi Linear Berganda.


2. Sesi Praktikum

Merupakan sesi untuk membahas penggunaan tools pada Python untuk contoh kasus algoritma regresi dengan menggunakan Google Colabs.  Teman - teman dapat mendownload dataset Data Penjualan.xlsx yang sudah tersedia pada LMS yang akan kita gunakan dalam sesi praktikum.


 
Modul Regresi : Download
Dataset Regresi : Download
Kuis                 : Download
Ujian CPMK 3 : Download

PERTEMUAN 13 - ASOSIASI

ASSALAMMU'ALAIKUM WR. WB

Asosiasi dikenal dengan nama Market Basket Analysis atau Association Rule. Association Rule merupakan hubungan (asosiasi) antara kombinasi beberapa item (barang, orang, produk, atau apapun yang diwakili oleh kata benda) yang sering muncul bersamaan. Banyak digunakan di toko-toko untuk mengatur penempatan barang atau mengontrol penjualan. Apriori adalah algoritma yang banyak digunakan. Asosiasi dapat digunakan salah satunya untuk mengatur penempatan roti, mentega, susu, dan coklat dalam rak display berdasarkan hubungan antara kombinasi beberapa item tersebut.


Pertemuan ini dibagi menjadi 2 sesi, yaitu :

1. Sesi Materi

Merupakan sesi untuk membahas perhitungan manual dari suatu kasus dengan menggunakan algoritma Apriori

2. Sesi Praktikum

Merupakan sesi untuk membahas penggunaan tools pada Python untuk contoh kasus algoritma regresi dengan menggunakan Google Colabs.  Teman - teman dapat mendownload dataset Online_Retail.xlsx yang sudah tersedia pada LMS yang akan kita gunakan dalam sesi praktikum.


Modul Asosiasi : Download
Dataset Online Retail : Download
Kuis                 : Download
PERTEMUAN 14 - Artificial Neural Network

Assalammu'alaikum wr. wb


Artificial Neural Network (ANN) merupakan temuan penting dalam bidang Machine Learning. ANN terinspirasi oleh sistem saraf otak manusia (neuron) dalam melakukan klasifikasi data. Namun, pemodelan syaraf buatan pada ANN jauh lebih sederhana dibandingkan dengan neuron yang sebenarnya.  Terdapat banyak model ANN yang telah diusulkan, baik belajar secara supervised ataupun unsupervised. Pertemuan ini dibagi menjadi 2 sesi, yaitu :

1. Sesi Materi

Merupakan sesi untuk membahas materi tentang Artificial Neural Network (ANN).

2. Sesi Praktikum

Merupakan sesi untuk membahas penggunaan tools pada Python untuk contoh kasus ANN dengan Multi Layer Perceptron untuk klasifikasi diabetes dengan menggunakan Google Colabs.  Teman - teman dapat mendownload dataset diabetes_uji.csv dan diabetes_latih.csv yang sudah tersedia pada LMS yang akan kita gunakan dalam sesi praktikum.


** Lembar kerja Google Colab studi kasus Klasifikasi Diabetes **

https://colab.research.google.com/drive/10U3RYVhru8RQLSUKZ5SIq5ife5GDMV65#scrollTo=RcxwK8hxmBlK

Modul ANN : Download

Diabetes_uji.csv : Download

Diabetes_latih.csv : Download

Kuis ANN : Download

PERTEMUAN 15 - VALIDASI DAN PENGUJIAN MODEL

ASSALAMMU'ALAIKUM WR. WB

Evaluasi atau validasi merupakan kunci dalam membuat aplikasi Data Mining. Ada berbagai macam cara dalam melakukan evaluasi. Jika kita memiliki data yang kita gunakan dalam proses pelatihan, maka tidak serta merta kita menjadikan data tersebut sebagai indicator keberhasilan aplikasi yang kita buat.  Oleh karena itu, kita membutuhkan metode tertentu guna memprediksi performa berdasarkan eksperimen untuk berbagai macam data selain data training tersebut. Kualitas data merupakan factor penting di dalam evaluasi baik untuk proses pelatihan maupun pengujian data.




Modul : Download

Kuis : Download

PERTEMUAN 16 - UAS 

Soal UAS : Download 


 

1 Komentar

Lebih baru Lebih lama