Dataset ini diambil dari Kaggle yg terdiri dari 4080 sample dan 4 fitur , yaitu fitur species ikan, panjang(cm), berat (g), dan rasio berat/panjang ikan tsb.
Terdapat Class/module yg tidak digunakan seperti StandardScaler dan DBSCAN. sebaiknya hapus class/ module yg tidak digunakan untuk membuat kode lebih bersih dan sedikit lebih efisien.
Dataset ini terdiri dari 1 fitur kategorial dan 3 fitur numerik.
Dataset ini tidak memiliki nilai Missing , yg artinya dataset ini sudah bersih dari nilai Missing.
species untuk mengubah fitur Kategorial menjadi fitur numerik.Dalam Pembangunan Model Clustering, kamu menggunakan K-means Clustering dengan jumlah Cluster = 3. didapatkan nilai silhouette coefficient nya 0.62
Dalam melakukan Klasifikasi, kamu menggunakan 5 Algoritma Klasifikasi , yaitu : K-Nearest Neighbor, Decision Trees, Random Forest, Support Vector Machine (SVM), dan Naive Bayes dengan hasil metrik evaluasi nya mencapai 100%
Sebaiknya, buatlah berkas requirements.txt yang mencantumkan semua instalasi / dependensi yang digunakan dalam proyek. Kamu bisa menggunakan package pipreqs untuk menghasilkan berkas ini secara otomatis berdasarkan import yang dilakukan di kodemu
Pada project yang diperiksa terjadi sebuah error pada cell ke-9 :
FileNotFoundError: [Errno 2] No such file or directory: '/content/datasetdalamnotebookclustering.csv'
dan Saya mengatasinya dengan memberikan path yg bener untuk lokasi dataset nya : pd.read_csv('datasetdalamnotebookclustering.csv')
Pastikan untuk memberikan Path yg sesuai dengan lokasi dataset nya
import pandas as pd # Mengimpor pustaka pandas untuk manipulasi dan analisis data
import matplotlib.pyplot as plt # Mengimpor pustaka matplotlib untuk visualisasi grafik
from yellowbrick.cluster import KElbowVisualizer # Mengimpor KElbowVisualizer untuk visualisasi metode Elbow
from sklearn.preprocessing import LabelEncoder, StandardScaler, MinMaxScaler
from sklearn.cluster import KMeans, DBSCAN # Mengimpor algoritma KMeans dan DBSCAN untuk clustering
from sklearn.metrics import silhouette_score # Mengimpor silhouette_score untuk mengevaluasi hasil clustering
pada cell ke 6, saya melihat ada peringatan 'unexpected indentation' yang muncul di beberapa bagian kode. Meskipun saat ini kode masih berjalan dengan baik, ini bisa menunjukkan adanya ketidaksesuaian dalam penggunaan spasi atau tab di beberapa tempat.
FileNotFoundError: [Errno 2] No such file or directory: '/content/datasetdalamnotebookclustering.csv'