EXPLORE INFORMATION : AI, BITCOIN, TECHNOLOGY. Enjoy!

Tugas Membuat Analisis Dataset dengan Algoritma Regresi Logistik

 Analisis dataset menggunakan Regresi Logistik adalah teknik statistik untuk memprediksi probabilitas variabel dependen yang bersifat kategorikal (seperti "Ya/Tidak", "0/1") berdasarkan satu atau lebih variabel independen. Berbeda dengan regresi linear yang memprediksi nilai kontinu, regresi logistik menggunakan fungsi sigmoid untuk menghasilkan output antara 0 dan 1. 

Berikut adalah langkah-langkah sistematis untuk melakukan analisis tersebut:
1. Definisi Variabel
Tentukan variabel yang akan dianalisis: 

* Variabel Dependen ($Y$): Harus berupa data biner/kategorik (misal: penderita diabetes vs tidak).
* Variabel Independen ($X$): Bisa berupa data numerik (usia, berat badan) atau kategorik. 

## 2. Persiapan Data (Data Preparation)
Lakukan pembersihan data sebelum pemodelan: 

* Missing Values: Tangani data yang kosong dengan penghapusan atau imputasi.
* Encoding: Ubah variabel kategorik teks menjadi angka (misal: "Laki-laki" $\rightarrow$ 1, "Perempuan" $\rightarrow$ 0).
* Split Data: Bagi dataset menjadi Data Latih (Training) (biasanya 80%) untuk membangun model dan Data Uji (Testing) (20%) untuk evaluasi. 

## 3. Pemodelan dengan Fungsi Sigmoid
Model ini menggunakan rumus transformasi logit. Probabilitas kejadian ($P$) dihitung dengan:
$$P(Y=1|X) = \frac{1}{1 + e^{-(\beta_0 + \beta_1X_1 + ... + \beta_nX_n)}}$$ Di mana $e$ adalah bilangan Euler dan $\beta$ adalah koefisien yang dicari oleh algoritma. 
## 4. Evaluasi Model
Gunakan Confusion Matrix untuk melihat performa prediksi model terhadap data uji. Metrik yang umum digunakan meliputi: 

* Akurasi: Persentase total prediksi yang benar.
* Precision & Recall: Untuk melihat seberapa baik model mendeteksi kelas positif secara spesifik.
* AUC-ROC: Mengukur kemampuan model membedakan antar kelas. 

## Visualisasi Fungsi Logistik
Perbedaan utama regresi logistik dengan linear adalah bentuk kurvanya. Regresi logistik membentuk kurva "S" (sigmoid) yang membatasi nilai output tetap di rentang 0 hingga 1.








Kesimpulan
Analisis dataset dengan Regresi Logistik berhasil jika model mampu mengklasifikasikan data dengan akurasi tinggi dan koefisien variabelnya memberikan interpretasi yang logis terhadap probabilitas kejadian target. 

[1] [https://journal.literasisains.id](https://journal.literasisains.id/index.php/jomlai/article/download/598/470/2435)
[2] [https://rpubs.com](https://rpubs.com/DiandraParamitha/1046400)
[3] [https://id.linkedin.com](https://id.linkedin.com/pulse/understanding-logistic-regression-most-commonly-used-izairton-zkfqf?tl=id#:~:text=Artikel%20ini%20menyajikan%20analisis%20terperinci%20tentang%20algoritma,pada%20kumpulan%20data%20sintetis%2C%20mencapai%20akurasi%20tinggi.)
[4] [https://mitaartmitaart.medium.com](https://mitaartmitaart.medium.com/klasifikasi-logistic-regression-menggunakan-python-iris-dataset-278ce9da2c25)
[5] [https://www.ibm.com](https://www.ibm.com/id-id/think/topics/logistic-regression#:~:text=Perbedaan%20utamanya%20adalah%20bahwa%20regresi%20linier%20digunakan,kategoris%2C%20seperti%20apakah%20pinjaman%20disetujui%20atau%20tidak.)
[6] [https://bbe.telkomuniversity.ac.id](https://bbe.telkomuniversity.ac.id/regresi-pengertian-rumus-dan-contoh-analisis/)
[7] [https://repository.ub.ac.id](https://repository.ub.ac.id/184850/1/NANDIA%20PRADIANTI.pdf)
[8] [https://dqlab.id](https://dqlab.id/analisis-regresi-jenis-teknik-analisis-data-terpopuler#:~:text=Umumnya%20untuk%20menggunakan%20regresi%20logistik%2C%20variabel%20dependen,logistik%20biner%20dan%20analisis%20regresi%20logistik%20multinomial.)
[9] [https://repository.bakrie.ac.id](https://repository.bakrie.ac.id/4536/1/Analisis%20Regresi%20Ordinal-LPKM-rev1.pdf#:~:text=Syarat%20untuk%20dapat%20menggunakan%20analisis%20regresi%20linear,variabel%20independen%20%28X%29%20dalam%20analisis%20sebagai%20numerik.)
[10] [https://www.ojs.stmikpontianak.ac.id](https://www.ojs.stmikpontianak.ac.id/corisindo/article/download/30/22)
[11] [https://jurnalvariansi.unm.ac.id](https://jurnalvariansi.unm.ac.id/index.php/variansi/article/download/116/38)
[12] [https://insancs.medium.com](https://insancs.medium.com/exploratory-data-analysis-for-auto-mpg-dataset-f9ce86a52b1a#:~:text=Untuk%20menangani%20missing%20value%20diatas%20kita%20akan,memilih%20metode%20terbaik%20untuk%20menangani%20data%20tersebut.)
[13] [https://media.neliti.com](https://media.neliti.com/media/publications/15583-ID-pemodelan-log-linier-dan-regresi-logistik-biner-bivariat-pada-hasil-medical-chec.pdf#:~:text=Model%20tersebut%20ditransformasi%20dengan%20transformasi%20logit%2C%20sehingga,Model%20transformasi%20logit%20yaitu%20sebagai%20berikut%20%5B2%5D.)
[14] [https://rpubs.com](https://rpubs.com/satrio0126/1046653#:~:text=Regresi%20logistik%20menggunakan%20fungsi%20logistik%20atau%20sigmoid,yang%20dapat%20diinterpretasikan%20sebagai%20probabilitas%20kejadian%20sukses.)
[15] [https://repository.nusaputra.ac.id](https://repository.nusaputra.ac.id/id/eprint/1240/1/ABI%20INDRA%20RISA.pdf)
[16] [https://sekolahstata.com](https://sekolahstata.com/apa-itu-logistic-regression/#:~:text=Kurva%20ROC%20dan%20area%20di%20bawah%20kurva,dalam%20membedakan%20antara%20kelas%20positif%20dan%20negatif.)
[17] [https://lppm.tazkia.ac.id](https://lppm.tazkia.ac.id/berita/metodologi-regresi-logistik-pada-penelitian-kuantitatif-bagaimana-langkah-utamanya)
[18] [https://www.jmp.com](https://translate.google.com/translate?u=https://www.jmp.com/en/statistics-knowledge-portal/inferential-statistics/logistic-regression&hl=id&sl=en&tl=id&client=sge#:~:text=Regresi%20logistik%20digunakan%20untuk%20memodelkan%20hubungan%20antara,dari%20variabel%20respons%20berdasarkan%20nilai%20variabel%20prediktor.)
[19] [https://rpubs.com](https://rpubs.com/thesion_ms/proposalDCD#:~:text=Hasil%20akurasi%20menunjukkan%20bahwa%20kedua%20model%2C%20baik,yang%20ada%20%28cluster%201%2C%202%2C%20dan%203%29.)

0 Comment: