Skin Cancer Classification Using Random Forest Algorithm

Nurul Khasanah

doi:10.30700/JST.V11I2.1122

Outline

Skin Cancer Classification Using Random Forest Algorithm

Nurul Khasanah

2021, SISFOTENIKA

https://doi.org/10.30700/JST.V11I2.1122

visibility

…

description

11 pages

Abstract

Kanker kulit adalah benjolan yang berlebihan jaringan kulit yang mengenai kulit, memiliki struktur tidak teratur dengan diferensiasi sel dalam berbagai tingkatan pada kromatin, nukleus dan sitoplasma, bersifat ekspansif, infiltratif hingga merusak jaringan sekitarnya, serta bermetastasis melalui pembuluh darah dan pembuluh getah bening. Diagnosis kanker kulit dengan proses biopsi dianggap kurang efektif karena biaya yang diperlukan cukup banyak dan dapat melukai kulit manusia sebagai sample. Untuk itu, perlunya suatu sistem untuk klasifikasi jenis kanker kulit yang efektif dan akurat. Penerapan machine learning sudah banyak digunakan dalam bidang kesehatan. Salah satu metode machine learning adalah Random Forest. Dalam penelitian ini akan dilakukan ekstraksi fitur warna histogram, ekstraksi bentuk hue moment, dan ekstraksi tekstur haralick. Selanjutnya citra akan diklasifikasi menggunakan algoritma Random Forest. Nilai akurasi terbaik diperoleh dari proses ekstraksi fitur histogram dan klasifikasi dengan Random Forest yaitu 0.850822. Novelty dari penelitian ini adalah penggunakan ekstraksi fitur yang lebih beragam dan hasil akurasi yang lebih baik dari penelitian sebelumnya. Penelitian selanjutnya diharapkan menggunakan algoritma deep learning dengan arsitektur CNN (Convolutional Neural Network) untuk mendapatkan hasil akurasi yang lebih baik dan ditambahkan rancangan aplikasi untuk penerapan model yang telah dibentuk dalam penelitian sehingga bisa langsung diterapkan oleh tim medis.

JURNAL SISFOTENIKA Vol. 11 No. 2, Juli 2021 p-ISSN: 2087-7897 ; e-ISSN : 2460-5344 DOI : 10.30700/jst.v11i2.1122 Klasifikasi Kanker Kulit Menggunakan Algoritma Random Forest Skin Cancer Classification Using Random Forest Algorithm Nurul Khasanah*1, Rachman Komarudin 2, Nurul Afni3, Yana Iqbal Maulana4, Agus Salim5 1,2 Universitas Nusa Mandiri; Jl. Jatiwaringin No. 2, Jakarta Timur 3,4,5 Universitas Bina Sarana Informatika; Jl. Kramat Raya No. 98, Jakarta Pusat e-mail: *[email protected], [email protected], [email protected], 4 [email protected], [email protected] Abstrak Kanker kulit adalah benjolan yang berlebihan jaringan kulit yang mengenai kulit, memiliki struktur tidak teratur dengan diferensiasi sel dalam berbagai tingkatan pada kromatin, nukleus dan sitoplasma, bersifat ekspansif, infiltratif hingga merusak jaringan sekitarnya, serta bermetastasis melalui pembuluh darah dan pembuluh getah bening. Diagnosis kanker kulit dengan proses biopsi dianggap kurang efektif karena biaya yang diperlukan cukup banyak dan dapat melukai kulit manusia sebagai sample. Untuk itu, perlunya suatu sistem untuk klasifikasi jenis kanker kulit yang efektif dan akurat. Penerapan machine learning sudah banyak digunakan dalam bidang kesehatan. Salah satu metode machine learning adalah Random Forest. Dalam penelitian ini akan dilakukan ekstraksi fitur warna histogram, ekstraksi bentuk hue moment, dan ekstraksi tekstur haralick. Selanjutnya citra akan diklasifikasi menggunakan algoritma Random Forest. Nilai akurasi terbaik diperoleh dari proses ekstraksi fitur histogram dan klasifikasi dengan Random Forest yaitu 0.850822. Novelty dari penelitian ini adalah penggunakan ekstraksi fitur yang lebih beragam dan hasil akurasi yang lebih baik dari penelitian sebelumnya. Penelitian selanjutnya diharapkan menggunakan algoritma deep learning dengan arsitektur CNN (Convolutional Neural Network) untuk mendapatkan hasil akurasi yang lebih baik dan ditambahkan rancangan aplikasi untuk penerapan model yang telah dibentuk dalam penelitian sehingga bisa langsung diterapkan oleh tim medis. Kata kunci— Kanker Kulit, Algoritma Random Forest, Klasifikasi Kanker Kulit Abstract Skin cancer is an excessive lump of skin tissue that affects the skin, has an irregular structure with cell differentiation at various levels in chromatin, nucleus and cytoplasm, is expansive, infiltrative to damage the surrounding tissue, and metastasizes through blood vessels and lymph vessels. Diagnosis of skin cancer by biopsy process is considered less effective because it costs a lot and can injure human skin as a sample. For that, we need a system for classification of skin cancer types that are effective and accurate. The application of machine learning has been widely used in the health sector. One of the machine learning methods is Random Forest. In this study, the histogram color feature extraction will be carried out, the hue moment shape extraction, and the haralick texture extraction. Furthermore, the image will be classified using the Random Forest algorithm. The best accuracy value obtained from the histogram feature extraction process 137 Copyright © 2021 SISFOTENIKA Website : http://sisfotenika.stmikpontianak.ac.id/index.php/ST Klasifikasi Kanker Kulit Menggunakan Algoritma Random Forest and classification with Random Forest is 0.850822. The novelty of this research is the use of more diverse feature extraction and better accuracy results than previous studies. Future research is expected to use deep learning algorithms with CNN (Convolutional Neural Network) architecture to get better accuracy results and add application designs for the application of models that have been formed in the study so that they can be directly applied by the medical team. Keywords— Skin Cancer, Random Forest Algorithm, Classification of Skin Cancer 1. PENDAHULUAN Kanker kulit adalah benjolan atau pertumbuhan yang berlebihan jaringan kulit yang mengenai sebagian atau seluruh lapisan kulit, yang memiliki struktur tidak teratur dengan diferensiasi sel dalam berbagai tingkatan pada kromatin, nukleus dan sitoplasma, bersifat ekspansif, infiltratif hingga merusak jaringan sekitarnya, serta bermetastasis melalui pembuluh darah dan atau pembuluh getah bening. Kanker kulit dapat diklasifikasikan dalam tiga tipe terbanyak yaitu karsinoma sel basal, karsinoma sel skuamosa, dan melanoma maligna (Wilvestra et al., 2018). Diagnosis kanker kulit merupakan salah satu cabang dari bidang kesehatan yang digunakan untuk mendeteksi adanya kelainan pada kulit. Secara umum, dokter melakukan diagnosa penyakit kanker kulit menggunakan Biopsi. Kelemahan dari proses biopsi adalah biaya yang diperlukan cukup banyak, dapat melukai kulit manusia sebagai sample dan prosesnya kurang efektif. Seiring perkembangan teknologi penelitian menunjukkan perlu adanya otomatisasi untuk deteksi kanker kulit melalui citra dermoscopy (Iyatomi et al., 2011). Pada citra dermoscopy (kanker kulit), warna merupakan fitur dengan banyak informasi untuk mengenali kanker kulit yang diderita oleh pasien. Penanganan penyakit ini tentunya sesuai dengan jenis kanker kulit yang diderita pasien yaitu malignant (ganas) dan benign (jinak). Untuk itu, perlunya suatu sistem untuk klasifikasi jenis kanker kulit yang akurat. Penerapan machine learning sudah banyak digunakan dalam bidang kesehatan. Machine learning membuat pekerjaan dalam mengklasifikasi penyakit dibidang kesehatan menjadi mudah seperti, mengetahui jenis penyakit dan memberikan hasil dalam bentuk gambar yang lebih optimal. (Telaumbanua, Hulu, Nadeak, Lumbantong, & Dharma, 2019). Beberapa metode machine learning antara lain : Naïve Bayes, CART, LDA, Linear Regression, Support Vector Machine, KNN, dan Random Forest. Dalam penelitian (Adjed, Faye, Ababsa, Gardezi, & Dass, 2016) yang menggunakan 655 citra (544 benign dan 111 malignant) mendapatkan hasil akurasi 76,1%. Dalam penelitian (Lynn & Kyu, 2018) dalam penelitiannya yang menggunakan dataset IDIC dengan jumlah data 220 data training dan 20 data testing menghasilkan akurasi tertinggi dengan algoritma SVM yaitu 78.2%. Penelitian (Faruk & Nafi’iyah, 2020) yang menggunakan dataset dari https://www.kaggle.com/fanconic/ skin-cancer-malignant-vs-benign dengan jumlah citra 3297 citra, 2637 citra sebagai dataset training, 660 citra sebagai data testing. Proses penelitian ini menggunakan 2 ekstraksi fitur yaitu ekstraksi fitur warna dan tekstur. Metode klasifikasi yang digunakan yaitu SVM dan KNN. Klasifikasi menggunakan algoritma SVM menghasilkan nilai akurasinya 69,85%, sedangkan penelitian menggunakan algoritma KNN, dengan nilai K=2 akurasinya 67,27%, K=3 akurasinya 67,88%, K=4 akurasinya 70,15%, K=5 akurasinya 70,61%, K=6 akurasinya 69,55%. dari beberapa eksperiment yang dilakukan nilai K terbaik pada KNN adalah 5, dengan akurasi 70,61%. Dari beberapa penelitian yang pernah ada, penulis akan melakukan penelitian dengan tahapan akuisisi data, ekstraksi fitur, klasifikasi dan evaluasi. Proses ekstraksi fitur yang telah dilakukan oleh penelitian sebelumnya adalah ekstraksi fitur warna dan bentuk, sedangkan dalam penelitian ini penulis akan melakukan 3 ekstraksi fitur yaitu ekstraksi warna histogram, ekstraksi bentuk hue moment, dan ekstraksi tekstur haralick yang dibahas di point 2.3 Fitur Ekstraksi. Selanjutnya citra akan diklasifikasi menggunakan machine learning dengan algoritma Random Forest yang dibahas di point 2.4 Klasifikasi. Penggunaan algoritma Random Forest adalah bentuk 138 Jurnal Ilmiah SISFOTENIKAJuly201xIJCCS Nurul Khasanah, Rachman Komarudin, Nurul Afni, Yana Iqbal Maulana, Agus Salim novelty dari penelitian ini, karena sebelumnya belum ada penerapan algoritma Random Forest dalam penelitian kasus ini. Hasil dari penelitian ini, diharapkan akan muncul nilai akurasi yang lebih tinggi untuk deteksi jenis penyakit kulit pada manusia sehingga mendapatkan penanganan sesuai dengan penyakit yang diderita. 2. METODE PENELITIAN Tahapan penelitian yang dilakukan penulis antara lain Akuisisi Data Preprocessing Ekstraksi Fitur (Warna, Bentuk, Tekstur) Klasifikasi (Algoritma Random Forest) Evaluasi Hasil Gambar 1 Tahapan Penelitian 2.1 Akuisisi Data Dataset kanker kulit yang terdiri dari 2 kelas, yakni : Benign dan Malignant dengan jumlah keseluruhan data ada : 3297 data, dengan data test sebesar : 660 data dan data train sebesar : 2637 data. Dataset diperoleh dari kaggle https://www.kaggle.com/fanconic/skin-cancer-malignant-vs- benign. Rincian dataset yang kami gunakan adalah sebagai berikut : Tabel 1. Dataset Kanker Kulit Benign Malignant test 360 300 train 1440 1197 Sample citra dataset adalah sebagai berikut : implie Vol. 11, No. 2, Juli 2021 139 Klasifikasi Kanker Kulit Menggunakan Algoritma Random Forest Gambar 2. Sample citra benign 1 Gambar 3. Sample citra malignant 1 Gambar 4. Sample citra benign 2 Gambar 5. Sample citra malignant 2 2.2 Preprocessing Pada tahap preprocessing, proses yang dilakukan adalah resize citra menjadi 512x512. Kemudian data dibagi menjadi data training (90%) dan data testing (10%). 2.3 Fitur Ekstraksi Ekstraksi fitur yang digunakan, yaitu Fitur ekstraksi warna (histogram), fitur ekstraksi bentuk (hue moments) dan fitur ekstraksi tekstur (haralick). A. Fitur Ekstraksi Warna Citra yang diperlukan dalam proses ini berupa RGB, sama seperti hasil citra yang sudah tersegmentasi. Selanjutnya dilakukan pengambilan nilai first order histogramagar dapat mengetahui masing-masing nilai piksel pada masing-masing warna citra. Perhitungan first order histogram dapat ditulis seperti persamaan (Priambodo, Sari, & Widodo, 2019). 𝑁(𝑐) (1) 𝑃(𝑐) = 𝑀 ) P(c) : probabilitas first order histogram N(c) : nilai piksel channel citra c M : jumlah piksel suatu citra B. Fitur Ekstraksi Bentuk Ciri bentuk merupakan karakter dari suatu objek yang merupakan konfigurasi oleh garis dan kontur. Fitur bentuk dikategorikan bergantung pada teknik yang digunakan. Kategori tersebut adalah berdasarkan batas (boundary-based). dan berdasarkan daerah (region-based). Teknik berdasarkan batas (boundary-based) menggambarkan bentuk daerah dengan menggunakan karakteristik ekstrenal, contohnya adalah piksel sepanjang batas objek. (Madhulatha, 2012) C. Fitur Ekstraksi Tekstur 140 Jurnal Ilmiah SISFOTENIKAJuly201xIJCCS Nurul Khasanah, Rachman Komarudin, Nurul Afni, Yana Iqbal Maulana, Agus Salim Proses perbandingan kemiripan dari hasil klaster citra merupakan hasil dari ekstraksi ciri warna, ekstraksi ciri bentuk dan ekstraksi ciri tekstur. Keanggotaan suatu citra dalam klastering yang terbentuk akan menjadi pembanding untuk gambar uji yang dimasukkan. Metode yang dipakai untuk mengukur jarak antar dua centroid adalah menggunakan Manhattan Distance dirumuskan sebagai berikut (Madhulatha, 2012): 𝑇𝑜𝑡𝑎𝑙 [𝐴𝑏𝑠[𝑢 − 𝑣]] (2) ) Dengan u dan v merupakan vector. Dalam penelitian ini u merupakan atribut fitur citra uji dan v merupakan atribut fitur citra latih dan citra uji. Setelah centroid yang memiliki jarak paling dekat tadi ditemukan. 2.4 Klasifikasi Klasifikasi adalah proses pengelompokan yang artinya mengumpulkan benda atau entitas yang sama dan memisahkan benda atau entitas yang tidak sama (Firasari et al., 2020). Peneliti melakukan klasifikasi menggunakan Algoritma Random Forest. Random Forest adalah algoritma yang fleksibel dan mudah digunakan menghasilkan hasil yang bagus di sebagian besar waktu. Random Forest terdiri dari sejumlah pohon, dengan setiap pohon tumbuh menggunakan beberapa bentuk pengacakan dan tugas lain itu beroperasi dengan membangun banyak pohon keputusan di waktu pelatihan dan mengeluarkan kelas yang merupakan mode dari kelas atau prediksi rata-rata dari pohon individu. (Seeja & Suresh, 2019). Tahapan pada algoritma Random Forest sebagai berikut: a. Tentukan jumlah tree (k) yang akan dibentuk, jumlah k dipilih dari total fitur m, di mana k kurang dari m. b. Sampel acak diambil sebanyak N observasi (with replacement) pada dataset untuk setiap tree. c. Pada setiap tree, dilakukan juga pengambilan subset prediktor sebanyak secara acak. Dimana m<p , p adalah jumlah variabel prediktor. d. Proses kedua dan ketiga diulangi sampai sebanyak k tree. e. Pada kasus klasifikasi, hasil prediksi Random Forest diperoleh dari vote terbanyak (majority vote) dari hasil klasifikasi sebanyak tree. 2.5 Evaluasi Evaluasi hasil dari klasifikasi menggunakan random forest menggunakan akurasi, confusion matrix, Kappa Statistic, Precision, Recall dan Classification report table. Berikut adalah penjelasan dari masing-masing point evaluasi : a. Akurasi Menurut Kamus Besar Bahasa Indonesia, Akurasi adalah kecermatan, ketelitian, ketepatan; teliti, saksama, cermat, tepat benar. Akurasi mengandung pengertian sejauh mana data tersebut benar, dapat diandalkan dan bersertifikat. Akurasi adalah teliti, tepat, cermat, saksama, akurat. Derajat kebebasan informasi dari kesalahan. Bebas dari kesalahan dan tidak bias atau menyesatkan. Dalam informasi, informasi harus jelas mencerminkan maksud dari data yang sebenarnya. Informasi harus akurat karena dari sumber informasi sampai penerima informasi kemungkinan banyak terjadi gangguan (noise) yang dapat merubah atau merusak data tersebut (Mandels & Calvin, 2014). b. Confusion matrix Confusion Matrix dapat dilakukan pengukuran dengan cara menggunakan tabel klasifikasi yang bersifat prediktif (Fibrianda & Bhawiyuga, 2018). Berikut adalah contoh tabel confusion matrix (Fibrianda & Bhawiyuga, 2018). implie Vol. 11, No. 2, Juli 2021 141 Klasifikasi Kanker Kulit Menggunakan Algoritma Random Forest Predicted Class Yes No Total Actual Class Yes TP FN P No FP TN N Total P’ N’ P+N Gambar 6. Contoh tabel Confusion matrix TP (True Positive) yaitu jumlah data dengan nilai sebenarnya positif dan nilai prediksi positif FP (False Positive) yaitu jumlah data dengan nilai sebenarnya negatif dan nilai prediksi positif FN (False Negative) yaitu jumlah data dengan nilai sebenarnya positif dan nilai prediksi negatif TN (True Negative) yaitu jumlah data dengan nilai sebenarnya negatif dan nilai prediksi negatif c. Kappa statistic Cohen mengemukakan suatu ukuran kesepakatan antara dua penilai dalam mengklasifikan beberapa subjek dalam satu dari dua kategori yang mungkin. Nilai statistik Kappa yang mendekati satu menunjukkan kesepakatan yang sangat baik di antara kedua penilai sedangkan yang mendekati nol menunjukkan kesepakatan lemah diantara kedua penilai (Maskur & Andriansyah, 2015). d. Precision Precision adalah sebuah ukuran yang mengukur tingkat proporsi jumlah dokumen yang dapat ditemukan kembali oleh sebuah proses pencarian dan dianggap relevan untuk kebutuhan pencarian informasi atau rasio jumlah dokumen relevan yang ditemukan dengan total jumlah dokumen yang ditemukan (Martin & Nilawati, 2019). Berikut adalah rumus untuk menghitung angka precision : Jumlah dokumen relevan yang terpanggil (a) 𝑃𝑟𝑒𝑐𝑖𝑠𝑖𝑜𝑛 = (3) Jumlah dokumen relevan yang ada di dalam database (a + b) ) e. Recall Menurut Lancaster dalam Pendit, Recall adalah proporsi jumlah dokumen yang dapat ditemukan kembali oleh sebuah proses pencarian informasi (Martin & Nilawati, 2019). Berikut adalah rumus untuk mnghitung angka recall : Jumlah dokumen relevan yang terpanggil (a) (4) 𝑅𝑒𝑐𝑎𝑙𝑙 = Jumlah dokumen relevan yang ada di dalam database (a + c) ) 3. HASIL DAN PEMBAHASAN Berikut adalah hasil eksperimen dengan ekstraksi fitur dan metode : 3.1 Fiture Histogram a. Akurasi Akurasi yang didapat dengan algoritma Random Forest adalah 0,834387 b. Confusion matrix Tabel 2. Confusion matrix fitur Histogram benign malignant benign 329 77 malignant 49 329 142 Jurnal Ilmiah SISFOTENIKAJuly201xIJCCS Nurul Khasanah, Rachman Komarudin, Nurul Afni, Yana Iqbal Maulana, Agus Salim Penjelasan confusion matrix, antara lain : Tabel 3. Penjelasan Confusion matrix fitur Histogram Jumlah Jenis kanker sebenarnya Prediksi Jenis Kanker Keterangan 329 benign benign Sesuai 77 benign malignant Tidak sesuai 49 malignant benign Tidak sesuai 329 malignant malignant Sesuai - True Positif = jenis kanker sebenarnya dari 329 citra adalah benign dan prediksi jenis kanker juga benign (prediksi sesuai) - False Positif = jenis kanker sebenarnya dari 77 citra adalah benign dan prediksi jenis kanker adalah malignant (prediksi tidak sesuai) - False Negatif = jenis kanker sebenarnya dari 49 citra adalah malignant dan prediksi jenis kanker adalah benign (prediksi tidak sesuai) - True Negatif = jenis kanker sebenarnya dari 329 citra adalah malignant dan prediksi jenis kanker juga malignant (prediksi sesuai) c. Kappa Statistic Nilai Kappa Statistic = 0.686 d. Precision 329 𝑁𝑖𝑙𝑎𝑖 𝑃𝑟𝑒𝑐𝑖𝑠𝑖𝑜𝑛 = = 0,81 329 + 77 e. Recall 329 𝑁𝑖𝑙𝑎𝑖 𝑅𝑒𝑐𝑎𝑙𝑙 = = 0,87 329 + 49 f. Classification report table Tabel 4. Penjelasan Confusion matrix fitur Histogram precision recall f1-score support 0 0.89 0.80 0.84 406 1 0.80 0.89 0.85 378 Accuracy 0.84 784 Macro avg 0.85 0.84 0.84 784 Weighted avg 0.85 0.84 0.84 784 3.2 Fiture Bentuk a. Akurasi Akurasi yang didapat dengan algoritma Random Forest adalah 0,834387 b. Confusion matrix Tabel 5. Confusion matrix fitur Histogram benign malignant benign 276 130 malignant 167 211 implie Vol. 11, No. 2, Juli 2021 143 Klasifikasi Kanker Kulit Menggunakan Algoritma Random Forest Penjelasan confusion matrix, antara lain : Tabel 6. Penjelasan Confusion matrix fitur Histogram Jumlah Jenis kanker sebenarnya Prediksi Jenis Kanker Keterangan 276 benign benign Sesuai 167 benign malignant Tidak sesuai 130 malignant benign Tidak sesuai 211 malignant malignant sesuai - True Positif = jenis kanker sebenarnya dari 276 citra adalah benign dan prediksi jenis kanker juga benign (prediksi sesuai) - False Positif = jenis kanker sebenarnya dari 167 citra adalah benign dan prediksi jenis kanker adalah malignant (prediksi tidak sesuai) - False Negatif = jenis kanker sebenarnya dari 130 citra adalah malignant dan prediksi jenis kanker adalah benign (prediksi tidak sesuai) - True Negatif = jenis kanker sebenarnya dari 211 citra adalah malignant dan prediksi jenis kanker juga malignant (prediksi sesuai) c. Kappa Statistic Nilai Kappa Statistic = 0.246 d. Precision 276 𝑁𝑖𝑙𝑎𝑖 𝑃𝑟𝑒𝑐𝑖𝑠𝑖𝑜𝑛 = = 0,624 276 + 167 e. Recall 276 𝑁𝑖𝑙𝑎𝑖 𝑅𝑒𝑐𝑎𝑙𝑙 = = 0,679 276 + 130 f. Classification report table Tabel 7. Penjelasan Confusion matrix fitur Histogram precision recall f1-score support 0 0.62 0.69 0.66 406 1 0.63 0.55 0.59 378 Accuracy 0.62 784 Macro avg 0.63 0.62 0.62 784 Weighted avg 0.63 0.62 0.62 784 3.3 Fiture Tekstur a. Akurasi Akurasi yang didapat dengan algoritma Random Forest adalah 0,8425 b. Confusion matrix Tabel 8. Confusion matrix fitur Histogram benign malignant benign 79 5 malignant 24 71 144 Jurnal Ilmiah SISFOTENIKAJuly201xIJCCS Nurul Khasanah, Rachman Komarudin, Nurul Afni, Yana Iqbal Maulana, Agus Salim Penjelasan confusion matrix, antara lain : Tabel 9. Penjelasan Confusion matrix fitur Histogram Jumlah Jenis kanker sebenarnya Prediksi Jenis Kanker Keterangan 79 benign benign Sesuai 24 benign malignant Tidak sesuai 5 malignant benign Tidak sesuai 71 malignant malignant sesuai - True Positif = jenis kanker sebenarnya dari 79 citra adalah benign dan prediksi jenis kanker juga benign (prediksi sesuai) - False Positif = jenis kanker sebenarnya dari 24 citra adalah benign dan prediksi jenis kanker adalah malignant (prediksi tidak sesuai) - False Negatif = jenis kanker sebenarnya dari 5 citra adalah malignant dan prediksi jenis kanker adalah benign (prediksi tidak sesuai) - True Negatif = jenis kanker sebenarnya dari 71 citra adalah malignant dan prediksi jenis kanker juga malignant (prediksi sesuai) c. Kappa Statistic Nilai Kappa Statistic = 0.645 d. Precision 79 𝑁𝑖𝑙𝑎𝑖 𝑃𝑟𝑒𝑐𝑖𝑠𝑖𝑜𝑛 = = 0,766 79 + 24 e. Recall Nilai Recall = 0.916 79 𝑁𝑖𝑙𝑎𝑖 𝑅𝑒𝑐𝑎𝑙𝑙 = = 0,940 79 + 5 f. Classification report table Tabel 10. Penjelasan Confusion matrix fitur Histogram precision recall f1-score support 0 0.75 0.92 0.83 84 1 0.91 0.74 0.81 95 Accuracy 0.82 179 Macro avg 0.83 0.83 0.82 179 Weighted avg 0.84 0.82 0.82 179 4. KESIMPULAN Dari penelitian ini, telah dilakukan beberapa tahapan penelitian, yaitu : akuisisi data, preprocessing, ekstraksi fitur, klasifikasi, evaluasi dan hasil. Proses ekstraksi fitur yang digunakan, antara lain : histogram, haralick dan hue moments. Algoritma klasifikasi yang digunakan adalah Random Forest. Dari penerapan ketiga ekstraksi fitur dalam algoritma yang digunakan, didapat hasil yang berbeda-beda. Hasil perhitungan menggunakan ekstraksi fitur histogram menghasilkan akurasi 0,834, sedangkan menggunakan ekstraksi fitur haralick menghasilkan akurasi 0,619, sedangkan menggunakan ekstraksi fitur hue moments menghasilkan implie Vol. 11, No. 2, Juli 2021 145 Klasifikasi Kanker Kulit Menggunakan Algoritma Random Forest akurasi 0,842. Dari ketiga ekstraksi fitur yang digunakan, dapat disimpulkan bahwa hasil akurasi terbaik diperoleh dengan ekstraksi fitur hue moments dengan nilai akurasi 0,842. Novelty dari penelitian ini adalah penggunakan ekstraksi fitur yang lebih beragam dan hasil akurasi yang lebih baik dari penelitian sebelumnya. Namun kekurangan dari penelitian ini yaitu belum adanya aplikasi yang berisi penerapan algoritma, sehingga hasil tidak bisa langsung diterapkan pada dunia medis. 5. SARAN Saran-saran untuk untuk penelitian lebih lanjut untuk menutup kekurangan penelitian ini. Penelitian selanjutnya diharapkan menggunakan algoritma deep learning dengan arsitektur CNN (Convolutional Neural Network) untuk mendapatkan hasil akurasi yang lebih baik. Selain itu, penelitian selanjutnya ditambahkan rancangan aplikasi untuk penerapan model yang telah dibentuk dalam penelitian sehingga bisa langsung diterapkan oleh tim medis. DAFTAR PUSTAKA [1]. Adjed, F., Faye, I., Ababsa, F., Gardezi, S. J., & Dass, S. C. (2016). Classification of Skin Cancer Images Using Local Binary Pattern and SVM Classifier. AIP Conference Proceedings, 1787. https://doi.org/10.1063/1.4968145 [2]. Buljan, M., Bulat, V., Situm, M., Mihic, L. L., & Stanic, S. (2008). Variation in Clinical Presentation of Basal Cell Carcinoma. Acta Clin Croat, 47(1), 25–30. [3]. Faruk, M., & Nafi’iyah, N. (2020). Klasifikasi Kanker Kulit Berdasarkan Fitur Tekstur, Fitur Warna Citra Menggunakan SVM dan KNN. Telematika, 13(2), 100–109. [4]. Fibrianda, M. F., & Bhawiyuga, A. (2018). Analisis Perbandingan Akurasi Deteksi Serangan Pada Jaringan Komputer Dengan Metode Naïve Bayes Dan Support Vector Machine (SVM). Jurnal Pengembangan Teknologi Informasi Dan Ilmu Komputer, 2(9), 3112–3123. [5]. Firasari, E., Khasanah, N., Khultsum, U., Kholifah, D. N., Komarudin, R., & Widyastuty, W. (2020). Comparation of K-Nearest Neighboor (K-NN) and Naive Bayes Algorithm for the Classification of the Poor in Recipients of Social Assistance. Journal of Physics: Conference Series, 1641(1), 1–6. [6]. Iyatomi, H., Celebi, M. E., Schaefer, G., & Tanaka, M. (2011). Automated color calibration method for dermoscopy images. Computerized Medical Imaging and Graphics, 35(2), 89– 98. Retrieved from http://dx.doi.org/10.1016/j.compmedimag.2010.08.003 [7]. Lynn, N. C., & Kyu, Z. M. (2018). Segmentation and Classification of Skin Cancer Melanoma from Skin Lesion Images. Parallel and Distributed Computing, Applications and Technologies, PDCAT Proceedings, 2017-Decem, 117–122. https://doi.org/10.1109/PDCAT.2017.00028 [8]. Madhulatha, T. S. (2012). An Overview On Clustering Methods. IOSR Journal of Engineering, 2(4), 719–725. [9]. Mandels, R. J., & Calvin, L. (2014). Tingkat Akurasi Kodefikasi Morbiditas Rawat Inap Guna Menunjang Akurasi Pelaporan Di Bagian Rekam Medis Rumah Sakit Cahya Kawaluyan. Jurnal Kesehatan “Caring and Enthusiasm,” 2(1). [10]. Martin, M., & Nilawati, L. (2019). Recall dan Precision Pada Sistem Temu Kembali Informasi Online Public Access Catalogue (OPAC) di Perpustakaan. Paradigma - Jurnal Komputer Dan Informatika, 21(1), 77–84. [11]. Maskur, & Andriansyah, F. R. (2015). Implementasi Web Semantik Untuk Aplikasi Pencarian Tugas Akhir Menggunakan Ontologi Dan Cosine Similarity. Jurnal Ilmiah NERO, 2(1), 11–18. [12]. Priambodo, H. S., Sari, Y. A., & Widodo, A. W. (2019). Klasifikasi Jenis Citra Makanan 146 Jurnal Ilmiah SISFOTENIKAJuly201xIJCCS Nurul Khasanah, Rachman Komarudin, Nurul Afni, Yana Iqbal Maulana, Agus Salim menggunakan Color Histogram dan Gray Level Co-occurrence Matrix dengan K-Nearest Neighbour. Jurnal Pengembangan Teknologi Informasi Dan Ilmu Komputer, 3(7), 6873– 6880. [13]. Seeja, R. D., & Suresh, A. (2019). Melanoma Segmentation and Classification using Deep Learning. (12). https://doi.org/10.35940/ijitee.L2516.1081219 [14]. Telaumbanua, F. D., Hulu, P., Nadeak, T. Z., Lumbantong, R. R., & Dharma, A. (2019). Penggunaan Machine Learning Di Bidang Kesehatan. Jurnal Penelitian Teknik Informatika, 2(2), 391–399. [15]. Wilvestra, S., Lestari, S., & Asri, E. (2018). Studi Retrospektif Kanker Kulit di Poliklinik Ilmu Kesehatan Kulit dan Kelamin RS Dr. M. Djamil Padang Periode Tahun 2015-2017. Jurnal Kesehatan Andalas, 7(3), 47–49. implie Vol. 11, No. 2, Juli 2021 147

References (16)

Adjed, F., Faye, I., Ababsa, F., Gardezi, S. J., & Dass, S. C. (2016). Classification of Skin Cancer Images Using Local Binary Pattern and SVM Classifier. AIP Conference Proceedings, 1787. https://doi.org/10.1063/1.4968145
Buljan, M., Bulat, V., Situm, M., Mihic, L. L., & Stanic, S. (2008). Variation in Clinical Presentation of Basal Cell Carcinoma. Acta Clin Croat, 47(1), 25-30.
Faruk, M., & Nafi'iyah, N. (2020). Klasifikasi Kanker Kulit Berdasarkan Fitur Tekstur, Fitur Warna Citra Menggunakan SVM dan KNN. Telematika, 13(2), 100-109.
Fibrianda, M. F., & Bhawiyuga, A. (2018). Analisis Perbandingan Akurasi Deteksi Serangan Pada Jaringan Komputer Dengan Metode Naïve Bayes Dan Support Vector Machine (SVM). Jurnal Pengembangan Teknologi Informasi Dan Ilmu Komputer, 2(9), 3112-3123.
Firasari, E., Khasanah, N., Khultsum, U., Kholifah, D. N., Komarudin, R., & Widyastuty, W. (2020). Comparation of K-Nearest Neighboor (K-NN) and Naive Bayes Algorithm for the Classification of the Poor in Recipients of Social Assistance. Journal of Physics: Conference Series, 1641(1), 1-6.
Iyatomi, H., Celebi, M. E., Schaefer, G., & Tanaka, M. (2011). Automated color calibration method for dermoscopy images. Computerized Medical Imaging and Graphics, 35(2), 89- 98. Retrieved from http://dx.doi.org/10.1016/j.compmedimag.2010.08.003
Lynn, N. C., & Kyu, Z. M. (2018). Segmentation and Classification of Skin Cancer Melanoma from Skin Lesion Images. Parallel and Distributed Computing, Applications and Technologies, PDCAT Proceedings, 2017-Decem, 117-122. https://doi.org/10.1109/PDCAT.2017.00028
Madhulatha, T. S. (2012). An Overview On Clustering Methods. IOSR Journal of Engineering, 2(4), 719-725.
Mandels, R. J., & Calvin, L. (2014). Tingkat Akurasi Kodefikasi Morbiditas Rawat Inap Guna Menunjang Akurasi Pelaporan Di Bagian Rekam Medis Rumah Sakit Cahya Kawaluyan. Jurnal Kesehatan "Caring and Enthusiasm," 2(1).
Martin, M., & Nilawati, L. (2019). Recall dan Precision Pada Sistem Temu Kembali Informasi Online Public Access Catalogue (OPAC) di Perpustakaan. Paradigma -Jurnal Komputer Dan Informatika, 21(1), 77-84.
Maskur, & Andriansyah, F. R. (2015). Implementasi Web Semantik Untuk Aplikasi Pencarian Tugas Akhir Menggunakan Ontologi Dan Cosine Similarity. Jurnal Ilmiah NERO, 2(1), 11-18.
Priambodo, H. S., Sari, Y. A., & Widodo, A. W. (2019). Klasifikasi Jenis Citra Makanan Nurul Khasanah, Rachman Komarudin, Nurul Afni, Yana Iqbal Maulana, Agus Salim implie Vol. 11, No. 2, Juli 2021 147
menggunakan Color Histogram dan Gray Level Co-occurrence Matrix dengan K-Nearest Neighbour. Jurnal Pengembangan Teknologi Informasi Dan Ilmu Komputer, 3(7), 6873- 6880.
Seeja, R. D., & Suresh, A. (2019). Melanoma Segmentation and Classification using Deep Learning. (12). https://doi.org/10.35940/ijitee.L2516.1081219
Telaumbanua, F. D., Hulu, P., Nadeak, T. Z., Lumbantong, R. R., & Dharma, A. (2019). Penggunaan Machine Learning Di Bidang Kesehatan. Jurnal Penelitian Teknik Informatika, 2(2), 391-399.
Wilvestra, S., Lestari, S., & Asri, E. (2018). Studi Retrospektif Kanker Kulit di Poliklinik Ilmu Kesehatan Kulit dan Kelamin RS Dr. M. Djamil Padang Periode Tahun 2015-2017. Jurnal Kesehatan Andalas, 7(3), 47-49.

About the author

Nurul Khasanah

Papers

View all papers from Nurul Khasanaharrow_forward

Skin Cancer Classification Using Random Forest Algorithm

Sign up for access to the world's latest research

Abstract

Related papers

References (16)

Related papers

Related topics