Penerapan Algoritma K-Nearest Neighbors untuk Klasifikasi Fragmen Metagenom Berdasarkan Ekstraksi Fitur K-Mers

Ryan Ananda Nolly, Amanda Fitria, Kana Saputra S

Abstract


Penelitian di bidang metagenomika menjadi salah satu bidang kajian bioinformatika yang terus berkembang. Metagenom merupakan sebuah teknik yang bertujuan untuk mengumpulkan gen-gen yang diambil secara langsung dari lingkungan dan mengenalisis informasi genetika di dalamnya. Data yang diambil langsung dari lingkungan memungkinkan fragmen yang dihasilkan mengandung berbagai mikroorganisme, sehingga akan berakibat pada terjadinya kesalahan perakitan terhadap fragmen metagenom. Proses binning (pengelompokan) dapat dilakukan dengan dua pendekatan, yaitu pendekatan homologi dan pendekatan komposisi. Pendekatan secara komposisi tidak perlu membandingkan dan menyimpulkan setiap hasil pencarian pada setiap level taksonomi sehingga waktu yang diperlukan untuk pengelompokan lebih cepat dibandingkan dengan pendekatan secara homologi.Pada proses binning (pengelompokan) dengan pendekatan komposisi, teknik yang dilakukan adalah dengan supervised learning. Tujuan dari penelitian ini adalah untuk mengklasifikasi fragmen metagenom menggunakan algoritma KNN dan K-Mers sebagai ekstraksi fitur. Selain itu, untuk menghitung tingkat akurasi klasifikasi fragmen metagenom menggunakan confusion matrix. Metode K-Mers yang digunakan sebagai ekstraksi fitur bertujuan untuk mempartisi data dan membentuk satu atau lebih kelompok yang memiliki kesamaan, sehingga perhitungan untuk mencari tingkat akurasi menjadi lebih mudah didapatkan. Berdasarkan hasil pengujian yang dilakukan menunjukkan bahwa semakin rendah nilai K yang digunakanpada KNN maka semakin tinggi akurasi yang diperoleh. Pada pengujian ini diperoleh perhitungan akurasi sebesar 94,37% dimana nilai K untuk KNN adalah 3 dan nilai K untuk K-Mers adalah 3. Hasil klasifikasi fragmen metagenom menggunakan algoritma KNN berdasarkan ekstraksi fitur K-Mers dapat dilakukan dengan baik.


Keywords


klasifikasi, k-nearest neighbor, metagenom, ekstraksi fitur, k-mers.

Full Text:

PDF

References


Choiriyati, N., Arkeman, Y., & Kusuma, W. A. (2020). Deep learning model for metagenome fragment classification using spaced k-mers feature extraction. Jurnal Teknologi Dan Sistem Komputer, 8(3), 234–238. https://doi.org/10.14710/jtsiskom.2020.13407

Guritno, H. B., Haryanto, T., Kustiyo, A., & Hermadi, I. (2018). Optimasi Parameter pada Fast Correlation Based Filter Menggunakan Algoritma Genetika untuk Klasifikasi Metagenome. Jurnal Edukasi Dan Penelitian Informatika, 4(2), 76–83.

Liantoni, F. (2015). Klasifikasi Daun Dengan Perbaikan Fitur Citra Menggunakan Metode K-Nearest Neighbor. Jurnal ULTIMATICS, 7(2), 98–104. https://doi.org/10.31937/ti.v7i2.356

Manik, F. Y., Saputra S, K., & Br Ginting, D. S. (2020). Plant Classification Based on Extraction Feature Gray Level Co-Occurrence Matrix Using k-Nearest Neighbour. In Journal of Physics: Conference Series (Vol. 1566, pp. 1–9). https://doi.org/10.1088/1742-6596/1566/1/012107

Mutmainnah, U., Setiawan, B. D., & Dewi, C. (2019). Pengaruh Seleksi Fitur Information Gain pada K-Nearest Neighbor untuk Klasifikasi Tingkat Kelancaran Pembayaran Kredit Kendaraan. Jurnal Pengembangan Teknologi Informasi Dan Ilmu Komputer, 3(9), 8882–8888.

Nishom, M. (2019). Perbandingan Akurasi Euclidean Distance, Minkowski Distance, dan Manhattan Distance pada Algoritma K-Means Clustering berbasis Chi-Square. Jurnal Informatika: Jurnal Pengembangan IT, 4(1), 20–24. https://doi.org/10.30591/jpit.v4i1.1253

Pekuwali, A. A., Kusuma, W. A., & Buono, A. (2020). Seleksi Fitur Yang Berpengaruh Menggunakan Nilai Mean Pada Klasifikasi Fragmen Metagenome. Jurnal Komputer Dan Informatika, 8(1), 9–17. https://doi.org/10.35508/jicon.v8i1.2188

Prasetio, R. T., Rismayadi, A. A., & Anshori, I. F. (2018). Implementasi Algoritma Genetika pada k-nearest neighbours untuk Klasifikasi Kerusakan Tulang Belakang. Jurnal Informatika, 5(2), 186–194. https://doi.org/10.31311/ji.v5i2.4123

Richter, D. C., Ott, F., Auch, A. F., Schmid, R., & Huson, D. H. (2008). MetaSim - A sequencing simulator for genomics and metagenomics. PLoS ONE, 3(10). https://doi.org/10.1371/journal.pone.0003373

Ridok, A., & Latifah, R. (2015). Klasifikasi Teks Bahasa Indonesia Pada Corpus Tak Seimbang Menggunakan NWKNN. Konferensi Nasional Sistem Dan Informatika 2015, (Oktober), 222–227.

Salim, S. S., & Mayary, J. (2020). Analisis Sentimen Pengguna Twitter Terhadap Dompet Elektronik Dengan Metode Lexicon Based Dan K – Nearest Neighbor. Jurnal Ilmiah Informatika Komputer, 25(1), 1–17. https://doi.org/10.35760/ik.2020.v25i1.2411

Sari, R. (2020). Analisis Sentimen Pada Review Objek Wisata Dunia Fantasi Menggunakan Algoritma K-Nearest Neighbor (K-NN). EVOLUSI : Jurnal Sains Dan Manajemen, 8(1), 10–17. https://doi.org/10.31294/evolusi.v8i1.7371

Surianti, S. (2020). Classification Fragmen Metagenom Menggunakan Principal Component Analysis Neighbor. Jurnal Ilmiah Matrik, 22(2), 170–176. https://doi.org/10.33557/jurnalmatrik.v22i2.921

Syaljumairi, R., Defit, S., Sumijan, S., & Elda, Y. (2021). Akurasi Klasifikasi Pengguna terhadap Hotspot WiFi dengan Menggunakan Metode K-Nearest Neighbour. Jurnal Sistim Informasi Dan Teknologi, 3. https://doi.org/10.37034/jsisfotek.v3i3.152

Syarifuddin, F., Misdram, M., Widodo, A. A., Informatika, P. S., & Pasuruan, U. M. (2020). Klasifikasi Data Set Virus Corona Menggunakan Metode Naïve Bayes Classifier. Jurnal SPIRIT, 12(2), 46–52.

Utami, D. K., Kusuma, W. A., & Buono, A. (2017). Klasifikasi Metagenom dengan Metode Naïve Bayes Classifier. Jurnal Ilmu Komputer Dan Agri-Informatika, 3(1), 9–18. https://doi.org/10.29244/jika.3.1.9-17




DOI: http://dx.doi.org/10.30872/jim.v17i1.5779

Refbacks

  • There are currently no refbacks.


Copyright (c) 2023 Informatika Mulawarman : Jurnal Ilmiah Ilmu Komputer

Editor Informatika Mulawarman Address:
ISSN 1858-4853 (Print) | ISSN 2597-4963 (Online)

Published by: Mulawarman University
Managed by : Informatika Department
Jalan Sambaliung No.9 Sempaja Selatan Samarinda Utara,
Kalimantan Timur 75117
 - Indonesia
E-mail: jim.unmul@gmail.com
OJS: http://e-journals.unmul.ac.id/index.php/JIM
Contact Person: Gubtha Mahendra Putra

 Creative Commons License

Informatika Mulawarman by http://e-journals.unmul.ac.id/index.php/JIM/index is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.

Under the CC BY-SA license, authors and other users are able to reprint, distribute or use the material for commercial purposes so long as they give attribution to the journal Informatika Mulawarman and license the republished material under the same license.