PEMILIHAN KALIMAT REPRESENTATIF DENGAN PENGINTEGRASIAN FUZZY C-MEANS CLUSTERING DAN TOPSIS (FCM-TOPSIS) UNTUK PERINGKASAN DOKUMEN

Christian S.K. Aditya

Abstract


Dokumen teks merupakan sumber informasi yang sangat dibutuhkan, namun koleksi dokumen dalam jumlah besar dapat memberikan dampak negatif bagi pengguna yang mana membutuhkan waktu relatif lama untuk memilah informasi yang sesuai dengan kebutuhan mereka. Dibutuhkan sistem yang mampu membantu pengguna untuk menghasilkan sebuah ringkasan dengan cara membangun sistem peringkasan dokumen otomatis. Pada penelitian ini diusulkan sebuah rancangan metode baru peringkasan dengan pendekatan clustering yang dilanjutkan dengan pemilihan kalimat representatif sebagai perwakilan atau ringkasan dari sebuah dokumen. Algoritma clustering Fuzzy C-Means (FCM) digunakan untuk mengelompokkan sejumlah kalimat kedalam beberapa cluster. Tiap data atau kalimat memiliki derajat keanggotaan pada masing-masing cluster antara 0-1 yang diukur melalui fungsi objektif. Pada FCM ini fungsi objektif diminimumkan menggunakan iterasi yang biasanya terjebak dalam optimum lokal. Selanjutnya proses pemilihan kalimat representatif sebagai kandidat ringkasan dalam suatu cluster menggunakan metode Technique For Others Reference by Similarity to Ideal Solution (TOPSIS) untuk mendapatkan kalimat yang memiliki kedekatan relatif dari suatu alternatif dengan solusi optimal. Pengukuran hasil peringkasan otomatis yang digunakan pada penelitian ini menggunakan metode ROUGE. Semakin banyak jumlah kalimat yang terambil oleh sistem dalam menyusun ringkasan, semakin besar kemungkinan term atau kata yang muncul bersama pada groundtruth. Hal ini dibuktikan dengan meningkatnya nilai rata-rata ROUGE, nilai rata-rata ROUGE tertinggi didapatkan pada n = 20 dengan nilai 0.640.

Keywords


Peringkasan, Dokumen, Fuzzy C-Means, TOPSIS, Clustering, Teks

Full Text:

PDF

References


R. M. Alguliev, R. M. Aliguliyev, and N. R. Isazade, "Multiple documents summarization based on evolutionary optimization algorithm", Expert Syst. Appl., vol. 40, no. 5, pp. 1675–1689, 2013.

R. Azhar, M. Machmud, H. A. Hartanto, and A. Z. Arifin, "Pembobotan Kata Berdasarkan Klaster pada Optimisasi Coverage, Diversity dan Coherence untuk Peringkasan Multi Dokumen", ITS., vol. 2, 2016.

Aristoteles, H. Y., Ridha, A., & Julio, A. (2012). ext Feature Weighting for Summarization of Documents in Bahasa Indonesia Using Genetic Algoritm. International Journal of Science Issues. IJCSI, 1694-0814.

El-Ghannam, F., & El-Shishtawy, T. (2014). Multi-Topic Multi-Document Summarizer. arXiv preprint arXiv:1401.0640.

D. Das and A. F. T. Martin, A Survey on Automatic Text Summarization, Language Technologies Institute, Carnegie Mellon University, 2007.

H. P. Luhn, "The automatic creation of literature abstracts.," IBM Journal of Research Development, vol. 2, no. 2, pp. 159-165, 1958.

P. Baxendale, "Machine-made index for technical literature - an experiment," IBM Journal of Research Development, vol. 2, no. 4, pp. 354-361, 1958.

Sarkar, K. 2009. Sentence Clustering-based Summarization of Multiple Text Documents. International Journal of Computing Science and Communication Technologies, vol. II, no. 1.

Nădăban, Sorin, Simona Dzitac, and Ioan Dzitac. "Fuzzy topsis: A general view." Procedia Computer Science 91 (2016): 823-831.




DOI: https://doi.org/10.22219/sentra.v0i6.3924

Refbacks

  • There are currently no refbacks.


Seketariat

Fakultas Teknik

Universitas Muhammadiyah Malang Kampus III

Jl. Raya Tlogomas 246 Malang, 65144