Penerapan Metode Rule Base Approach Untuk Stemming Teks Ensiklopedia Bahasa Sasak

Authors

  • Ramli Ahmad Universitas Hamzanwadi
  • L. M. Samsu Universitas Hamzanwadi
  • Muhammad Saiful Universitas Hamzanwadi
  • Imam Fathurrahman Universitas Hamzanwadi

DOI:

https://doi.org/10.29408/jprinter.v3i1.30959

Keywords:

Bahasa Sasak,Ensiklopedia,Rule Base Approach,Stemming

Abstract

Suku Sasak adalah salah satu suku Bangsa Indonesia yang mayoritasnya berada di Pulau Lombok, bahasa yang digunakan adalah Bahasa Sasak dengan pedoman tiga tingkatan sor-singgih (tigang soroh) yaitu Basa Kasar, Basa Madia dan Basa Alus. Bahasa Sasak juga memiliki imbuhan pangater, seselan dan pangiring. Untuk memudahkan pencarian kata dasar dalam Bahasa Sasak perlu dilakukan proses stemming. Stemming adalah proses pemetaan dan penguraian bentuk dari suatu kata menjadi bentuk dasarnya. Proses stemming sangat penting didalam proses information retrieval system. Pada penelitian ini, dalam melakukan proses stemming Bahasa Sasak menggunakan metode Rule Base Approach. Data yang digunakan dalam penelitian ini adalah kata dasar dalam Bahasa Sasak sebanyak 376 kata dasar. Penelitian ini bertujuan untuk merancang aplikasi stemming yang tepat untuk melakukan stemming Bahasa Sasak. Tahap awal dalam proses stemming Bahasa Sasak adalah melakukan proses input, preprocessing, filtering, case folding dan tokenisasi. Masing-masing kata dilakukan proses stemming untuk menghilangkan imbuhan pangater, seselan, dan pangiring. Hasil dari penelitian menyatakan bahwa metode Rule Base Approach dapat digunakan untuk melakukan stemming teks Bahasa Sasak, hal ini dapat dilihat dari hasil akurasi mencapai angka 77.82%. Tentunya dalam pengujian masih terdapat kegagalan yang disebabkan oleh kesalahan overstemming akibat dari proses stemming.

References

[1] Pk Austin, “Tense, Aspect, Mood And Evidentiality In Sasak, Eastern Indonesiaa,” 2013

[2] Wilian, “Speaking Levels In Sasak And Javanese,” 2006.

[3] Dwi Hartina Iriani, "Using Of Sasak Language In Terune-Dedares As A Regional Identity In Mataram And Their Effect On The Maintenance Of Sasak Language".

[4]. Penelitian Saiful M, Samsu LM, Fathurrahman I. (2020) Perancangan Kerangka Crowdsourcing Berbasis Wisdom Of Crowds Untuk Kamus Naskah Lontar (Takepan) Sasak Online. Vol. 3, No. 2, Pp. 82–90, 2020.

[5]. Afuan, L. 2013. Stemming Dokumen Teks Bahasa Indonesia Menggunakan Algoritma Porter, Jurnal Telematika Vol.6, 34-40, Jurnal Telematika

[6]. Amin, F., & Alfa Razaq, J. 2018, Implementasi Stemmer Bahasa Jawa dengan Metode Rule Base Approach pada Sistem Temu Kembali Informasi Dokumen Teks Berbahasa Jawa, Prosiding SENDI_U, 199–206, ISBN: 978-979-3649-99-3.

[7]. Feldman, R., & Sanger. J. 2007, Text Mining Handbook: Advanced Approaches in Analyzing Unstructured Data, Cambridge University Press, New York.

[8]. Gupta, V., & Lehal, G. S. 2009, A Survey of Text Mining Techniques and Applications, Journal of Emerging Technologies in Web Intelligence, 1 (1), 60–76. https://doi.org/10.4304/jetwi.1.1.60-76.

[9]. Guterres, A., Gunawan, & Santoso, J. 2019, Stemming Bahasa Tetun Menggunakan Pendekatan Rule Based, Teknika, 8(2), 142–147.

[10]. Husain, M.S. 2012, An Unsupervised Approach to Develop Stemmer, Vol. 1(2), pp.15–23. International Journal on Natural Language Computing (IJNLC).

[11]. Ramasubramanian, C., & Ramya, R. 2013, Effective Pre-Processing Activities in Text Mining using Improved Porter’s Stemming Algorithm, International Journal of Advanced Research in Computer and Communication Engineering, 2(12), 4536–4538. www.ijarcce.com

[12]. Roshdi, A., & Roohparvar, A. 2015, Review: Information Retrieval Techniques and Applications, International Journal of Computer Networks and Communications Security, 3(9), 373-377

[13]. Sharma, D. 2012, Stemming Algorithms: A Comparative Study and their Analysis. Vol 4 (3), 2249-0868. International Journal of Applied Information Systems (IJAIS). www.ijais.org.

Downloads

Published

30-06-2025