Sistem Deteksi Plagiarisme Dokumen Digital

Sistem Deteksi Dini Plagiarisme Dokumen Digital – Persoalan dalam pengurangan terjadinya plagiarisme dapat dikelompokkan ke dalam pencegahan dan pendeteksian. Deteksi plagiarisme sangat erat dengan persoalan komputasi. Salah satu metode yang banyak digunakan adalah pengujian kemiripan dokumen dengan menggunakan matriks (Lukashenko et al., 2007). Sementara itu Lee et al., (2005) mengungkapkan bahwa dengan menggunakan wordbased n-gram dan latent semantic analysis (LSA) menghasilkan performance yang mendekati dengan proses yang dilakukan oleh manusia.

Sistem Deteksi Plagiarisme

Sistem Deteksi Plagiarisme

Pendekatan dalam deteksi plagiarisme dengan cara menggunakan algoritma Smith-Waterman dilakukan oleh Ota dan Masuyama (2009) yang dilakukan dengan melakukan pengujian pada beberapa paper menunjukkan bahwa algoritma yang digunakan dapat mendeteksi secara cepat adanya plagiarisme antar paper dalam sebuah jurnal meskipun algoritma tersebut merupakan algoritma yang awalnya digunakan untuk mendeteksi adanya kemiripan antara bagian-bagian dalam dua molekul.

Also Read: 5 Aplikasi Untuk Merubah Tampilan Hp Android Seperti IOS

Disamping penggunaan metode perbandingan kemiripan dokumen, Pataki (2006) melakukan penelitian tentang penggunaan style marker yang dapat digunakan untuk mendeteksi adanya potensi plagiarisme melalui pola perubahan style kalimat yang diplagiat. Metode ini menggunakan algoritma yang diusulkan oleh Csernoch Mária. Dengan penggunaan algoritma ini dimungkinkan adanya penambahan metode deteksi plagiarisme dari metode konvensional yang biasa dilakukan.

Untuk mendeteksi adanya word insertion dan structure changing, Ceska (2008) melakukan penelitian dengan menggunakan pendekatan natural language processing dan latent semantic analysis yang memberikan hasil cukup baik dalam mendeteksi 2 model plagiarism tersebut.

Penelitian dalam information retrieval yang memanfaatkan vector space sebagai deteksi plagiarime pernah dilakukan oleh Rehurek (2008). Aplikasi yang dihasilkan diujicobakan pada digital library. Pendekatan yang dilakukan mampu mengidentifikasi terjadinya plagiarisme dalam domain koleksi dokumen matematika.

Penggunaan feature based neural netword yang disertai dengan metode training pada dokumen sejenis menghasilkan kemampuan dalam mendeteksi adanya kemiripan dokumen yang tidak berbeda nyata dibandingkan dengan metode lain(vector space model) dan natural language processing(Angels et al., 2007).

Dalam penelitian yang berbeda yang merupakan bagian dari proses deteksi plagiarisme, menurut Andriani et al., (2007), stemming merupakan proses menghilangkan imbuhan kata untuk mendapatkan kata dasar. Penelitian yang dilakukan menghasilkan sebuah algoritma Confix-Stripping(CS) yang diterapkan pada Bahasa Indonesia. Sementara itu Jelita et al., (2005) mengungkapkan bahwa perbaikan algoritma yang dilakukan pada beberapa penelitian mengenai algoritma stemming Bahasa Indonesia sebelumnya(Algoritma dari Nazief dan Andriani, Algoritma Arifin dan Setiono, Algoritma Vega, Algoritma Sembok dan kawan-kawan.

Vector Space Model(VSM) adalah salah satu teknik untuk mendapatkan hasil yang relevan pada pencarian dokumen. Dengan teknik ini dokumen dipetakan menjadi vector space. Tingkat kemiripan dokumen ditentukan dari nilai perhitungan kemiripan(Grossman and Frieder, 2004). Menurut Baeza-Yates dan Ribeiro-Neto (1999) dinyatakan bahwa model ini sangat populer sampai saat ini karena kemudahan dan kecepatannya. Pembobotan dilakukan untuk memperoleh rangking dari dokumen hasil pencarian. Bartell et all (2002) menyatakan bahwa rangking hasil pencarian dari dokumen di dalam sistem temu-kembali informasi berbasis teks dengan model VSM dapat mengurutkan dokumen-dokumen tersebut dari yang paling relevan sampai dengan yang agak relevan berdasarkan masukan kata kunci dari pengguna. Salton dan Buckley (1987) juga menyarankan penggunaan dari pembobotan indeks dalam melakukan pengurutan dokumen.

Stemming adalah inti dari teknik proses pengolahan bahasa alami untuk memperoleh kembali informasi secara efisiens dan efektif (Grossman and Frieder, 2004). Stemming sangat penting untuk mendukung perolehan Informasi secara efektif, dan telah digunakan pada aplikasi penerjemahan dan pencarian dalam web. Tidak seperti Bahasa Inggris, dalam bahasa Indonesia memiliki imbuhan yang lebih kompleks yang meliputi awalan, akhiran, sisipan dan gabungan awalan dan akhiran yang harus dipisahkan dari kata dasar aplikasi dan permintaan rule digunakan untuk mengimplementasikannya membutuhkan pertimbangan yang seksama (Jelita et al. 2005)

Sistem Deteksi Dini PlagiarismeSistem Deteksi Plagiarisme
Sistem Deteksi Plagiarisme Dokumen Digital | Admin | 4.5