Clustering Citra Sertifikat Prestasi Berdasarkan Kemiripan Visual Menggunakan SIFT dan DBSCAN
Abstract
Proses verifikasi dokumen sertifikat pada jalur Seleksi Nasional Berdasarkan Prestasi (SNBP) umumnya masih dilakukan secara manual, sehingga memerlukan waktu yang lama dan berpotensi menimbulkan ketidakkonsistenan dalam penilaian. Penelitian ini bertujuan untuk mengelompokkan citra sertifikat prestasi berdasarkan kemiripan visual guna mempermudah identifikasi pola desain yang serupa. Pendekatan yang digunakan melibatkan ekstraksi fitur visual dengan metode Scale Invariant Feature Transform (SIFT) yang mampu mengenali ciri lokal citra secara stabil terhadap perubahan rotasi, pencahayaan, dan skala. Hasil ekstraksi kemudian direduksi dimensinya menggunakan Principal Component Analysis (PCA) untuk memperoleh representasi yang lebih ringkas, sebelum dilakukan pengelompokan menggunakan algoritma Density Based Spatial Clustering of Applications with Noise (DBSCAN). Eksperimen dilakukan terhadap sekitar 7.000 citra sertifikat dalam berbagai format digital, yaitu JPG, PNG, dan PDF. Hasil pengelompokan menunjukkan terbentuknya sekitar 33 klaster utama dengan sejumlah citra yang dikategorikan sebagai outlier. Visualisasi memperlihatkan distribusi citra yang membentuk kelompok padat sesuai kemiripan elemen visual seperti logo, cap, dan tata letak teks. Hasil yang diharapkan dapat menjadi dasar bagi penelitian lanjutan dalam identifikasi kredibilitas sertifikat berbasis analisis pola visual secara otomatis.