Kurniawan, Alvin (2024) Penerapan Metode K-Means Clustering Untuk Pengelompokan Judul Skripsi Mahasiswa (Studi Kasus : STMIK Widya Cipta Dharma). S1 Teknik Informatika thesis, STMIK Widya Cipta Dharma.
Text
1943905-S1-JURNAL.pdf Download (582kB) |
|
Text
1943905-S1-TEKNIK INFORMATIKA.pdf Restricted to Repository staff only Download (2MB) | Request a copy |
Abstract
Perkembangan teknologi sudah berkembang begitu pesat, sehingga perkembangan teknologi saat ini menyebabkan ledakan jumlah dokumen elektronik/softcopy yang akan tersimpan di dalam sebuah penyimpanan perpustakaan STMIK Widya Cipta Dharma. Sehingga K-Means Clustering akan digunakan sebagai alat untuk mengelompokkan judul skripsi mahasiswa berdasarkan kesamaan topik atau subjek. Begitu juga karena K-Means dikenal sebagai metode clustering yang efisien, maka K-Means menjadi metode yang diperhitungkan dalam melakukan proses clustering. Metode yang digunakan meliputi langkah-langkah pre-processing teks untuk membersihkan dan mempersiapkan data judul skripsi, penghitungan nilai TF-IDF (Term Frequency-Inverse Document Frequency) untuk mewakili setiap judul skripsi sebagai vektor fitur, dan penerapan algoritma K-Means Clustering untuk mengelompokkan judul skripsi ke dalam cluster-cluster yang berbeda berdasarkan kesamaan tematik. Berdasarkan hasil uji coba yang telah dilakukan dapat diambil kesimpulan bahwa penerapan metode K-Means Clustering dalam pengelompokan dokumen skripsi di STMIK Widya Cipta Dharma dapat diterapkan namun kurang optimal karena kurang penggunaan metode Elbow atau metode Cosine similarity sehingga scatter tidak mendapatkan gambaran dalam mengelompokkan secara sempurna. Percobaan yang dilakukan menggunakan nilai K=3 yang dimana hasil pada cluster 1 mempunyai data sebanyak 21 items, cluster 2 mempunyai data sebanyak 40 items, dan pada cluster 3 mempunyai data sebanyak 5 items. =========================================================== The advancement of technology has progressed so rapidly that the current technological development has led to an explosion in the number of electronic documents/softcopies that need to be stored in the STMIK Widya Cipta Dharma library. Thus, K-Means Clustering will be used as a tool to group student thesis titles based on similarities in topics or subjects. Because K-Means is known as an efficient clustering method, it is considered a viable method for the clustering process. The methodology includes steps such as text pre-processing to clean and prepare thesis title data, calculating TF-IDF (Term Frequency-Inverse Document Frequency) values to represent each thesis title as a feature vector, and applying the K-Means Clustering algorithm to group thesis titles into different clusters based on thematic similarities. Based on the trials conducted, it can be concluded that the application of the K-Means Clustering method for grouping thesis documents at STMIK Widya Cipta Dharma can be implemented, but it is not optimal due to the lack of using the Elbow Method or Cosine similarity Method, resulting in a scatter that does not provide a perfect grouping. The experiment used a value of K=3, where the results showed that Cluster 1 contained 21 items, Cluster 2 contained 40 items, and Cluster 3 contained 5 items.
Item Type: | Thesis (S1 Teknik Informatika) |
---|---|
Additional Information: | Pembimbing 1 : Eka Arriyanti, S.Pd., M.Kom., I.G. Pembimbing 2 : Siti Lailiyah, S.Kom., M.Kom. |
Uncontrolled Keywords: | K-Means Clustering, pengelompokan judul skripsi, TF-IDF, STMIK Widya Cipta Dharma, sistem informasi perpustakaan |
Subjects: | Q Science > QA Mathematics > QA76 Computer software |
Divisions: | Teknik Informatika |
Depositing User: | Mr Alvin Kurniawan |
Date Deposited: | 05 Aug 2024 02:01 |
Last Modified: | 05 Aug 2024 02:01 |
URI: | http://repository.wicida.ac.id/id/eprint/5424 |
Actions (login required)
View Item |