Kartika, Amalia (2025) Analisis Pola Kejahatan di Indonesia Melalui Ekstraksi Entitas Berita Kriminal Menggunakan Support Vector Machine dan IndoBERT - Submit Jurnal. Bachelor thesis, Institut Teknologi Kalimantan.
![]() |
Text
11211010_cover.pdf Restricted to Repository staff only until 4 January 2027. Download (145kB) | Request a copy |
![]() |
Text
11211010_cover.pdf Restricted to Repository staff only until 4 January 2027. Download (145kB) | Request a copy |
![]() |
Text
11211010_statement_of_authenticity.pdf Restricted to Repository staff only until 4 January 2027. Download (211kB) | Request a copy |
![]() |
Text
11211010_publishing_agreement.pdf Restricted to Repository staff only until 4 January 2027. Download (107kB) | Request a copy |
![]() |
Text
11211010_approval_sheet.pdf Restricted to Repository staff only until 4 January 2027. Download (223kB) | Request a copy |
![]() |
Text
11211010_preface.pdf Restricted to Repository staff only until 4 January 2027. Download (205kB) | Request a copy |
![]() |
Text
11211010_abstract_id.pdf Restricted to Repository staff only until 4 January 2027. Download (109kB) | Request a copy |
![]() |
Text
11211010_abstract_en.pdf Restricted to Repository staff only until 4 January 2027. Download (109kB) | Request a copy |
![]() |
Text
11211010_table_of_content.pdf Restricted to Repository staff only until 4 January 2027. Download (234kB) | Request a copy |
![]() |
Text
11211010_illustrations.pdf Restricted to Repository staff only until 4 January 2027. Download (215kB) | Request a copy |
![]() |
Text
11211010_tables.pdf Restricted to Repository staff only until 4 January 2027. Download (436kB) | Request a copy |
![]() |
Text
11211010_chapter_1.pdf Restricted to Repository staff only until 4 January 2027. Download (320kB) | Request a copy |
![]() |
Text
11211010_chapter_2.pdf Restricted to Repository staff only until 4 January 2027. Download (608kB) | Request a copy |
![]() |
Text
11211010_chapter_3.pdf Restricted to Repository staff only until 4 January 2027. Download (334kB) | Request a copy |
![]() |
Text
11211010_chapter_4.pdf Restricted to Repository staff only until 4 January 2027. Download (1MB) | Request a copy |
![]() |
Text
11211010_conclusions.pdf Restricted to Repository staff only until 4 January 2027. Download (108kB) | Request a copy |
![]() |
Text
11211010_bibliography.pdf Restricted to Repository staff only until 4 January 2027. Download (353kB) | Request a copy |
![]() |
Text
11211010_enclosure.pdf Restricted to Repository staff only until 4 January 2027. Download (235kB) | Request a copy |
![]() |
Text
11211010_paper.pdf Restricted to Repository staff only until 4 January 2027. Download (1MB) | Request a copy |
![]() |
Text
11211010_presentation.pdf Restricted to Repository staff only until 4 January 2027. Download (926kB) | Request a copy |
![]() |
Text
11211010_Form. TA-020.pdf Restricted to Repository staff only until 4 January 2027. Download (161kB) | Request a copy |
Abstract
Analisis pola kriminal di Indonesia masih terkendala oleh keterlambatan publikasi data resmi dari BPS dan Polri. Sebagai alternatif, berita daring menyediakan informasi yang lebih aktual, meskipun proses ekstraksi manual dari teks berita tergolong sulit. Penelitian ini mengembangkan model ekstraksi informasi dari berita kriminal dengan menggabungkan model Support Vector Machine (SVM) untuk mengklasifikasikan kalimat yang mengandung informasi kejahatan dan yang tidak, serta model IndoBERT untuk mengekstraksi entitas jenis kejahatan, tanggal, dan lokasi kejadian. Dataset yang digunakan diperoleh dengan cara melakukan web scraping dari situs detik.com. Setelah dilakukan optimasi hyperparameter pada tahap modeling, hasil evaluasi menunjukkan bahwa model SVM dengan kernel linear memberikan hasil terbaik dalam klasifikasi kalimat, dengan akurasi sebesar 0.9987 dan nilai f1-score tertinggi untuk kalimat crime_scene sebesar 0.9975 dan kalimat not_crime_scene sebesar 0.9991. Model IndoBERT menunjukkan performa optimal pada nilai learning rate 1e-5, dengan nilai average precision sebesar 0.9664, average recall sebesar 0.9801, dan average f-measure sebesar 0.9731, mengungguli pendekatan rule-based yang masing-masing nilainya hanya mencapai 0.7388, 0.7852, dan 0.7527. Analisis pola menunjukkan dominasi kasus pencurian dan penipuan, dengan konsentrasi tinggi di wilayah Jawa Barat dan Jawa Timur, serta peningkatan jumlah kejadian pada awal dan akhir tahun. Visualisasi hasil dilakukan melalui dashboard menggunakan Google Looker Studio. Penelitian ini membuktikan bahwa kombinasi SVM dan IndoBERT efektif dalam mengekstrak informasi secara otomatis tanpa penyusunan aturan manual, sehingga menghemat waktu pemrosesan data skala besar dan menunjukkan potensi pemanfaatan berita daring sebagai sumber data alternatif untuk analisis kejahatan di Indonesia.
Item Type: | Thesis (Bachelor) |
---|---|
Subjects: | T Technology > T Technology (General) |
Divisions: | Jurusan Matematika dan Teknologi Informasi > Informatika |
Depositing User: | Amalia Kartika |
Date Deposited: | 09 Jul 2025 07:23 |
Last Modified: | 09 Jul 2025 07:23 |
URI: | http://repository.itk.ac.id/id/eprint/23369 |
Actions (login required)
![]() |
View Item |