Analisis Pola Kejahatan di Indonesia Melalui Ekstraksi Entitas Berita Kriminal Menggunakan Support Vector Machine dan IndoBERT - Submit Jurnal

Kartika, Amalia (2025) Analisis Pola Kejahatan di Indonesia Melalui Ekstraksi Entitas Berita Kriminal Menggunakan Support Vector Machine dan IndoBERT - Submit Jurnal. Bachelor thesis, Institut Teknologi Kalimantan.

[img] Text
11211010_cover.pdf
Restricted to Repository staff only until 4 January 2027.

Download (145kB) | Request a copy
[img] Text
11211010_cover.pdf
Restricted to Repository staff only until 4 January 2027.

Download (145kB) | Request a copy
[img] Text
11211010_statement_of_authenticity.pdf
Restricted to Repository staff only until 4 January 2027.

Download (211kB) | Request a copy
[img] Text
11211010_publishing_agreement.pdf
Restricted to Repository staff only until 4 January 2027.

Download (107kB) | Request a copy
[img] Text
11211010_approval_sheet.pdf
Restricted to Repository staff only until 4 January 2027.

Download (223kB) | Request a copy
[img] Text
11211010_preface.pdf
Restricted to Repository staff only until 4 January 2027.

Download (205kB) | Request a copy
[img] Text
11211010_abstract_id.pdf
Restricted to Repository staff only until 4 January 2027.

Download (109kB) | Request a copy
[img] Text
11211010_abstract_en.pdf
Restricted to Repository staff only until 4 January 2027.

Download (109kB) | Request a copy
[img] Text
11211010_table_of_content.pdf
Restricted to Repository staff only until 4 January 2027.

Download (234kB) | Request a copy
[img] Text
11211010_illustrations.pdf
Restricted to Repository staff only until 4 January 2027.

Download (215kB) | Request a copy
[img] Text
11211010_tables.pdf
Restricted to Repository staff only until 4 January 2027.

Download (436kB) | Request a copy
[img] Text
11211010_chapter_1.pdf
Restricted to Repository staff only until 4 January 2027.

Download (320kB) | Request a copy
[img] Text
11211010_chapter_2.pdf
Restricted to Repository staff only until 4 January 2027.

Download (608kB) | Request a copy
[img] Text
11211010_chapter_3.pdf
Restricted to Repository staff only until 4 January 2027.

Download (334kB) | Request a copy
[img] Text
11211010_chapter_4.pdf
Restricted to Repository staff only until 4 January 2027.

Download (1MB) | Request a copy
[img] Text
11211010_conclusions.pdf
Restricted to Repository staff only until 4 January 2027.

Download (108kB) | Request a copy
[img] Text
11211010_bibliography.pdf
Restricted to Repository staff only until 4 January 2027.

Download (353kB) | Request a copy
[img] Text
11211010_enclosure.pdf
Restricted to Repository staff only until 4 January 2027.

Download (235kB) | Request a copy
[img] Text
11211010_paper.pdf
Restricted to Repository staff only until 4 January 2027.

Download (1MB) | Request a copy
[img] Text
11211010_presentation.pdf
Restricted to Repository staff only until 4 January 2027.

Download (926kB) | Request a copy
[img] Text
11211010_Form. TA-020.pdf
Restricted to Repository staff only until 4 January 2027.

Download (161kB) | Request a copy

Abstract

Analisis pola kriminal di Indonesia masih terkendala oleh keterlambatan publikasi data resmi dari BPS dan Polri. Sebagai alternatif, berita daring menyediakan informasi yang lebih aktual, meskipun proses ekstraksi manual dari teks berita tergolong sulit. Penelitian ini mengembangkan model ekstraksi informasi dari berita kriminal dengan menggabungkan model Support Vector Machine (SVM) untuk mengklasifikasikan kalimat yang mengandung informasi kejahatan dan yang tidak, serta model IndoBERT untuk mengekstraksi entitas jenis kejahatan, tanggal, dan lokasi kejadian. Dataset yang digunakan diperoleh dengan cara melakukan web scraping dari situs detik.com. Setelah dilakukan optimasi hyperparameter pada tahap modeling, hasil evaluasi menunjukkan bahwa model SVM dengan kernel linear memberikan hasil terbaik dalam klasifikasi kalimat, dengan akurasi sebesar 0.9987 dan nilai f1-score tertinggi untuk kalimat crime_scene sebesar 0.9975 dan kalimat not_crime_scene sebesar 0.9991. Model IndoBERT menunjukkan performa optimal pada nilai learning rate 1e-5, dengan nilai average precision sebesar 0.9664, average recall sebesar 0.9801, dan average f-measure sebesar 0.9731, mengungguli pendekatan rule-based yang masing-masing nilainya hanya mencapai 0.7388, 0.7852, dan 0.7527. Analisis pola menunjukkan dominasi kasus pencurian dan penipuan, dengan konsentrasi tinggi di wilayah Jawa Barat dan Jawa Timur, serta peningkatan jumlah kejadian pada awal dan akhir tahun. Visualisasi hasil dilakukan melalui dashboard menggunakan Google Looker Studio. Penelitian ini membuktikan bahwa kombinasi SVM dan IndoBERT efektif dalam mengekstrak informasi secara otomatis tanpa penyusunan aturan manual, sehingga menghemat waktu pemrosesan data skala besar dan menunjukkan potensi pemanfaatan berita daring sebagai sumber data alternatif untuk analisis kejahatan di Indonesia.

Item Type: Thesis (Bachelor)
Subjects: T Technology > T Technology (General)
Divisions: Jurusan Matematika dan Teknologi Informasi > Informatika
Depositing User: Amalia Kartika
Date Deposited: 09 Jul 2025 07:23
Last Modified: 09 Jul 2025 07:23
URI: http://repository.itk.ac.id/id/eprint/23369

Actions (login required)

View Item View Item