Karimi, Ersan (2025) KLASIFIKASI HALAMAN WEB JURNAL PREDATOR DENGAN DOC2VEC DAN AUTOMATED MACHINE LEARNING BERBASIS POHON DOM - Submit Jurnal. Bachelor thesis, Institut Teknologi Kalimantan.
![]() |
Text
11201027_abstract_en.pdf Restricted to Repository staff only until 4 October 2027. Download (781kB) | Request a copy |
![]() |
Text
11201027_abstract_id.pdf Download (783kB) |
![]() |
Text
11201027_bibliography.pdf Download (854kB) |
![]() |
Text
11201027_chapter_1.pdf Restricted to Repository staff only until 4 October 2027. Download (881kB) | Request a copy |
![]() |
Text
11201027_chapter_2.pdf Restricted to Repository staff only until 4 October 2027. Download (1MB) | Request a copy |
![]() |
Text
11201027_chapter_3.pdf Restricted to Repository staff only until 4 October 2027. Download (746kB) | Request a copy |
![]() |
Text
11201027_chapter_4.pdf Restricted to Repository staff only until 4 October 2027. Download (1MB) | Request a copy |
![]() |
Text
11201027_conclusions.pdf Restricted to Repository staff only until 4 October 2027. Download (665kB) | Request a copy |
![]() |
Text
11201027_cover.pdf Download (696kB) |
![]() |
Text
11201027_enclosure.pdf Restricted to Repository staff only until 4 October 2027. Download (1MB) | Request a copy |
![]() |
Text
11201027_Form. TA-020.pdf Restricted to Repository staff only until 4 October 2027. Download (3MB) | Request a copy |
![]() |
Text
11201027_illustrations.pdf Restricted to Repository staff only until 4 October 2027. Download (763kB) | Request a copy |
![]() |
Text
11201027_paper.pdf Restricted to Repository staff only until 4 October 2027. Download (974kB) | Request a copy |
![]() |
Text
11201027_preface.pdf Download (2MB) |
![]() |
Text
11201027_publishing_agreement.pdf Download (3MB) |
![]() |
Text
11201027_statement_of_authencity.pdf Download (3MB) |
![]() |
Text
11201027_table_of_content.pdf Restricted to Repository staff only until 4 October 2027. Download (871kB) | Request a copy |
![]() |
Text
11201027_tables.pdf Restricted to Repository staff only until 4 October 2027. Download (766kB) | Request a copy |
![]() |
Text
11202027_approval_sheet.pdf Download (2MB) |
![]() |
Text
11202027_presentation.pdf Restricted to Repository staff only until 4 October 2027. Download (3MB) | Request a copy |
![]() |
Text
[SPLIT][COVER][YUDISIUM]11201027_Ersan Karimi_Laporan-TA-1.pdf Download (158kB) |
![]() |
Text
11201027_cover.pdf Download (158kB) |
Abstract
Jurnal predator mengancam integritas akademik karena menawarkan publikasi tanpa tinjauan sejawat yang layak. Berdasarkan studi Macháček and Srholec (2022), Indonesia menempati peringkat kedua global dengan 16,73% artikel yang diduga terbit di jurnal predator pada 2015–2017. Penelitian ini bertujuan untuk mengembangkan metode klasifikasi halaman web jurnal predator menggunakan kombinasi Distributed Representations of Documents (Doc2Vec) dan Automated Machine Learning (AutoML) berbasis struktur pohon Document Object Model (DOM). Dataset jurnal predator diambil dari situs Kaggle, sementara jurnal non- predator diambil dari Directory of Open Access Journals (DOAJ). Halaman utama situs jurnal dikumpulkan melalui web scraping dan dikonversi menjadi DOM corpus menggunakan dua pendekatan traversal, yaitu Depth-First Search (DFS) dan Breadth-First Search (BFS). DOM corpus kemudian diubah menjadi representasi vektor menggunakan Doc2Vec dan diklasifikasi secara otomatis dengan AutoML dari Auto-Sklearn. Evaluasi dilakukan dengan mengukur akurasi dan macro avg F1-score pada masing-masing kombinasi traversal dan waktu pelatihan AutoML. Pengujian dilakukan dalam rentang waktu pelatihan 15 hingga 120 menit, dengan interval 15 menit. Model terbaik pada traversal BFS diperoleh pada pelatihan 15 menit dengan macro avg F1-score sebesar 0.7812 dan akurasi 0.9196. Sementara itu, model terbaik pada data DFS diperoleh pada pelatihan 90 menit dengan macro avg F1-score sebesar 0.7853 dan akurasi 0.9255. Hasil ini menunjukkan bahwa metode traversal dalam pembentukan DOM corpus berpengaruh terhadap performa model klasifikasi jurnal predator. Traversal DFS cenderung menghasilkan performa lebih baik dibandingkan BFS dalam konteks kombinasi Doc2Vec dan AutoML berbasis pohon DOM, baik ditinjau dari nilai akurasi maupun macro avg F1-score.
Item Type: | Thesis (Bachelor) |
---|---|
Subjects: | Q Science > QA Mathematics > QA75 Electronic computers. Computer science Q Science > QA Mathematics > QA76 Computer software |
Divisions: | Jurusan Matematika dan Teknologi Informasi > Informatika |
Depositing User: | Ersan Karimi |
Date Deposited: | 14 Jul 2025 08:29 |
Last Modified: | 14 Jul 2025 08:29 |
URI: | http://repository.itk.ac.id/id/eprint/24131 |
Actions (login required)
![]() |
View Item |