Analisis sentimen isu vaksinasi COVID-19 pada twitter dengan metode naive bayes dan pembobotan TF-IDF tokenisasi 1-2 gram – submit journal

Hapsari, Yashmine (2024) Analisis sentimen isu vaksinasi COVID-19 pada twitter dengan metode naive bayes dan pembobotan TF-IDF tokenisasi 1-2 gram – submit journal. Bachelor thesis, Institut Teknologi Kalimantan.

[img] Text
11181083_cover.pdf

Download (861kB)
[img] Text
11181083_abstract_en.pdf
Restricted to Registered users only

Download (493kB) | Request a copy
[img] Text
11181083_abstract_id.pdf

Download (474kB)
[img] Text
11181083_chapter_1.pdf

Download (261kB)
[img] Text
11181083_chapter_2.pdf

Download (323kB)
[img] Text
11181083_chapter_3.pdf
Restricted to Registered users only until 6 May 2024.

Download (572kB) | Request a copy
[img] Text
11181083_chapter_4.pdf
Restricted to Registered users only until 6 May 2024.

Download (1MB) | Request a copy
[img] Text
11181083_conclusions.pdf
Restricted to Registered users only until 6 May 2024.

Download (855kB) | Request a copy
[img] Text
11181083_bibliography.pdf

Download (1MB)
[img] Text
11181083_paper.pdf
Restricted to Repository staff only until 6 May 2024.

Download (1MB) | Request a copy
[img] Text
11181083_Lembar Persetujuan PublikasiI lmiah (Form. TA-020).pdf
Restricted to Repository staff only until 6 May 2024.

Download (240kB) | Request a copy

Abstract

Vaksinasi COVID-19 telah diberlakukan untuk mengurangi penyebaran virus corona dalam masyarakat, namun status vaksin yang masih dalam tahap pengembangan menjadi salah satu faktor keraguan masyarakat untuk melakukan vaksinasi. Oleh karena itu, dilakukan analisis sentimen terhadap isu vaksinasi COVID-19 dengan proses dan parameter yang dapat meningkatkan akurasi model. Pada penelitian ini, pengklasifikasian sentimen dilakukan dengan menggunakan metode Naive Bayes dan dataset berupa 5000 tweet terkait vaksinasi COVID-19. Tahap pembobotan dilakukan dengan metode TF-IDF dimana dilakukan perbandingan terhadap pengaruh penggunaan tokenisasi unigram, bigram dan 1-2 gram terhadap akurasi model. Hasil dari salah satu percobaan dengan pengklasifikasi Gaussian dan perbandingan train:test yaitu 7:3, didapatkan akurasi model 67.4% untuk parameter unigram, 65.5% untuk parameter bigram, dan 70% untuk parameter 1-2 gram, dimana model dengan token gabungan yaitu 1-2 gram memiliki akurasi yang lebih tinggi jika dibandingkan dengan penggunaan 1 jenis token saja. Berdasarkan hasil tersebut, dapat disimpulkan bahwa penggabungan jenis tokenisasi unigram dan bigram dapat memberikan nilai tambah terhadap model untuk mengklasifikasikan data, sehingga dapat meningkatkan akurasi dalam analisis terkait sentimen publik.

Item Type: Thesis (Bachelor)
Subjects: Q Science > QA Mathematics > QA75 Electronic computers. Computer science
T Technology > T Technology (General)
Divisions: Jurusan Matematika dan Teknologi Informasi > Informatika
Depositing User: Yashmine Hapsari
Date Deposited: 19 Jan 2023 07:18
Last Modified: 19 Jan 2023 07:18
URI: http://repository.itk.ac.id/id/eprint/19123

Actions (login required)

View Item View Item