-
Topic Modeling menggunakan Latent Dirichlet Allocation (LDA) pada berita ekonomi dan bisnismerupakan pendekatan mutakhir untuk menggali pola-pola utama yang muncul dari kumpulan berita tersebut. Dalam era pertumbuhan pesat informasi digital, penting bagi perusahaan media atau analis untuk dapat mengidentifikasi dan memahami isu-isu kunci yang tengah berkembang. -
Topic-modeling LDAdapat membantu memahami distribusi topik utama yang muncul dari artikel berita dan menciptakan pemahaman yang lebih mendalam terhadap isu-isu ekonomi dan bisnis yang tengah dibahas. Kumpulan data ini mencakup rincian berita ekonomi dan bisnis dengan variabel target berupa topik atau kategori berita tertentu. -
Dalam konteks ini, metrik evaluasi yang relevan dapat mencakup metrik khusus topik-modeling seperti
perplexity atau coherence scoreuntuk mengukur kualitas model LDA. Metrik ini membantu mengidentifikasi sejauh mana model dapat memberikan interpretasi yang jelas dan konsisten terhadap topik-topik yang muncul. -
Penulis menetapkan metrik bisnis sebagai acuan proyek analisis topik ini, yaitu
nilai perplexity yang lebih rendah dan coherence score yang lebih tinggi. Perplexity yang lebih rendah menunjukkan bahwa model dapat memberikan prediksi yang lebih baik, sementara coherence score yang lebih tinggi menunjukkan bahwa interpretasi topik lebih konsisten dan bermakna. -
Hasil dari analisis topik ini dapat membantu pemangku kepentingan, seperti perusahaan media atau analis, untuk memahami tren dan isu-isu kunci yang tengah mendominasi dalam berita ekonomi dan bisnis. Dengan fokus pada topik-topik yang paling relevan, pemangku kepentingan dapat membuat keputusan yang lebih informasional dan responsif terhadap perubahan dalam dunia ekonomi dan bisnis.
- LDA modeling membantu dalam mengklasifikasikan topic berdasarkan kata kata kunci yang relevan
- Perplexity Multicore: -7.597177412978327 menandakan semakin kecil valuenya maka lda topic modeling semakin baik, namun saya sadari butuh perbandingan dengan model lain
- Coherence Score Multicore: 0.3597606398050998 menandakan hasil dari LDA kurang cukup bermakna, namun cukup membantu untuk klasifikasi topic awal
- jika dilihat dari visualisasi LDA maka topic 1, 2, dan 3 memiliki kerakteriktik yang jauh berbeda ditandai dengan jauhnya letak Intertopic Distance Map pada masing masing topic
- menambahkan data berita agar bahasa yang dicerna oleh mesin jauh lebih banyak
- menggunakan metode topic modeling lain untuk perbandingan
- bisa ditambahkan pula untuk analisa sentiment analysis