Skip to content

Edopramudya/Clustering-dan-Similarity-Matching

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

3 Commits
 
 
 
 

Repository files navigation

Sistem Rekomendasi Pekerjaan Berbasis Clustering dan Similarity Matching

Deskripsi Proyek

Proyek ini bertujuan untuk mengembangkan sistem rekomendasi pekerjaan cerdas yang dapat mencocokkan pengguna dengan lowongan kerja yang sesuai berdasarkan data profil mereka. Sistem ini menggunakan teknik pemrosesan teks dan algoritma machine learning untuk mencocokkan keahlian, pengalaman kerja, dan preferensi pengguna dengan deskripsi pekerjaan yang tersedia. Dengan demikian, proyek ini diharapkan dapat membantu pencari kerja menemukan pekerjaan yang sesuai dan meningkatkan efisiensi perekrutan bagi perusahaan.

Proyek ini juga mengelompokkan lowongan pekerjaan dari situs JobStreet menggunakan teknik clustering. Data diperoleh melalui web scraping, diproses untuk menghasilkan fitur yang relevan, dan dianalisis menggunakan algoritma clustering untuk menemukan pola atau kelompok di antara data lowongan pekerjaan. Setelah itu, sistem melakukan pencocokan antara input pengguna dan lowongan pekerjaan dalam cluster yang sama menggunakan metode Cosine Similarity dan Jaccard Similarity untuk menghasilkan rekomendasi yang lebih akurat.

Teknologi yang Digunakan

  • Python
  • BeautifulSoup & Scrapy (Web Scraping)
  • Pandas & NumPy (Pengolahan Data)
  • Scikit-learn (Clustering & Similarity Matching)
  • Natural Language Toolkit (NLTK) & Scikit-learn TF-IDF (Pemrosesan Teks)

Alur Proses

  • Scraping Data: Mengambil data lowongan pekerjaan dari JobStreet.
  • Exploratory Data Analysis (EDA): Menganalisis data untuk memahami pola dan fitur utama.
  • Preprocessing Requirement Lowongan: Membersihkan dan menyiapkan teks lowongan untuk diproses.
  • Clustering Requirement: Mengelompokkan lowongan kerja berdasarkan persamaan fitur menggunakan KMeans.
  • Feature Engineering Requirement: Mengubah data lowongan ke dalam format numerik menggunakan TF-IDF.
  • Input Data Pengguna: Pengguna memasukkan informasi keahlian, pengalaman, dan preferensi pekerjaan.
  • Preprocessing & Feature Engineering Input User: Menyesuaikan format input pengguna agar sesuai dengan data lowongan.
  • Clustering Input User: Menentukan cluster lowongan kerja yang relevan untuk pengguna.
  • Pencocokan dengan Similarity Matching: Menggunakan Cosine Similarity dan Jaccard Similarity untuk menemukan kecocokan terbaik.
  • Menampilkan Hasil Rekomendasi.

About

Proyek ini bertujuan untuk mengembangkan sistem rekomendasi pekerjaan cerdas yang dapat mencocokkan pengguna dengan lowongan kerja yang sesuai berdasarkan data profil mereka. Sistem ini menggunakan teknik pemrosesan teks dan algoritma machine learning untuk mencocokkan keahlian, pengalaman kerja, dan preferensi pengguna dengan deskripsi pekerjaan

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors