Proyek ini bertujuan untuk mengembangkan sistem rekomendasi pekerjaan cerdas yang dapat mencocokkan pengguna dengan lowongan kerja yang sesuai berdasarkan data profil mereka. Sistem ini menggunakan teknik pemrosesan teks dan algoritma machine learning untuk mencocokkan keahlian, pengalaman kerja, dan preferensi pengguna dengan deskripsi pekerjaan yang tersedia. Dengan demikian, proyek ini diharapkan dapat membantu pencari kerja menemukan pekerjaan yang sesuai dan meningkatkan efisiensi perekrutan bagi perusahaan.
Proyek ini juga mengelompokkan lowongan pekerjaan dari situs JobStreet menggunakan teknik clustering. Data diperoleh melalui web scraping, diproses untuk menghasilkan fitur yang relevan, dan dianalisis menggunakan algoritma clustering untuk menemukan pola atau kelompok di antara data lowongan pekerjaan. Setelah itu, sistem melakukan pencocokan antara input pengguna dan lowongan pekerjaan dalam cluster yang sama menggunakan metode Cosine Similarity dan Jaccard Similarity untuk menghasilkan rekomendasi yang lebih akurat.
- Python
- BeautifulSoup & Scrapy (Web Scraping)
- Pandas & NumPy (Pengolahan Data)
- Scikit-learn (Clustering & Similarity Matching)
- Natural Language Toolkit (NLTK) & Scikit-learn TF-IDF (Pemrosesan Teks)
- Scraping Data: Mengambil data lowongan pekerjaan dari JobStreet.
- Exploratory Data Analysis (EDA): Menganalisis data untuk memahami pola dan fitur utama.
- Preprocessing Requirement Lowongan: Membersihkan dan menyiapkan teks lowongan untuk diproses.
- Clustering Requirement: Mengelompokkan lowongan kerja berdasarkan persamaan fitur menggunakan KMeans.
- Feature Engineering Requirement: Mengubah data lowongan ke dalam format numerik menggunakan TF-IDF.
- Input Data Pengguna: Pengguna memasukkan informasi keahlian, pengalaman, dan preferensi pekerjaan.
- Preprocessing & Feature Engineering Input User: Menyesuaikan format input pengguna agar sesuai dengan data lowongan.
- Clustering Input User: Menentukan cluster lowongan kerja yang relevan untuk pengguna.
- Pencocokan dengan Similarity Matching: Menggunakan Cosine Similarity dan Jaccard Similarity untuk menemukan kecocokan terbaik.
- Menampilkan Hasil Rekomendasi.