Malicious URLs Dataset Projesi

Proje Hakkında

Bu proje, zararlı URL'leri tespit etmek için makine öğrenmesi tekniklerinin kullanıldığı bir çalışmadır. Projede, Kaggle'dan alınan Malicious URLs Dataset kullanılarak gözetimli ve gözetimsiz öğrenme algoritmaları uygulanmıştır. Amaç, zararlı URL'lerin sınıflandırılması ve analizi ile bu tür URL'lerin tespitine yönelik etkili bir model geliştirmektir.

Kullanılan Veri Seti

Veri seti, çeşitli zararlı ve zararsız URL'leri içeren bir koleksiyondur. Veri setinin bağlantısı: https://www.kaggle.com/datasets/sid321axn/malicious-urls-dataset

Yöntemler

Proje kapsamında aşağıdaki yöntemler uygulanmıştır:

Gözetimli Öğrenme: Random Forest algoritması kullanılarak model oluşturulmuş ve değerlendirilmiştir.
Gözetimsiz Öğrenme: k-Ortalama kümeleme yöntemi ile veri analizi gerçekleştirilmiştir.

Model Değerlendirmesi

Model performansı, aşağıdaki metriklerle değerlendirilmiştir:

RandomForest:

Doğruluk (Accuracy) : 0.9009757353113227
Kesinlik (Precision) :0.897792050935436
Duyarlılık (Recall) :0.9009757353113227
F1 Skoru : 0.8989708919643451

Ayrıca, sınıflandırma sonuçları için karışıklık matrisi (Confusion Matrix) oluşturulmuştur.

Confusion matrix:

K-means:

Kümeleme Sonuçları:

Elbow Method:

Küme Sayısı: 3, Silhouette Skoru: 0.6178922124066818

Küme Boyutları: {0: 97617, 1: 68893, 2: 92660, 3: 97684, 4: 6831, 5: 17837, 6: 65781, 7: 79410, 8: 11029, 9: 103312}

Kurulum ve Çalıştırma

Projenin çalıştırılabilmesi için gerekli kütüphaneler:

pandas
numpy
scikit-learn
matplotlib
seaborn

Kaggle Defterimin Bağlantısı:

https://www.kaggle.com/code/cerensukaramese/maliciousurlmlproject

Name		Name	Last commit message	Last commit date
Latest commit History 7 Commits
README.md		README.md
maliciousurlmlProject.ipynb		maliciousurlmlProject.ipynb

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Malicious URLs Dataset Projesi

Proje Hakkında

Kullanılan Veri Seti

Yöntemler

Model Değerlendirmesi

RandomForest:

Confusion matrix:

K-means:

Kümeleme Sonuçları:

Elbow Method:

Küme Sayısı: 3, Silhouette Skoru: 0.6178922124066818

Küme Boyutları: {0: 97617, 1: 68893, 2: 92660, 3: 97684, 4: 6831, 5: 17837, 6: 65781, 7: 79410, 8: 11029, 9: 103312}

Kurulum ve Çalıştırma

Kaggle Defterimin Bağlantısı:

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

Malicious URLs Dataset Projesi

Proje Hakkında

Kullanılan Veri Seti

Yöntemler

Model Değerlendirmesi

RandomForest:

Confusion matrix:

K-means:

Kümeleme Sonuçları:

Elbow Method:

Küme Sayısı: 3, Silhouette Skoru: 0.6178922124066818

Küme Boyutları: {0: 97617, 1: 68893, 2: 92660, 3: 97684, 4: 6831, 5: 17837, 6: 65781, 7: 79410, 8: 11029, 9: 103312}

Kurulum ve Çalıştırma

Kaggle Defterimin Bağlantısı:

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages