CountVectorizer ve Spam E-Mail Tespit Modeli

Bu repo, CountVectorizer kullanımı ile ilgili temel bilgileri ve CountVectorizer ile Random Forest kullanarak oluşturulmuş basit bir spam e-mail tespit modelini içermektedir.

CountVectorizer Nedir?

CountVectorizer, doğal dil işleme (NLP) görevlerinde bir metin belgeleri koleksiyonunu sayısal bir gösterime dönüştürmek için yaygın olarak kullanılan bir metin ön işleme tekniğidir. Python'da popüler bir makine öğrenimi kütüphanesi olan scikit-learn'ün bir parçasıdır.

Bu araç, metin verilerini analiz edebilmek için onları kelime sıklıklarına göre temsil eden bir vektör formatına dönüştürür. Her bir kelimenin belge içinde kaç kez geçtiğini hesaplayarak kelimelerden oluşan bir "özellik matrisi" oluşturur.

Repo İçeriği

Temel CountVectorizer Kullanımı:
- CountVectorizer'ın temel işleyişi ve parametreleri hakkında örnekler.
- Metinlerin nasıl sayısal veriye dönüştürüldüğüne dair örnek kodlar.
- CountVectorizer'ın bazı parametrelerinin kullanımı.
Spam E-Mail Tespit Modeli:
- Hugginface'den dataset yüklenmesi ve veri ön işleme adımları.
- Spam ve ham e-maillerden oluşan örnek veri seti üzerinde CountVectorizer ve Random Forest algoritması kullanarak model oluşturulması.
- Modelin score değerlerinin gösterimi.
- E-mail içeriklerinin spam olup olmadığını tespit etmek için modelin kullanımı.

Medium yazısı:

CountVectorizer Nedir? CountVectorizer ve Random Forest ile Spam E-mail Tespiti ve Sınıflandırma adında bu kodlar ile oluşturduğum, hem teorik bilgi hem de bazı kodları daha detaylı anlattığım Medium yazı linki: https://medium.com/@metehansaribas001/countvectorizer-nedir-countvectorizer-ve-random-forest-ile-spam-e-mail-tespiti-ve-sınıflandırma-72546e9ea027

Name		Name	Last commit message	Last commit date
Latest commit History 10 Commits
CountVectorizer_ve_Rtandom_Forrest_ile_Spam_email_modeli.ipynb		CountVectorizer_ve_Rtandom_Forrest_ile_Spam_email_modeli.ipynb
README.md		README.md
countvectorizer.ipynb		countvectorizer.ipynb

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

CountVectorizer ve Spam E-Mail Tespit Modeli

CountVectorizer Nedir?

Repo İçeriği

Medium yazısı:

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

CountVectorizer ve Spam E-Mail Tespit Modeli

CountVectorizer Nedir?

Repo İçeriği

Medium yazısı:

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages