CountVectorizer ve Spam E-Mail Tespit Modeli

Bu repo, CountVectorizer kullanımı ile ilgili temel bilgileri ve CountVectorizer ile Random Forest kullanarak oluşturulmuş basit bir spam e-mail tespit modelini içermektedir.

CountVectorizer Nedir?

CountVectorizer, doğal dil işleme (NLP) görevlerinde bir metin belgeleri koleksiyonunu sayısal bir gösterime dönüştürmek için yaygın olarak kullanılan bir metin ön işleme tekniğidir. Python'da popüler bir makine öğrenimi kütüphanesi olan scikit-learn'ün bir parçasıdır.

Bu araç, metin verilerini analiz edebilmek için onları kelime sıklıklarına göre temsil eden bir vektör formatına dönüştürür. Her bir kelimenin belge içinde kaç kez geçtiğini hesaplayarak kelimelerden oluşan bir "özellik matrisi" oluşturur.

Repo İçeriği

Temel CountVectorizer Kullanımı:
- CountVectorizer'ın temel işleyişi ve parametreleri hakkında örnekler.
- Metinlerin nasıl sayısal veriye dönüştürüldüğüne dair örnek kodlar.
- CountVectorizer'ın bazı parametrelerinin kullanımı.
Spam E-Mail Tespit Modeli:
- Hugginface'den dataset yüklenmesi ve veri ön işleme adımları.
- Spam ve ham e-maillerden oluşan örnek veri seti üzerinde CountVectorizer ve Random Forest algoritması kullanarak model oluşturulması.
- Modelin score değerlerinin gösterimi.
- E-mail içeriklerinin spam olup olmadığını tespit etmek için modelin kullanımı.

Medium yazısı:

CountVectorizer Nedir? CountVectorizer ve Random Forest ile Spam E-mail Tespiti ve Sınıflandırma adında bu kodlar ile oluşturduğum, hem teorik bilgi hem de bazı kodları daha detaylı anlattığım Medium yazı linki: https://medium.com/@metehansaribas001/countvectorizer-nedir-countvectorizer-ve-random-forest-ile-spam-e-mail-tespiti-ve-sınıflandırma-72546e9ea027

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

CountVectorizer ve Spam E-Mail Tespit Modeli

CountVectorizer Nedir?

Repo İçeriği

Medium yazısı:

FilesExpand file tree

README.md

Latest commit

History

README.md

File metadata and controls

CountVectorizer ve Spam E-Mail Tespit Modeli

CountVectorizer Nedir?

Repo İçeriği

Medium yazısı: