Akademik Bilişim

Veri Madenciliği Teknikleri İle İstenmeyen Türkçe E-Postaların Sınıflandırılması

Sefa Saylan Özgür Çakır

Abstract

İstenmeyen e-postalara maruz kalmak işletmelerin iş süreçlerinde aksamalara, zaman kayıplarına ve hatta maddi kayıplara sebep olduğundan günümüzün önemli sorunlarından biri olarak görülebilir. İstenmeyen e-postaların engellenmesi için öncelikle tespit edilmeleri gerekmektedir. Bu çalışmada, gelen e-postaların sınıflandırılması ve istenmeyen Türkçe e-postaların tespiti için Naive Bayes algoritmaları (iki terimli ve çok terimli) ve Destek Vektör Makinesi algoritmaları (doğrusal ve RBF çekirdek fonksiyonlu) kullanılmaktadır. Çalışmada, öğrenme kümesinin Türkçede kullanılan etkisiz kelimelerden arındırılması ve arındırılmaması durumunda TF-IDF yöntemi ile oluşturulan özellik vektörünün sınıflandırma başarısına etkisi incelenmiştir.



Conference
Akademik Bilişim
Keywords
İstenmeyen Türkçe E-postalar Sınıflandırma Naive Bayes Bernoulli Naive Bayes Multinomial Naive Bayes Destek Vektör Makinesi Lineer Çekirdek Fonksiyonu RBF Çekirdek Fonksiyonu Spam/Junk mails

Language
Turkish

Subject
Computer Science

Full Paper (PDF)

272 views
189 downloads