مجموعه داده هرزنامه

Abstract

This is the data set used for Persian spam detection researches. It’s contains of 446 Persian spam email sample in text format(subject and body) which includes a wide variety spam groups such as products, finance, health, internet, leisure and political issues. 

Data file:

PSDS.rar: The full data set

University of tarbiat modares, Iran

last modified: January 15, 2013

چکیده

این پایگاه داده در مطالعات تشخیص هرزنامه­های فارسی مورد استفاده قرار می­گیرد. این پایگاه شامل 446 نمونه­ هرزنامه­های رایانامه­ای فارسی زبان در قالب متن (عنوان و بدنه) که انواع گروه­های هرزنامه همچون محصولات، مالی، سلامتی، اینترنت، اوقات فراغت و سیاسی را شامل می­شود.

فایل :

PSDS.rar : پایگاه داده

 دانشگاه تربیت مدرس
تاریخ آخرین تغییرات:  26 دی ماه سال 1391