استفاده از روشهای یادگیری ماشین در این گزارش استفاده شده است. اولین گام برای استفاده از این روشها، تبدیل صفحات وب به بردارهای ویژگی است. تاکنون ویژگیهای زیادی بدین منظور پیشنهاد شدهاند. برخی از آنها بر متن صفحات و برخی دیگر بر پیوندهای صفحه و ارتباطات آن با دیگر صفحات وب تمرکز داشتهاند. در مجموعه داده WEBSPAM-UK2007 که پر استنادترین مجموعه داده این حوزه به شمار میرود.... ...