Мы выпустили новую книгу «Контент-маркетинг в социальных сетях: Как засесть в голову подписчиков и влюбить их в свой бренд».

Подписаться

Спам-фильтр – это программное обеспечение, с помощью которого автоматически определяются нежелательные письма.


Больше видео на нашем канале - изучайте интернет-маркетинг с SEMANTICA

Как работают спам-фильтры почты

У каждого пользователя электронной почты, поступающие письма отображаются в папке «Входящие». Сюда приходят новости по работе, сообщения от друзей и разные подписки информационного характера.

Иван Петрович увлекался рыбалкой. Однажды он посетил сайт с хорошим рыболовным ассортиментом по приемлемым ценам. И он решил подписаться на обновления его товарного ряда. В форме подписки его попросили проверить получение информации о подписке. Но на почте её не оказалось. Согласно указаниям на сайте следовало проверить папку «Спам» и в соответствии с инструкцией перенести отправителя в белый список.

Сообщение действительно оказалось в указанной папке, потому что содержало призыв «Купить по низким ценам». А данное словосочетание было указано в перечне слов, который спам-фильтр почтового сервера не пропустил, и отправил в папку с нежелательной почтой.

Метод работы спам-фильтров

Прежде чем углубится в тему спам-фильтров, нужно определить, что такое . Это регулярная отправка писем, рекламного или любого другого характера, от неизвестных отправителей. Такие сообщения поступают к людям без их ведома и согласия.

Различают два вида нежелательных писем:

  • Безобидный спам: реклама товаров и услуг, антиреклама, письма счастья, пропаганда.
  • Потенциально опасный спам: нигерийский спам (выманивание хитрыми способами денег), фишинг (выведывание секретных данных – паролей и логинов), вирусы.

Чтобы защитить владельцев почтовых адресов от нежелательных писем, существуют разработанные спам-фильтры. Нельзя утверждать, что они имеют 100% эффективность.

Работа спам-фильтров основывается на многих разных принципах. Основные из них проходят проверку на основании анализа отправленного письма, изучении данных самого отправителя и серых списков.

Анализ отправленного письма

Исследуется содержимое каждого сообщения. Идёт проверка на наличие спам-слов, проверяется оформление и смысл текста. Если в нём содержатся данные из запретного перечня, оно считается нежелательным и отправляется в папку «Спам». Однако благодаря сервисом. позволяющим обойти спам-фильтры, такие сообщения могут с легкостью попасть во «Входящие».

В таких случаях почтовые серверы предусмотрели возможность получать обратную связь от получателя, предоставив ему возможность самому определить полученную информацию как спам. Это даёт возможность обновлять чёрный список.

Изучение данных самого отправителя

Существует перечень данных с IP-адресами компьютеров, которые были замечены в отправке нежелательной информации. Через службу DNS делается обращение по каждому IP-адресу, чтобы узнать, находится он в чёрном списке или нет.

Этот способ опытные спамеры часто обходят, регулярно меняя сервера, чтобы и дальше осуществлять свои . Также они часто работают с нескольких компьютеров и этим могут скомпрометировать целый домен. В результате таких действий страдают обычные отправители, потому что их также вносят в перечень нежелательных.

Серые списки

Принцип работы серых списков, заключается в протоколе SMTP. С его помощью отправленное сообщение отклоняется и направляется ответное извещение с ошибкой. Серверы спамеров за это время задержки попадают в перечень отправителей с плохой репутацией и не имеют возможности отправить подтверждающий e-mail.

Как обойти спам-фильтры при рассылке

  • Не используйте в тексте спам-слова: «дополнительный доход», «дешево», «купить», «деньги».
  • Избегайте слов, написанных большими буквами, особенно, в теме сообщения.
  • Не злоупотребляйте восклицательными знаками.
  • Не используйте явных призывов к действию.
  • Не используйте яркие цвета и пишите обычным чёрным шрифтом.
  • HTML письма должен соответствовать тексту.
  • Осуществляйте отправку в одно и то же время с одинаковой периодичностью.
  • Укажите в тексте свои данные, чтобы читатель мог вам ответить.
  • Отправляйте информационные письма только тем, кто на них подписался.
  • Убедитесь, что отправка осуществляется на существующие адреса, для этого запросите от подписчика подтверждение почтового адреса.
  • Ведите свою рассылку используя почту с именем своего домена..com
  • Напишите получателю инструкцию, чтобы он проверил вас в папке «Спам» и перенёс вас в папку «Входящие».
  • Работайте с проверенными почтовыми сервисами.
  • В некоторых сервисах есть возможность предварительной проверки вашего сообщения спам-фильтрами. Проверьте письмо и будьте уверены, что оно дойдет до вашего адресата.

Чем больше ваш e-mail будет иметь признаков простого сообщения, тем выше будет вероятность его получения вашим адресатом.

Маркетологи тратят массу времени на написание текста емейл-сообщений, создание красивых шаблонов и конверсионных тем — всё ради высоких показателей открытий и кликов. Однако перед отправкой стоит задуматься, какова вероятность, что подписчики получат письмо. В последние годы во многих странах ужесточаются законы о борьбе со спамом, а спам‑фильтры становятся всё более изощрёнными. Сегодня мы поделимся секретами попадания в Inbox.

Не покупайте базы емейл-адресов

Купить базу рассылки — плохая идея. Во-первых, такая практика противоречит договору с емейл‑провайдером. Во-вторых, потенциальные получатели ничего не знают о вашей компании, не оформляли подписку и с большой вероятностью пометят письма как спам. К тому же продаются, как правило, некачественные адреса.

Не собирайте открытые емейл-адреса с сайтов

Сбор открытых емейлов с сайтов — это быстрый способ нарастить базу, но он не позволяет сделать эффективную рассылку. В некоторых странах (например, США) такая практика незаконна.

Удалите емейл-адреса, с которых регулярно приходят сообщения об ошибке доставки

Жёсткая ошибка доставки означает, что емейл-сообщение было отправлено на неправильный или несуществующий электронный адрес. Показатель жёстких ошибок доставки — один из ключевых факторов, которые интернет-провайдеры используют, чтобы определить репутацию отправителя. Если у вас много таких ошибок, ваши рассылки попадут в папку со спамом.

Не пишите заглавными буквами

Писать целые слова заглавными буками — всё равно что кричать на людей. Конечно, заглавный шрифт привлекает внимание. Но он многих раздражает и не внушает доверия, потому что часто используется при рассылке спама.
Согласно исследованию Radicati Group, более 85 % пользователей предпочитают, чтобы тема письма была набрана строчными буквами. Эффективные альтернативы Caps Lock — персонализация, релевантный контент и интересный текст.

Не злоупотребляйте восклицательными знаками

Из-за чрезмерного количества восклицательных знаков емейл-сообщения выглядят непрофессионально и напоминают спам. 69 % получателей помечают письмо как спам, прочитав только его тему. Сообщения с несколькими восклицательными знаками подряд оказываются в папке «Спам» в первую очередь.

Не размещайте в письме видео, флеш-ролики или JavaScript

По умолчанию большинство почтовых клиентов не позволяют просматривать мультимедийные файлы, например, флеш-ролики или видео. Используйте изображение видеоплеера и ссылку на сайт. С JavaScript и другими динамическими скриптами дело обстоит сложнее. Даже если спам-фильтр пропустит сообщение, почтовый клиент заблокирует работу скриптов, поэтому лучше совсем отказаться от них.

Не размещайте в письме форму

Большинство почтовых клиентов не поддерживают формы в емейл-сообщениях из соображений безопасности. Включите в емейл СТА или ссылку на посадочную страницу, где размещена форма.

Не прикрепляйте вложения

Если вы хотите отправить клиентам файл (например, в формате PDF или Word), не прикрепляйте его к письму. В противном случае на сообщение могут отреагировать спам-фильтры. Загрузите документ на сайт и разместите в сообщении ссылку с эффективным призывом к действию. Так вы обезопасите емейл от попадания в спам и уменьшите время загрузки сообщения.

Не используйте слова, на которые реагируют спам-фильтры

Тщательно выбирайте слова при составлении темы емейла. Фильтры реагируют на типичные фразы, которые используются в рекламных сообщениях: «бесплатно», «гарантированно» и т. д. Подходите к написанию писем творчески: емейл‑сообщение должно быть интересным и информативным.

Не используйте красный шрифт

Красный шрифт или невидимый текст (белый шрифт на белом фоне) часто используют спамеры. Спам‑фильтры немедленно реагируют на такие уловки. Необычные шрифты и цвета не нравятся подписчикам. Согласно исследованию Radicati Group, более 60 % пользователей не одобряют использование необычных шрифтов и разных цветов в рассылках. Почти 70 % пользователей предпочитают, чтобы символы были одинакового размера.

Не делайте орфографических ошибок

Исследование Radicati Group study также показало, что 80 % подписчиков считают орфографические ошибки неприемлемыми. К тому же ошибки — сигнал для спам-фильтров. Будьте внимательны и не забывайте делать проверку правописания с помощью специальных инструментов.

Не злоупотребляйте ключевыми словами

Не старайтесь вставить в текст как можно больше ключевых слов. Никому не хочется читать сообщения, оптимизированные для роботов. Такие письма имеют все шансы оказаться в папке «Спам». Текст должен быть персонализированным, информативным и дружелюбным. Не стесняйтесь писать простым и живым языком.
Хороший пример — емейл-сообщение от американской сети фитнес-центров Turnstyle Cycle. «Хотим напомнить, что скоро истекает срок действия Вашего абонемента. Мы знаем, что Вы заняты, и не хотим расставаться с Вами. Позвоните нам, если мы можем быть чем-то полезны». Искреннее и дружелюбное сообщение даёт всю необходимую информацию: дату, когда истекает срок действия абонемента, и номер телефона для связи.

Изображения не должны быть слишком крупными и их не должно быть много

Письма, перегруженные изображениями, часто попадают в папку «Спам» и медленно открываются. Кроме того, Microsoft Outlook не распознаёт фоновые изображения. Вместо картинки используйте фоновый цвет.

Обновляйте и очищайте список рассылки

Даже если все ваши подписчики дали согласие на рассылку, не забывайте о гигиене листа. В противном случае интернет-провайдер может посчитать, что вы рассылаете спам. Провайдеры учитывают жалобы активных подписчиков и не обращают внимания на размер базы.

Электронные адреса, которыми давно никто не пользуется, часто становятся спам-ловушками. Попадание даже в одну такую ловушку плохо повлияет на доставляемость.

Регулярная гигиена базы снижает вероятность, что рассылку пометят как спам. Неактивных подписчиков и неиспользуемые адреса можно вычислить, если проанализировать показатели открытий, CTR и активность на сайте.

Постарайтесь повторно заинтересовать подписчиков, которые неактивны или проявляют нерегулярную активность

Отправка сообщений неактивным подписчикам отрицательно сказывается на доставляемости. Сообщения от отправителей с низкой доставляемостью часто попадают в папку «Спам», и получатели их просто не видят.
Проводите реактивационные кампании. Отслеживайте поведение пользователей (посещение сайта, переход по ссылкам и т. д.) и создайте триггерное емейл-сообщение, которое будет отправляться, если в течение определённого времени подписчик не проявляет активности. Например, клиентов может заинтересовать эксклюзивное предложение или купон на скидку. Ещё один вариант — включить в сообщение ссылку на опрос, чтобы подписчики могли рассказать, чего ожидают от рассылки.

Используйте double opt-in подписки

Double opt-in означает, что после оформления подписки пользователь получает «confirm» емейл со специальной ссылкой. Перейдя по ней, подписчик подтверждает согласие на рассылку. Как правило, пользователи, подтвердившие подписку, более активны и вовлечены.

Просите подписчиков добавить ваш from email в адресную книгу

В последнее время фильтры становятся строже, и часто в папку со спамом попадают письма, которые интересны подписчикам. Но большинство фильтров позволяют добавить адрес в «белый список». Напомните подписчикам о такой возможности, чтобы они не пропускали ваши емейл-сообщения.

Добавляйте в письмо ссылку отписки

Возможность без труда отменить подписку — важная составляющая емейл-маркетинга. Она позволит людям, которые не хотят получать рассылку, отказаться от неё. В некоторых странах (например, США) закон обязывает маркетологов включать в емейлы ссылку отписки. По американскому закону, подписчик должен иметь возможность отказаться от рассылки, отправив письмо или перейдя по одной ссылке. Пользователи привыкли, что информация об отписке располагается в нижней части письма.


Не игнорируйте отмену подписки

ь его адрес из базы. Автоматизация такого процесса сэкономит много времени. При этом необходимо обеспечить полную интеграцию CRM и программного обеспечения, которое используется для создания рассылок.

Указывайте знакомое имя в поле «Отправитель»

Многие люди не открывают письма от незнакомых отправителей. Используйте название бренда, чтобы подписчики понимали, от кого получают сообщения. Ещё лучше — делать рассылку с электронного адреса реального человека. Пользователи больше доверяют личной почте, чем корпоративной.

Указывайте имя подписчика в поле «Кому»

Так вы покажете, что знаете имя получателя, и сможете избежать спам-фильтра. К тому же персонализация повышает вовлечённость клиентов.

Предлагайте две версии письма: без форматирования и в формате HTML

HTML даёт возможность создавать емейлы с привлекательными визуальными элементами. Если вы одновременно предлагаете текстовую версию емейл-сообщения без форматирования, то облегчаете жизнь как интернет-провайдерам, так и подписчикам. Большинство современных инструментов дают возможность сделать текстовую версию письма за несколько минут.

Работая с HTML, не забывайте проверять правильность кодировки. Из-за ошибок в тегах емейл-провайдер может посчитать письмо спамом.

Дайте подписчикам возможность просматривать сообщение в браузере

Почтовые клиенты иногда плохо отображают письма, даже если их дизайн безупречен. Обязательно добавляйте в сообщение ссылку, которая позволит открыть его как веб-страницу.


Добавляйте текст для изображений

Многие почтовые клиенты по умолчанию блокируют изображения. Получатель не увидит их, пока не нажмёт на кнопку или не изменит настройки почтового ящика. Альтернативный текст поможет пользователю понять сообщение, даже если изображение не открывается.

Особенно плохо, если вы используете изображение как призыв к действию. Без альтернативного текста он выглядит вот так:

Если добавить текст, подписчик поймёт, по какой ссылке нужно перейти, чтобы завершить действие.

Можно изменить текст в редакторе форматированного текста (достаточно щелчка правой кнопкой мыши) или ввести текст вручную в редакторе HTML.

Емейлы должны быть краткими

Длинный текст активирует спам-фильтры и отталкивает подписчиков. Старайтесь писать лаконичные и живые емейл-сообщения. Если без длинного письма нельзя обойтись, делите текст на абзацы и добивайтесь чёткой структуры (введение, основная часть и вывод).

Тестируйте емейлы перед отправкой

При создании рассылки нужно учитывать особенности разных почтовых клиентов и мобильных устройств. Сегодня 53 % пользователей читают письма на мобильных устройствах. Тестирование рассылки для каждого почтового клиента заняло бы слишком много времени, но самые популярные почтовые клиенты точно заслуживают внимания. Специалисты Litmus исследовали 1,06 млрд емейлов и определили самые распространённые почтовые клиенты:

  • почтовое приложение для iPhone (28 % пользователей);
  • Gmail (16 % пользователей);
  • почтовое приложение для iPad (11 % пользователей);
  • почтовое приложение для Google Android (9 % пользователей);
  • Outlook (9 % пользователей).

По возможности посмотрите, как письмо выглядит в разных почтовых клиентах и на устройствах, популярных у вашей целевой аудитории.
Перед отправкой сообщения подписчикам нужно обязательно провести тестирование, чтобы убедиться, что рассылка работает хорошо.

Пройдите сертификацию отправителя

Сертификация отправителя — это процесс, при котором третья сторона проверяет отправителей емейл‑рассылки и подтверждает, что они соблюдают определённые правила. В результате отправитель попадает в «белый список интернет-провайдера».

Следите за своей репутацией

Доставляемость рассылки во многом зависит от репутации IP-адреса. Если у IP-адреса, с которого вы отправляете сообщения, плохая репутация, есть риск, что они не попадут в Inbox. Следите, не оказался ли ваш адрес в чёрном списке.

Старайтесь быть в курсе новых законов о борьбе со спамом, правилах интернет-провайдеров и принципах работы спам-фильтров

Емейл-маркетинг постоянно меняется, и специалисты должны держать руку на пульсе: соблюдать новые законы, приспосабливаться к новым правилам и использовать продвинутые технологии.

Спам-фильтр - это программа, которая настроена на обработку и фильтрацию поступающей почты на сервер по определенным параметрам: IP адрес, стоп - слова в тексте письма и регулярные выражения, особенности технических заголовков и т.д.
Каждый крупный почтовый сервис (Рамблер, Яндекс-почта, Майл.ру...) фильтрует письма на предмет спама, но все же достаточно большое количество нежелательных писем проходят сквозь спам фильтры незамеченными. Почему это происходит, и как правильно настроить свой почтовый ящик, чтобы этого избежать вы узнаете в этой статье.

Что такое спам
Спам (spam) - это нежелательная реклама, рассылаемая против воли получателя. Началом бума спама в Рунете можно считать начало 2000-х годов, когда начал очень активно развиваться отечественный сегмент сети Интернет. У спама очень много разновидностей - почтовые спам-рассылки, флуд гостевых книг, форумов и досок объявлений, ICQ спам и пр. В каждом конкретном случае, применяют свои способы защиты от нежелательных сообщений.
В этой статье будут рассмотрены все основные аспекты почтового (e-mail) спама и защиты от него.

Спам-фильтр – это защита от рекламы ?
Действительно в настоящее время на любой почтовой службе применяются те, или иные спам-фильтры. Кроме того, существует множество антиспам-плагинов к популярным почтовым программам The Bat, Outlook Express и другим. Но в тоже время спам, все с новой и новой силой летит в наши ящики. Но самое плохое, на мой взгляд, в другом. Дело в том, что в результате беспощадной борьбы со спамерами иногда теряются многие нормальные письма, которые иногда могут быть очень важны. Именно проблема с доставкой важной почтовой корреспонденции побудила меня на написание данной статьи, и надеюсь, поможет уменьшить поток на ваш ящик всякого мусора, и соответственно уменьшит количество потерянных важных писем.

Как работает спам-фильтр .
Антиспам фильтры работают по различным алгоритмам, но главное у всех одно – это анализ письма при его получении по определенным признакам. Все рекламные письма от спамеров написаны по шаблону. Ведь не будет же спамер писать каждое письмо вручную, когда у него база e-mail на 1 млн., или более адресов. И стоит ему запустить рассылку (мгновенно такой объем писем не пошлешь), а первым получателям его писем пожаловаться на спам, то данная рассылка будет сразу занесена в блек-лист, и все последующие письма будут отсечены антиспам фильтрами, использующими эту систему. Это так называемые системы раннего оповещения, которые позволяют блокировать спамера на ранней стадии рассылки.
Другой способ основан на более детальном изучении письма, и выявлении в нем признаков спам-рассылки. Если письмо изобилует словами: Реклама, уникальное предложение, купить, скидки, распродажа... и т.д. То данное письмо будет однозначно помечено как подозрительное. Письмо может содержать несуществующий адрес отправителя, что легко проверить, или адрес может быть в черном списке. Вместо текста может быть картинка с размещенной рекламой. Нормальные письма, как правило, содержат не большой размер текста. А письма от создателей разного рода пирамид содержат большой размер информации, где указано что, где, как и для чего вам нужно купить часть от некой чудо-программы, и так далее в этом духе.

Этот тип антиспам фильтров обычно имеет возможность гибкой настройки со стороны пользователя. Здесь только главное не перегнуть. Владелец почтового ящика может лично указать, какой максимальный размер писем пропускать, какие адреса добавить в черный список, фильтровать сообщения по теме писем и словам в теле письма. Правда данный способ не подходит для людей, которые ведут активную мейл переписку. Ведь невозможно предупредить всех отправителей указывать, к примеру, в теме письма ключевое слово, да и как правило многие отправители заранее не знакомы.

Мораль – решение о принадлежности письма к спаму принимает программа, а не человек. А программе не свойственно одно качество – искусственный интеллект, а поэтому все спам фильтры при желании можно легко обойти, или говоря проще, обмануть.

Как обойти спам-фильтр? Легко!
И тем не менее обойти антиспам системы не просто, а очень просто. В подтверждение тому тот факт, что проблема спама по-прежнему актуальна. Принять 100% верное решение о том нужно это письмо, или нет, может только один человек! И этот человек получатель письма. Действительно, а вдруг человек подписан на рекламную рассылку от какой-нибудь компании. Но это все полемика, а теперь факты. Раз письмо фильтруется антиспам системами по тому, или иному признаку, то спамеру достаточно составить «безобидное» письмо, т.е. письмо максимально похожее на обычное (нужное получателю). Выражение: «Краткость – сестра таланта» здесь очень уместно. Чем короче будет письмо, тем труднее в нем выделить детали, характерные для спама.
Надо максимально минимизировать содержание рекламных слов в письме, а оставшиеся видоизменить. Слово «Реклама» можно написать так:
Р е к л а м а (пробелы между буквами), Р-е-к-л-а-м-а (буквы через тире), Рeклaмa (здесь русские буквы «е» и «а» заменены на аналогичные латинские). Как видите вариантов много, для человека любое слово будет иметь смысл «Реклама», а вот многие антиспам системы этого не поймут.
Что касается обхода аниспам систем работающих по принципу раннего обнаружения спамерской рассылки, то сдесь достаточно заранее составить пару десятков разных шаблонов, и после каждой рассылки 100 тыс. писем менять шаблон письма, домен и e-mail отправителя. Этот подход широко используется в спам-бот сетях (сеть из зараженных пользовательских компьютеров).

Я мог все свои ящики собрать в кучу. Но столкнулся с проблемой, когда все сообщения приходит на одну почту, то ты спам начинаешь уже и замечать. И лень лазить и удалять спам руками, а тот фильтр, которые уже встроенный в почтовый сервис не всегда радует.

Почему не сделать бота, который чистит почту, тем более спам четко виден по некоторым признакам?
Вот что я выделил, что в моих глазах спам:
- всё написано в верхнем регистре
- сообщения, где главная мысль: порнуха, знакомства, казино, деньги и т.д.
- если кто-то регулярно высылает почту и я её не прочитываю

В самом начале нужно настроить imap php для близкой работы с почтой. Потом написать некоторые алгоритмы, которые в этой статье будут не оптимальные , т.к. каждому нужен свой фильтр (например, некоторые ждут спама от порнографических сайтов).

Тут будут только идеи и информация для ума. И для тех кто хочет поставить свой фильтр, уже будет фундамент.

Начинаем...
Про то как настроить imap php есть куча статей, их можно поискать. У меня Ubuntu, я этот вопрос решил за пару минут и немного изменение в настройках.

Когда вы уже настроили imap можно его подключать.
//настройки для подключениея к почте
$imapaddress = "{imap.gmail.com:993/imap/ssl}";
$imapmainbox = "INBOX";
$maxmessagecount = 10;
$user="имя почты на gmail без @gmail.com";
$password="длинный и сложный пароль";

//наша функция, которая удаляет спам
spam_delete($imapaddress, $imapmainbox, $user, $password, $maxmessagecount);

Теперь заходим на почту забираем письма. Когда взяли письмо, весь текст делим на слова и подсчитываем кол-во. Потом в цикле берем по словам и проверяем на то, может ли это слово подтверждать, что это письмо спам. Некоторые пункты, что по моему является спамом описал выше. Потом находим вероятность того, что это письмо спам по такой формуле:

Вероятность=количество слов всего в письме / слова, которые не прошли фильтр

Вот как это всё в коде:
function spam_delete($imapaddress, $imapmainbox, $imapuser, $imappassword, $maxmessagecount)
{
$imapaddressandbox = $imapaddress . $imapmainbox;

//открываем соединение с почтой
$connection = imap_open ($imapaddressandbox, $imapuser, $imappassword)
or die("Can"t connect to "" . $imapaddress .
"" as user "" . $imapuser .
"" with password "" . $imappassword .
"": " . imap_last_error());

Echo "Gmail information for " . $imapuser ."";

Echo "Inbox headers\n";
$headers = imap_headers($connection)
or die("can"t get headers: " . imap_last_error());

//считаем кол-во почты на сайте, максимум мы 10 можем вывести
$totalmessagecount = sizeof($headers);

Echo $totalmessagecount . " messages";

If ($totalmessagecount<$maxmessagecount)
$displaycount = $totalmessagecount;
else
$displaycount = $maxmessagecount;

Echo "Message bodies\n";
//заходим в письмо берем содержание и проверяем на спам
for ($count=1; $count<=$displaycount; $count+=1)
{
$body=imap_fetchbody($connection,$count,"2");
//разбиваем всё письмо на слова
$text=explode(" ",$body);
$spam=0;
//подсчитываем кол-во слов
$n=count($text);
for ($i=0;$i<$n;$i++) {
$spam+=test_spam($text[$i])==1:1?0;
}
//смотрим какая вероятность, что это спам
// мы кол-во слов делим, на возможные слова,
//которые подтверждают, что это спам
$result=$n/$spam;
//если 50% что это спам, то удаляем
if ($result>0.5) {
imap_delete($connection,$count);
imap_expunge($connection);
}
}
//закрываем imap
imap_close($connection);
}

Алгоритм проверки на спам очень простой, он написан для примера. Если вы хотите написать более сильный и умный алгоритм советую почитать некоторые главы про спам в книге «Программируем коллективный разум», на Хабре про неё тоже писали .

Алгоритм выполняет два действия:
1. Определяет слова, которые чаще всего встречаются в спаме
2. Проверяет на регистр, если всё в в верхнем, то это скорее всего спам.

Сам код:
//функция проверки на спам
function test_spam ($string) {
//этапы фильтра
//проверяем по ключевым словам
$array=array("порно" => 1, "знакомства" => 1, "казино" => 1, "купить" => 1);
if ($array[$string]==1) {return 1;}
//не находится ли он в верхнем регистре
if (strtolower($string)!==$string) {
return 1;
}
return 0;
}
?>

Протестировал на двух примерах, то вроде работает...

P.S. Будет очень рад услышать как вы боритесь с мусором. Если вы найдете ошибке в коде сильно не ругайтесь это только пример и фундамент для разработки чего-то большего.

Как сделать так, чтобы ваши письма не отправлялись в нежелательную почту?

Ведь с этой проблемой наверняка сталкивался каждый, кто на протяжении достаточно долгого срока занимался email рассылкой . В среднем, «благодаря» спам-фильтрам, порядка 10-20% всех электронных писем бесследно исчезают на необъятном киберпространстве. И все это по вине слишком усердных спам-фильтров.

Даже не нужно быть злостным спамером, чтобы корреспонденция удалялась.

Увы, но быстрого и простого решения проблемы не существует. Чтобы избежать фильтров, надо понять их природу, понять, как они работают. А это процесс весьма долгий и скрупулезный.

В программах электронной почты заложен очень большой список критериев, на который ориентируются фильтры, чтобы распознать «мусорное» письмо. В этот список включены в первую очередь «спамерские» фразы .

К ним относится, например: «ВНИМАНИЕ, РАСПРОДАЖА!!!», « НАЖМИ СЮДА И БУДЕТ ТЕБЕ МИЛЛИОН ДОЛЛАРОВ!». Распознав одну из подобных фраз (или очень похожую на неё), почтовый робот утилизирует письмо. Некоторые критерии дают больше очков, некоторые меньше. Вот, например, образец разбора критериев от «Spam Assassin ». Это наиболее популярный спам-фильтр во всем мире.

Итак, письмо будет помещено в спам , если оно:

  • упоминает выигрыши огромных денежных сумм (0.2 очка);
  • спрашивает, зачем платить больше? (1.25 очка);
  • гарантирует возврат денег за что-либо (2 очка);
  • содержит обращение о каком-то срочном вопросе, не терпящем отлагательств (2.9 очков);
  • предлагает дешёвую ипотеку или рефинансирование (3 очка);
  • рассказывает секрет небывалого успеха (2.4 очка);

Если ваше письмо содержит количество спама выше определенного порога, то оно удаляется.

Конечно, вы сразу захотите спросить, на каком уровне установлен этот порог? К сожалению, утешительного ответа нет. На каждом сервере администратор индивидуально устанавливает планку. Если пользователь уже сыт по горло мусорной рассылкой, то порог будет установлен очень низко. Почти ВСЯ корреспонденция в таком случае будет отправляться в утиль.

Упомянутый выше список критериев для определения спама постоянно растет, фильтры сами подстраиваются под изменения и новые уловки «спаммеров». Список обновляется каждый раз, когда пользователь нажимает кнопку «Это спам» в своем почтовом ящике. Спам-фильтры способны даже синхронизировать работу и обмениваться опытом в режиме онлайн.

Какие могут быть стандартные ошибки и как их избежать?

  • Использование спамерских фраз: «Нажми сюда!», «Получили миллион за минуту!»;
  • Обилие восклицательных знаков в заголовках и в теле письма;
  • Злоупотребление клавишей «CAPS LOCK»;
  • Яркие цвета шрифтов, в частности красный, зеленый;
  • Неправильная кодировка;
  • Использование одного большого изображения вместо текстового письма. Когда изображение не сопровождается минимальным количеством текста, письмо удаляется, признанное спамом;
  • Использование слов «Тест», «Привет», «Проверка», «Test» в теме письма. Эту ошибку допускают те, кто проводит тестовую рассылку внутри своей корпоративной почты;
  • Рассылка одного письма множеству адресатов в рамках одной организации. В этом случае брендмауэр почтового клиента фирмы идентифицирует рассылку, как спам-атаку. Это сложный вариант, с которым не справится никакая почтовая служба. Здесь всё зависит только от системного администратора компании;
  • Копирование текста из документа Microsoft Word в почту. Тут имеет место несовпадение форматов, текст и Word-а в формате HTML будет отображаться не правильно. В частности, это касается кавычек, троеточия;

Как узнать, попадают ли письма в Корзину или Нежелательные?

Для начала проанализируйте уровень открытия писем рассылки, используя