View previous topic :: View next topic |
Author |
Message |
kserg-2002 Messenger
Joined: 14 Sep 2009 Posts: 37 Location: Томск
|
Posted: 15 Mar 2013 8:36 (Fri) Post subject: Антиспам - фильтр по тексту/содержимому письма |
|
|
Используем So-1024. Но в последнее время что-то много спама валиться начало.
Может она как-то отключиться? Хотя нет - в папку Спам-то всё равно много писем попадает.
Каким образом посмотреть, сколько писем прошло через Спамоборону, сколько отклонено и т.п.?
И вопрос по внутреннему антиспам-фильтру.
Возможно ли в чёрный список внести правило фильтрации письма по его тексту.
Вот пришло письмо с такой темой:
Code: | cл{y}жбa дocт{a}в{k}и реkл{a}mы |
Поле От кого - тоже простой адрес...
Как его выцепить и определить в спам?
А ниже в самом тексте письма уже всё по-русски правильно написано, и можно по некоторым стандартным словам/фразам определить это письмо как спам. _________________ CMS 2.12 License, запуск службой |
|
Back to top |
|
|
NAMOR CMS Developer
Joined: 15 Oct 2005 Posts: 1079
|
Posted: 15 Mar 2013 10:38 (Fri) Post subject: Re: Антиспам - фильтр по тексту/содержимому письма |
|
|
kserg-2002 wrote: | И вопрос по внутреннему антиспам-фильтру.
Возможно ли в чёрный список внести правило фильтрации письма по его тексту. |
Фильтрации по тексту письма нет.
kserg-2002 wrote: | Вот пришло письмо с такой темой:
Code: | cл{y}жбa дocт{a}в{k}и реkл{a}mы |
Поле От кого - тоже простой адрес...
Как его выцепить и определить в спам? |
Например, правилом "чёрного списка" антиспама:
Условие: *Subject:"(([a-z][а-я]|[а-я][a-z]).*){2,}"
Описание: два или более сочетаний ru- и en-букв |
|
Back to top |
|
|
kserg-2002 Messenger
Joined: 14 Sep 2009 Posts: 37 Location: Томск
|
Posted: 18 Mar 2013 11:27 (Mon) Post subject: |
|
|
Спасибо.
Пропустил про регулярные выражения, надо будет разобраться.
А такое как отфильтровать:
Code: | Р.А./ С * .С\ Ы-Л.КИ |
Соответственно, знаки между буквами могут быть разные и несколько.
Буквы, вроде, русские, но могут быть и английские. _________________ CMS 2.12 License, запуск службой |
|
Back to top |
|
|
NAMOR CMS Developer
Joined: 15 Oct 2005 Posts: 1079
|
Posted: 18 Mar 2013 20:28 (Mon) Post subject: |
|
|
kserg-2002 wrote: | Пропустил про регулярные выражения, надо будет разобраться. |
Это правильно. Весьма полезная вещь.
kserg-2002 wrote: | А такое как отфильтровать:
Code: | Р.А./ С * .С\ Ы-Л.КИ |
Соответственно, знаки между буквами могут быть разные и несколько.
Буквы, вроде, русские, но могут быть и английские. |
(p|р)[^a-zа-я]*(a|а)[^a-zа-я]*(c|с)[^a-zа-я]*(c|с)[^a-zа-я]*(bI|ы)[^a-zа-я]*(/\\|л)[^a-zа-я]*(k|к)[^a-zа-я]*(u|и) |
|
Back to top |
|
|
kserg-2002 Messenger
Joined: 14 Sep 2009 Posts: 37 Location: Томск
|
Posted: 25 Mar 2013 7:35 (Mon) Post subject: |
|
|
Ууух, махина.
А каким образом запретить, если в теме сообщения нет русских символов? В том числе и чисел.
Либо разрешить, если найдено хотя бы 2 русских символа.
Но - тема может быть пустой строкой.
-----------------
Вот еще тема письма:
Code: | ?овое ??ед??во по на?а?ивани? ?е?ни?. |
Правило какое сделать?
Если больше двух знаков вопроса?
Или, например, строку с незначащими символами:
\|/*-+<>;:'"{}[]=_()&?%^$#@!
Если встречается комбинация одинаковых символов больше 2х - 3х раз, тогда отсеивать? _________________ CMS 2.12 License, запуск службой |
|
Back to top |
|
|
NAMOR CMS Developer
Joined: 15 Oct 2005 Posts: 1079
|
Posted: 25 Mar 2013 15:43 (Mon) Post subject: |
|
|
kserg-2002 wrote: | А каким образом запретить, если в теме сообщения нет русских символов? В том числе и чисел. |
*Subject!:"[а-я\d]" & Subject!:""
kserg-2002 wrote: | Либо разрешить, если найдено хотя бы 2 русских символа.
Но - тема может быть пустой строкой. |
*Subject:"([а-я].*){2}" | Subject:""
kserg-2002 wrote: | Вот еще тема письма:
Code: | ?овое ??ед??во по на?а?ивани? ?е?ни?. |
Правило какое сделать?
Если больше двух знаков вопроса? |
Почтовый клиент отображает знаки вопроса в теме письма, когда не может отобразить какие-то спецсимволы. Так что в фильтрации именно по знакам вопроса смысла мало.
Значения полей заголовка письма лучше смотреть в отладочном журнале CMS. Там они будут ближе к реальным.
kserg-2002 wrote: | Или, например, строку с незначащими символами:
\|/*-+<>;:'"{}[]=_()&?%^$#@!
Если встречается комбинация одинаковых символов больше 2х - 3х раз, тогда отсеивать? |
Не знаю.
Разберитесь, как работают приведённые в этой теме регулярные выражения, почитайте справку CMS на эту тему, и составьте нужные вам выражения. |
|
Back to top |
|
|
kserg-2002 Messenger
Joined: 14 Sep 2009 Posts: 37 Location: Томск
|
Posted: 26 Mar 2013 6:13 (Tue) Post subject: |
|
|
Спасибо.
Потихоньку читаю... разбираюсь...
А в теме письма
Если писать регулярное выражение, соответственно - без кавычек?
Или всё в кавычках? То есть, проверка, в данном случае, на двойные буквы, русские, английские? Например, что в слове "Рассылка" может быть одна буква С написана.
Quote: | *Subject!:"[а-я\d]" & Subject!:"" |
Вот в начале строки нужен символ *, а после знака & или | не нужен перед словом Subject символ * ?
Нда. Пока разберешься тут...
Например, тема письма такая:
Code: | Dear admin get 78% off |
Надо письмо отправить в Спам.
А по теме русских букв...
В спам отправить его нужно.
Но если в теме письма стоит только цифра 1 - не надо в спам отправлять.
Так что правило... надо ковырять будет... _________________ CMS 2.12 License, запуск службой |
|
Back to top |
|
|
NAMOR CMS Developer
Joined: 15 Oct 2005 Posts: 1079
|
Posted: 26 Mar 2013 14:54 (Tue) Post subject: |
|
|
kserg-2002 wrote: | А в теме письма
Если писать регулярное выражение, соответственно - без кавычек?
Или всё в кавычках? |
В строке условия имя поля задаётся без кавычек, а искомая строка или регулярное выражение — в кавычках.
Если искомая строка или регулярное выражение содержат кавычки, они (кавычки) должны быть продублированы.
kserg-2002 wrote: | То есть, проверка, в данном случае, на двойные буквы, русские, английские? Например, что в слове "Рассылка" может быть одна буква С написана. |
Здесь не понял, о чём речь.
kserg-2002 wrote: | Quote: | *Subject!:"[а-я\d]" & Subject!:"" |
Вот в начале строки нужен символ *, а после знака & или | не нужен перед словом Subject символ * ? |
Да, справку вы явно не читали...
Символ "*" перед именем поля означает, что вместо простого поиска подстроки, будет выполняться поиск регулярного выражения. Символы "&" и "|" к этому никакого отношения не имеют.
kserg-2002 wrote: | Например, тема письма такая:
Code: | Dear admin get 78% off |
Надо письмо отправить в Спам. |
*Subject:"% (o|0)ff" |
|
Back to top |
|
|
kserg-2002 Messenger
Joined: 14 Sep 2009 Posts: 37 Location: Томск
|
Posted: 28 Mar 2013 5:26 (Thu) Post subject: |
|
|
NAMOR wrote: | kserg-2002 wrote: | То есть, проверка, в данном случае, на двойные буквы, русские, английские? Например, что в слове "Рассылка" может быть одна буква С написана. |
Здесь не понял, о чём речь. |
В плане, то, что "Рассылка" может быть написана и с большой, и с маленькой буквы, и содержать одну букву "С": (р|Р)а(с - 1 или 2)ылка
NAMOR wrote: | kserg-2002 wrote: | Quote: | *Subject!:"[а-я\d]" & Subject!:"" |
Вот в начале строки нужен символ *, а после знака & или | не нужен перед словом Subject символ * ? |
Да, справку вы явно не читали...
Символ "*" перед именем поля означает, что вместо простого поиска подстроки, будет выполняться поиск регулярного выражения. Символы "&" и "|" к этому никакого отношения не имеют. |
Справку явно читал...
Сейчас посмотрел внимательней - увидел. Про регулярные выражения в справке почти пропускал до этого момента...
NAMOR wrote: | kserg-2002 wrote: | Например, тема письма такая:
Code: | Dear admin get 78% off |
Надо письмо отправить в Спам. |
*Subject:"% (o|0)ff" |
Но таким образом... выделится только "% (o|0)ff"
Письмо уйдёт в спам, но... хочется для всех подобных выражений.
Читаю про регулярные выражения потихоньку...
Всё-таки, каким образом правильно выделить...
1. Если в теме письма только английские буквы (\w) - в спам.
2. Но если встречается 2 русских символа - не в спам.
3. Если в теме письма только одни цифры - не в спам.
Вот по этому условию у меня что-то не правильно пошло:
Code: | *Subject!:"[а-я\d]" |
_________________ CMS 2.12 License, запуск службой |
|
Back to top |
|
|
NAMOR CMS Developer
Joined: 15 Oct 2005 Posts: 1079
|
Posted: 28 Mar 2013 15:19 (Thu) Post subject: |
|
|
kserg-2002 wrote: | В плане, то, что "Рассылка" может быть написана и с большой, и с маленькой буквы, и содержать одну букву "С": (р|Р)а(с - 1 или 2)ылка |
Справка CMS wrote: | По умолчанию проверка соответствия — регистронезависимая (модификатор "i" установлен). |
Замените второй фрагмент "(c|с)[^a-zа-я]*" на "((c|с)[^a-zа-я]*)?".
kserg-2002 wrote: | Про регулярные выражения в справке почти пропускал до этого момента... |
О том и речь.
kserg-2002 wrote: | Всё-таки, каким образом правильно выделить...
1. Если в теме письма только английские буквы (\w) - в спам.
2. Но если встречается 2 русских символа - не в спам.
3. Если в теме письма только одни цифры - не в спам. |
"Белый список" антиспама, условие:
*Subject:"[а-я][^а-я]*[а-я]" | *Subject!:"\D"
"Чёрный список" антиспама, условие:
*Subject!:"\W" |
|
Back to top |
|
|
superoberon Subscriber
Joined: 01 Apr 2011 Posts: 14 Location: Russian Federation
|
Posted: 16 May 2017 14:31 (Tue) Post subject: Антиспам - фильтр по тексту/содержимому письма |
|
|
Добрый день.
Вернулся к этой теме, т.к. не нашел готового решения, а свои эксперименты не увенчались успехом.
С недавнего времени резко стали приходить письма примерно одинакового содержания. Понятно что это либо спам, либо, виду недавних кибер атак, письмо ссылкой на вирус шифровальщик.
Захотелось не допустить появления такого письма.
В теме всегда 4-х значное число.
Какое условие мне прописать чтобы при наличии такой темы письмо блокировалось? (добавить в черный список адреса не представляется возможным, т.к. отправитель всегда разный)
Пробовал много вариантов, но то 5-ти значные числа также отбраковывались, то с буквами.
заранее благодарен. |
|
Back to top |
|
|
NAMOR CMS Developer
Joined: 15 Oct 2005 Posts: 1079
|
Posted: 16 May 2017 16:14 (Tue) Post subject: Re: Антиспам - фильтр по тексту/содержимому письма |
|
|
superoberon wrote: | В теме всегда 4-х значное число.
Какое условие мне прописать чтобы при наличии такой темы письмо блокировалось? |
*Subject:"(^|\D)\d{4}($|\D)" |
|
Back to top |
|
|
superoberon Subscriber
Joined: 01 Apr 2011 Posts: 14 Location: Russian Federation
|
Posted: 16 May 2017 16:25 (Tue) Post subject: |
|
|
Спасибо, попробую. |
|
Back to top |
|
|
superoberon Subscriber
Joined: 01 Apr 2011 Posts: 14 Location: Russian Federation
|
Posted: 17 May 2017 9:23 (Wed) Post subject: |
|
|
superoberon wrote: | Спасибо, попробую. |
К сожалению удаляет еще и с темой, где кроме 4-х цифр есть еще и буквы.
например "Тест 1234" не пропустило. |
|
Back to top |
|
|
NAMOR CMS Developer
Joined: 15 Oct 2005 Posts: 1079
|
Posted: 17 May 2017 11:50 (Wed) Post subject: |
|
|
Для блокирования писем, у которых тема содержит только 4 цифры подряд и больше ничего, условие такое:
*Subject:"^\d{4}$" |
|
Back to top |
|
|
|