Courier Mail Server

GrAnd

Âíà÷àëå õîòåë ýòî íàïèñàòü â "Ïðåäëîæåíèÿ ïî äàëüíåéøåìó ðàçâèòèþ ïðîâåðîê". Íî ïîòîì ïåðåäóìàë. Èáî ýòî ìîæåò áûòü ðåàëèçîâàíî âíåøíèìè ïîäêëþ÷àåìûìè dll (÷åðåç âûçîâ âíåøíåãî àíòèñïàìà) èëè ïðîãðàììàìè (÷åðåç âûçîâ ïðèëîæåíèÿ â ñîðòèðîâùèêå). Òàê ÷òî, ïðîñòî îïèøó êîíöåïöèþ. Ìîæåò áûòü êòî-òî çàèíòåðåñóåòñÿ:

Èäåÿ íå íîâà. ß åå îáêàòûâàë â êîíöå 2007 ãîäà, êîãäà ïîëüçîâàòåëÿì ïðèõîäèëè ñîòíè ïèñåì ñïàìà â ñóòêè, âñòðîåííûé àíòèñïàì íå ñïðàâëÿëñÿ, íåñìîòðÿ íà âñå èçîùðåííûå ïðàâèëà, à âíåøíèé àíòèñïàì SO-1024 åùå íå ñóùåñòâîâàë.

Ñåé÷àñ ó ìåíÿ âñÿ âõîäÿùàÿ ïî÷òà ïðåäâàðèòåëüíî ôèëüòðóåòñÿ íà øëþçå ïðè ïîìîùè SO-1024 (õîòü îí îôèöèàëüíî è íå ñóùåñòâóåò, êàê áû), òàê ÷òî ýòó èäåþ ÿ çàáðîñèë. Íî âîò â ïîñëåäíþþ íåäåëþ ïîòîê ñïàìà íàñòîëüêî ðåçêî âîçðîñ. ÷òî SO-1024 óæå íå ñïðàâëÿåòñÿ. Õîðîøî, ÷òî ïî PTR ñåé÷àñ ìîæíî ëüâèíóþ äîëþ îòñåêàòü. Íî âñå ðàâíî êîå ÷òî ÷åðåç âñå ÷åòûðå áàðüåðà (PTR, SO-1024, ïðîâåðêà ÷èñëà ïîëó÷àòåëåé, ïðîâåðêè âñòðîåííûì àíòèñïàìîì) ïðîñà÷èâàåòñÿ.

Òàê âîò, èäåÿ çàêëþ÷àëàñü â äåòåêöèè ìàññîâûõ ðàññûëîê ïî íåêîòîðûì êðèòåðèÿì.

Äåëî â òîì, ÷òî ó ñïàìåðîâ ðàçâåòâëåííûå áîòíåòû, âêëþ÷àþùèå òûñÿ÷è õîñòîâ è àäðåñîâ. À ðàññûëêè îãðàíè÷åíû. Äà è ôàíòàçèè è òåõíè÷åñêèõ âîçìîæíîñòåé íå õâàòàåò äàâàòü êàæäîìó ïèñüìó îðèãèíàëüíûå òåìû, èìÿ îòïðàâèòåëÿ è ïîëó÷àòåëÿ. Âîò è ïîëó÷àåòñÿ, ÷òî ïèñüìî ñ îäèíàêîâîé òåìîé ìîæåò ïðèéòè ñ ðàçíûõ àäðåñîâ. Èëè ïî÷òîâûå àäðåñà îòïðàâèòåëåé áóäóò ðàçíûìè, à èìåíà îäèíàêîâûìè. Èëè òî æå ñàìîå äëÿ ïîëó÷àòåëåé - email ðàçíûå, à èìåíà îäèíàêîâûå. È âñ¸ ýòî ìîæíî êîìáèíèðîâàòü ñ ðàçíûìè âåñàìè.

ß ïðîâåë òîãäà ýìóëÿöèþ ðàáîòû òàêîãî ñàìîîáó÷àþùåãîñÿ äåòåêòîðà. Ðàáîòàë îí îòäåëüíî ïî ïîëÿì "From:" è "To:". Ïî "Subject:" íå ñòàë ýìóëèðîâàòü, êàê è ïî IP è êîìàíäàì "MAIL FROM:" è "RCPT TO:". Ïðîñòî áðàë ëîãè CMS, ýìóëÿòîð ïðîñìàòðèâàë èõ è ñàìîîáó÷àëñÿ.
Îáó÷åíèå òîëüêî ïî îäíîìó ïîëþ "From:" ïî ëîãàì çà ìåñÿö äàëî ýôôåêòèâíîñòü áîëåå 30%. Ò.å. ôèëüòð ìîã îòñåèâàòü îêîëî òðåòè ñïàìà.
Îáó÷åíèå ïî ïîëþ "To:" áûëî ñëàáåå: ÷åðåç 2 íåäåëè äîñòèãëî ìàêñèìóìà îòñåâà 10-11% è äàëåå êîëåáàëèñü â ýòèõ ïðåäåëàõ. Ýòî ñâÿçàíî ñ òåì, ÷òî êîëè÷åñòâî àäðåñàòîâ-ïîëó÷àòåëåé â äîìåíå áûëî ñèëüíî îãðàíè÷åíî, ïîýòîìó ôèëüòð íå ìîã äîñòîâåðíî îïðåäåëèòü ìàññîâóþ ðàññûëêó â ðàçíûå àäðåñà.

Îáúåäèíåíèå ýòèõ êðèòåðèåâ, à òàê æå ó÷åò äðóãèõ ïîëåé, àäðåñîâ â êîìàíäàõ è IP-àäðåñîâ ìîãëî äàòü î÷åíü çíà÷èòåëüíûé ýôôåêò.

Ñóòü ìåòîäà îáó÷åíèÿ ñëåäóþùàÿ (íà ïðèìåðå àíàëèçà ïîëÿ "From:"):

1. Â ïðîöåññå îáó÷åíèÿ è ðàáîòû ôèëüòðà ñîçäàåòñÿ ÁÄ ñîîòâåòñòâèé èìåí îòïðàâèòåëåé è èõ àäðåñîâ.
Äàííàÿ èíôîðìàöèÿ èçâëåêàåòñÿ èç ïîëåé "From:" ïèñåì.
2. Êîðòåæ ÁÄ èìååò ñëåäóþùèå ïîëÿ:
Field - 0 äëÿ ïîëÿ "From:", 1 äëÿ "To:" è "Cc:", åñëè îíî òîæå áóäåò ïðîâåðÿòüñÿ è ò.ä.;
Name - èìÿ îòïðàâèòåëÿ/ïîëó÷àòåëÿ, èçâëå÷åííîå èç ýòèõ ïîëåé áåç
ëèäèðóþùèõ è çàìûêàþùèõ ïðîáåëîâ, ïðèâåäåííîå ê îäíîìó ðåãèñòðó (íå îáÿçàòåëüíî).
Addr - àäðåñ îòïðàâèòåëÿ/ïîëó÷àòåëÿ, èçâëå÷åííûé èç ýòèõ ïîëåé (òî, ÷òî â óãëîâûõ ñêîáêàõ).
Flag - ïðèçíàê ñïèñêà. 0 - "áåëûé" ñïèñîê, 3 - "÷åðíûé" ñïèñîê, 1 è 2 - ñåðûå ñïèñêè ðàçíîé ñòåïåíè ïîäîçðèòåëüíîñòè.
Date - äàòà è âðåìÿ ïîñëåäíåãî îáíîâëåíèÿ.
3. Ïåðåä íà÷àëîì îáó÷åíèÿ â ÁÄ íàõîäÿòñÿ òîëüêî çàïèñè "áåëîãî" ñïèñêà. Äëÿ íèõ äàæå íå íóæíû àäðåñà - òîëüêî èìåíà.
4. Êàæäîå ïèñüìî îáðàáàòûâàåòñÿ ñëåäóþùèì îáðàçîì:
4à. Èç ïîëÿ "From:" èçâëåêàþòñÿ èìÿ è àäðåñ. Äëÿ "To:" è "Cc:", âîçìîæíî, ýòî ïðèäåòñÿ ñäåëàòü íåñêîëüêî ðàç ïî î÷åðåäè.
4á. Åñëè èìåíè íåò, òî ïîëå ïðîïóñêàåòñÿ - îáðàáàòûâàòü íå÷åãî.
4â. Åñëè èìÿ åñòü, òî èùåòñÿ â ÁÄ.
4ã. Åñëè èìÿ â ÁÄ íå íàéäåíî, òî îíî äîáàâëÿåòñÿ ñ ôëàãîì ïðèçíàêîì ñïèñêà "1" - "ñâåòëî-ñåðûé" ñïèñîê (îáùèé ñïèñîê). Òàê æå â ÁÄ çàïèñûâàåòñÿ àäðåñ, åñëè îí åñòü.
4ä. Åñëè èìÿ íàéäåíî, òî ñðàâíèâàþòñÿ àäðåñà - çàïèñàííûé è
ñâåæåèçâëå÷åííûé. Äàëüøå âàðèàíòû:
Àäðåñà ñîâïàäàþò. Ôëàã ïðèçíàêà â ÁÄ èçìåíÿåòñÿ ñëåäóþùèì îáðàçîì:
0 --> 0 (íå èçìåíÿåòñÿ),
1 --> 1 (íå èçìåíÿåòñÿ),
2 --> 1 (âîññòàíàâëèâàåòñÿ),
3 --> 3 (íå èçìåíÿåòñÿ).
Àäðåñà íå ñîâïàäàþò. Íîâûé àäðåñ çàïèñûâàåòñÿ â ÁÄ (îáíîâëÿåòñÿ). Ôëàã ïðèçíàêà èçìåíÿåòñÿ ñëåäóþùèì îáðàçîì:
0 --> 0 (íå èçìåíÿåòñÿ),
1 --> 2 (ïåðåíîñèòñÿ â ïîäîçðèòåëüíûå),
2 --> 3 (ïåðåíîñèòñÿ â "÷åðíûé" ñïèñîê êàê äâàæäû ïîäîçðèòåëüíûé è ñðàçó áëîêèðóåòñÿ),
3 --> 3 (íå èçìåíÿåòñÿ).

Íó âîò â ïðèíöèïå è âñå. Òîëüêî åùå íàäî ïðè âûïîëíåíèè ï. 4ä ñíà÷àëà ïðîâåðèòü äàòó ïîñëåäíåãî îáíîâëåíèÿ çàïèñè. Åñëè îíà óñòàðåëà, òî ñ÷èòàòü ôëàã ïðèçíàê íå 2, à 1. Çíà÷åíèÿ ôëàãîâ 0, 1, 3 íå èçìåíÿþòñÿ.

Ðàç âñå ñïèñêè õðàíÿòñÿ â îäíîé ÁÄ, òî ïåðåíåñòè èìÿ èç "÷åðíîãî" ñïèñêà â "áåëûé" ïðîùå íå áûâàåò - ïðîñòî çàìåíÿåì ôëàã íà "0".

Õîðîøî áû èìåòü íåñêîëüêî ðåæèìîâ ðàáîòû ýòîãî ôèëüòðà:
Îáó÷åíèå - èìåíà èç "÷åðíîãî" ñïèñêà íå áëîêèðóþòñÿ.
Êîíòðîëü - ïåðåâîä â "÷åðíûé" ñïèñîê îïîâåùàåòñÿ.
Ôîí - íèêàêèõ ëèøíèõ òåëîäâèæåíèé, êðîìå ëîãà.