Портал аспирантов
 

Вернуться   Портал аспирантов > Компьютер для аспирантов > Software (программное обеспечение)

Ответ
 
Опции темы
Старый 24.08.2003, 22:58   #11
McLaud
Newbie
 
Регистрация: 23.08.2003
Сообщений: 8
По умолчанию Программы для защиты от спама

Ну, простое "англ" в комбинациях режет и нормальные письма, тоже пробовали.
Регулярные выражения - это дело, но я в OutLooke не знаю как и куда их писать, только на РНР знаю (Может кто подскажет на конкретном примере?)
У них там телефон указан, вот тогда если убрать все что в заголовке или тексте содержит выражение типа *1*5*4*2*2*7*1*, где * - один-два пробела или тире или ничего, то тогда должно сработать.
Мне кажется, что надо именно телефоны искать, а не текст. Тогда это конкретно только на этого спамера будет. А вероятность появления чего подобного в нормальном письме будет - как авиакатастрофы.

Цитата:
работает по методу bayesian filter
По Байесу, млин... Помню, было дело... Деконволюция по Байесу - тоже хорошая штука. Видать умный был Байес.
Посмотрю. Спасибо.

Короче, у кого ума палата, напишите регулярное выражение с телефоном, а? Чего словеса разводить...

Цитата:
Получается, что самое ценное - это правила для стоп-листа
Да я давно согласная, что это самое ценное!
Дак и цитани свой стоп-лист, если опыт положительный, не будь жадной девочкой.
Если не будешь жадной девочкой, то вот тебе подарок:
http://mclaud.by.ru/presents/present2.html
А Эслера я не люблю, он глуповат на мой вкус и совсем неученый. А я ученых люблю.

Цитата:
И за 3 года пользования интернетом рекламных писем приходило максимум 8-10. Все в период последних месяцев, когда я разместил в интернете свои резюме.
Где разместил-то? Дай почтать, чего ученые про себя пишут.
Если бы в известном месте разместил, то тут же тебя бы и сосчитали.
McLaud вне форума   Ответить с цитированием
Реклама
Старый 25.08.2003, 00:01   #12
lynx
Администратор
 
Аватар для lynx
 
Регистрация: 30.07.2001
Сообщений: 2,827
По умолчанию Программы для защиты от спама

Цитата:
один-два пробела или тире или ничего, то тогда должно сработать.
Вот регесп для:

Одна или несколько цифр,
за которыми идет ноль или несколько пробелов
или тире:


\d+((\s*)|(-))






Добавлено


А вот то же самое, только все это:

один или более раз: (Одна или несколько цифр,
за которыми идет ноль или несколько пробелов
или тире)


{1(\d+((\s*)|(-))),}




Кошки сами писали

Добавлено


Цитата:
цитани свой стоп-лист, если опыт положительный, не будь жадной девочкой.
Я про Амеркан цитанула, а остальное - у Экслера брала

Еще у меня стоит как регеспы по теме:

Цитата:
Symantec AVF detected*
Undeliverable Message*
DrWeb-DAEMON*
рассылк*
почтов*
магаз*
*купить*

По заголовкам как "любая строка найдена":

Цитата:
Гражданство
Предлагаем
санаторий
Турфирма
friend
ИTAЛ
Money
Business
офис
в и з и т к и
курсы
Meet people who want to meet you
работа
оптом
DVD
салон
продажа
руководителю
продается
ремонт
кредит
услуги
маркетинг
обучение
Бизнес
Free
бесплатно
patch
офис
аренд
Доставка
тамож
груз
заказ
полиграф
new mail
КВАРТИР
КОМАР
СОТОВ
семинар
НОВИНКА
Заказ
продаю
Хотите
Интернет
Обмен ссылками
Визитки
бархатный сезон
Туры
Thank you
предлагаем
Your application
Details
movie
Your details
screensaver
Кoндицuoнеpы
РЕКЛАМА
Но, надо признать, поскольку я руками вношу все это, часто повторы и неэффективно все, то есть можно все сократить, да так оно добавляется потихоньку, а сократить, написан рег. выражение руки не доходят, к тому же анализ быстро идет - время на анализ не критично, хоть сто строк хоть пять, примерно одни и то же время.

Пока я с вами болтала, мне юниксоиды регесп мой оптимизнули, последний вариант можно записать как:

(\d+((\s*)|(-)))+

Что аналогично

{1(\d+((\s*)|(-))),}

Цитата:
Фильтры по темам и/или заголовкам плохи тем, что их нужно постоянно дополнять, причем _думать_ над этим. П
Бяда... А что делать
lynx вне форума   Ответить с цитированием
Старый 25.08.2003, 02:12   #13
Jacky
Администратор
Jack of Shadows
 
Аватар для Jacky
 
Регистрация: 13.05.2002
Адрес: Москва
Сообщений: 7,533
По умолчанию Программы для защиты от спама

lynx
Цитата:
Бяда... А что делать
Да я уже вижу, что легких путей тут не ищут. Можно, конечно, поставить какой-нибудь анализатор, тот же POPFile и расслабиться, а можно сурово писать регэкспы а потом их оптимизировать. Фильтры руками править, опять же. Каждому свое. Мне в самом деле лень -- бо занятие малоинтересное.
---------
Рано или поздно, так или иначе...
Jacky вне форума   Ответить с цитированием
Старый 25.08.2003, 05:33   #14
McLaud
Newbie
 
Регистрация: 23.08.2003
Сообщений: 8
По умолчанию Программы для защиты от спама

Спасибо.
Только я совсем не врубился, куда это писать все надо?
То есть к чему
(\d+((\s*)|(-)))+
присобачивать?
Это же на Перле так?
Или как?
McLaud вне форума   Ответить с цитированием
Старый 25.08.2003, 06:02   #15
Dubrovsky
Newbie
 
Регистрация: 25.08.2003
Сообщений: 1
По умолчанию Программы для защиты от спама

Banned
Dubrovsky вне форума   Ответить с цитированием
Старый 25.08.2003, 08:03   #16
DrVatson
Newbie
 
Регистрация: 25.08.2003
Сообщений: 1
По умолчанию Программы для защиты от спама

banned
DrVatson вне форума   Ответить с цитированием
Старый 25.08.2003, 14:09   #17
lynx
Администратор
 
Аватар для lynx
 
Регистрация: 30.07.2001
Сообщений: 2,827
По умолчанию Программы для защиты от спама

McLaud

Цитата:
к чему
(\d+((\s*)|(-)))+
присобачивать?
Это же на Перле так?
Нет, это на регекспе - Unix regexp

Писать надо лол... в стоп лист, если он у Вас понимает рег. выражения.

Я пишу рег. выражения в текстовый файл. По одному выражению в строку. Потом этот файл подключается к Бату (The_bat).

lynx вне форума   Ответить с цитированием
Старый 13.09.2003, 13:59   #18
Jacky
Администратор
Jack of Shadows
 
Аватар для Jacky
 
Регистрация: 13.05.2002
Адрес: Москва
Сообщений: 7,533
По умолчанию Программы для защиты от спама

Возвращаясь к истокам темы, еще немного о защите от спама. Для тех, кто не решил проблему, но колеблется в выборе варианта (или просто не знает, какие возможны варианты кроме бесполезного записывания обратных адресов спамеров, практически всегда фальшивых, в стоп-лист почтовой программы.

Итак, статистика работы POPFile с 23 августа по сегодняшний день.

Классифицированные письма: 766
Ошибки классификации: 1
Точность: 99.86%

На возможный комментарий типа "а, она все-таки ошиблась" отмечу, что здесь нет ничего страшного. Одно пропущенное спам-сообщение за 22 дня, вполне нормально. Более того, принцип работы байес-фильтра таков, что в будущем подобных ошибок больше не будет. В данном случае спамеру удалось придумать какой-то нестандартный ход, позволивший письму пройти сквозь фильтр, но теперь все письма подобного типа будут однозначно отфильтрованы. В этом и прелесть программы, она не просто использует фиксированный набор правил, а учится на каждой своей ошибке, совершенствуя защиту.

Линк на POPFile я давал на первой странице этой темы.
---------
Рано или поздно, так или иначе...
Jacky вне форума   Ответить с цитированием
Старый 30.04.2004, 18:46   #19
Philosof
Gold Member
 
Аватар для Philosof
 
Регистрация: 08.07.2002
Сообщений: 1,044
По умолчанию Программы для защиты от спама

Должен сказать, что за последнее время количество недоставленных писем - как мне, так и от меня - стало критическим. Редкий случай, когда удается что-то отправить/получить. Причем всякая ерунда, типа приглашения принять участие в розыгрыше подарков для клиентов, проходит свободно, а действительно нужные вещи если проходят, то с пометкой "спам".
Philosof вне форума   Ответить с цитированием
Старый 01.05.2004, 00:05   #20
lynx
Администратор
 
Аватар для lynx
 
Регистрация: 30.07.2001
Сообщений: 2,827
По умолчанию Программы для защиты от спама

Philosof
Цитата:
олжен сказать, что за последнее время количество недоставленных писем - как мне, так и от меня - стало критическим. Редкий случай, когда удается что-то отправить/получить. Причем всякая ерунда, типа приглашения принять участие в розыгрыше подарков для клиентов, проходит свободно, а действительно нужные вещи если проходят, то с пометкой "спам".
К сожалению да.
мейл.ру блокирует работу серверов безбожно. Сервер ру-борда забанен у них навно и прочно. Наш сервер забанен на рамблере. Ну, и т.д. Это иллюстрация того, что Джеки называл "нет проблем" - сплошные проблемы
lynx вне форума   Ответить с цитированием
Ответ

Опции темы

Ваши права в разделе
Вы не можете создавать новые темы
Вы не можете отвечать в темах
Вы не можете прикреплять вложения
Вы не можете редактировать свои сообщения

BB коды Вкл.
Смайлы Вкл.
[IMG] код Вкл.
HTML код Выкл.



Текущее время: 17:58. Часовой пояс GMT +3.


Powered by vBulletin® Version 3.8.8
Copyright ©2000 - 2024, vBulletin Solutions, Inc. Перевод: zCarot
© 2001—2024, «Аспирантура. Портал аспирантов»
Рейтинг@Mail.ru