SPAM достал. Но ещё больше достало IT

Mar 07, 2016 18:20

Вот я офигиваю. После этой многолетней трескотни про байесовы фильтры и прочую артифишиал интеледженс в реальной жизни всё происходит наоборот. "Тонко-настроенные" корпоративные фильтры регулярно блокируют сообщения с полезной для меня технической информации (типа NASA Tech Briefs, пропаганда от моих CAD вендоров, радиотехнические каталоги и т.п ( Read more... )

shop-talk, go figure

Leave a comment

Comments 9

dedushka March 8 2016, 00:00:06 UTC
Чтобы работал искусственный, нужен сначала природный:)

Reply

eastcoastsucks March 8 2016, 00:30:58 UTC
Именно! Золотые слова!

Reply

dedushka March 8 2016, 01:46:34 UTC
Я, кстати, так до сих пор и не понял всего величия Баесовских сетей:)

Reply

eastcoastsucks March 8 2016, 02:43:16 UTC
Ну тут я уже "не в теме". Помню лет десять назад об всем этом очень много болтали. Помню как подумал "надо бы разобраться", но как-то руки и не дошли. Кагебе не моя специальность. Чисто любительский интерес время от времени.

Reply


jescid March 8 2016, 19:50:26 UTC
У вас надо кого-то встряхнуть хорошенько или вообще уволить - того, кто за фильтрацию спама корп. почты ответственный (сисадмин/IT отдел). Давно довольно умные фильтры есть и хорошо работают. Спросишь - расскажу.
Мне спам на корп. почту практически не проходит совсем, от слова никак. Причём на старый (5-летний) адрес тоже, который много где засвечен. И в России на инст. почту (10 лет уже адресу) - тоже ничего и никак.

Reply

eastcoastsucks March 8 2016, 21:43:09 UTC
Спрашиваю

Reply

jescid March 9 2016, 21:44:12 UTC
Там и правда высокая точность фильтрации… На R вот пример с тестом - можешь сам поиграться.
Работает так: машинка (SVM - метод опорных векторов, мы даже это уже проходили и вы, наверно, тоже - если прочитаешь, то вспомнишь) прогоняется на уже размеченых текстах (спвм/не спам), учится. Потом довольно неплохо фильтрует вх. почту, с которой её можно продолжать обучать, скажем, нажимая в клиенте кнопку «спам».
Можно не только SVM использовать, а нейронные сети или того же Баеса, но тот уже, как бы, устарел.
Из актуального софта, который рекомендуется вместо SpamAssasin (Баес) - см. DSPAM
Но SpamAssasin тоже д.б. вырос, с тех пор как был приобретён Apache, но, по-моему (и не только) DSPAM нынче предпочтительнее, потому что эффективнее.
(Извиняюсь за редакцию опечаток)

Reply

eastcoastsucks March 9 2016, 21:54:02 UTC
Спасибо! Изучим!

Reply


Leave a comment

Up