Форум: Форум PHPФорум ApacheФорум Регулярные ВыраженияФорум MySQLHTML+CSS+JavaScriptФорум FlashРазное
Новые темы: 0000000
Программирование. Ступени успешной карьеры. Авторы: Кузнецов М.В., Симдянов И.В. PHP 5. На примерах. Авторы: Кузнецов М.В., Симдянов И.В., Голышев С.В. PHP Puzzles. Авторы: Кузнецов М.В., Симдянов И.В. Самоучитель MySQL 5. Авторы: Кузнецов М.В., Симдянов И.В. C++. Мастер-класс в задачах и примерах. Авторы: Кузнецов М.В., Симдянов И.В.
ВСЕ НАШИ КНИГИ
Консультационный центр SoftTime

Форум PHP

Выбрать другой форум

 

Здравствуйте, Посетитель!

вид форума:
Линейный форум Структурный форум

тема: Я тут детектор мата безсловарный написал >> php8.h15.ru
 
 автор: rava   (02.08.2005 в 16:45)   письмо автору
 
 

Морда проекта - http://php8.h15.ru
Сердце проекта - http://php8.h15.ru/Regexps.exe.txt
Лог проекта - http://php8.h15.ru/Fucking%20file.txt
---
Это самоубучающаяся программа. У нее есть шесть регулярных выражений, по которым легко найти русский мат. Программа ихх корректирует самостоятельно, обучаясь на ваших запросах. Текущая версия матового фильтра - http://php8.h15.ru/Regexps.exe.txt. Здесь шесть контейнеров, которые заполняются матом.

Если я буду иметь честь видеть ваш мат у себя в проекте - мы вместе создадим регулярное выражение, содержащее в себе весь мат :)

В файле http://php8.h15.ru/Regexps.exe.txt нетрудно разобраться. МОжете юзать его в своих проектах. Ссылка на меня особо желательна.

   
 
 автор: Akira   (02.08.2005 в 17:33)   письмо автору
 
   для: rava   (02.08.2005 в 16:45)
 

Фильтр мата :) Это не очень хорошая мысль, подстегивать пользователей показать, мол, смотрите какой я, обманул фильтр.
Лучше делать лог, который бедт остылать модератору, где есть ПОДОЗРЕНИЕ на мат.

   
 
 автор: Гость   (02.08.2005 в 17:38)   письмо автору
 
   для: Akira   (02.08.2005 в 17:33)
 

Мои матерные запросы программа начисто проигнорровала :)

   
 
 автор: Akira   (02.08.2005 в 17:52)   письмо автору
 
   для: Гость   (02.08.2005 в 17:38)
 

"Оскорблять" - не матное слово, но его заметила как матное.

   
 
 автор: cheops   (02.08.2005 в 19:26)   письмо автору
 
   для: rava   (02.08.2005 в 16:45)
 

Мне понравилось - с удовольствием повозился...

   
 
 автор: cheops   (02.08.2005 в 19:28)   письмо автору
 
   для: rava   (02.08.2005 в 16:45)
 

Если хотите, мы поместим вас скрипт в раздел downloads (со ссылкой на ваш сайт, где посетители смогут его испытать и скачать обновления)? Только нам понадобятся ваши ФИО.

   
 
 автор: RV   (02.08.2005 в 20:33)   письмо автору
 
   для: cheops   (02.08.2005 в 19:28)
 

если в слове заменить русскую букву еа англицкую то все :) выглядит как по русски а не заменяет. как способ обхода подобных фильтров

   
 
 автор: cheops   (02.08.2005 в 21:20)   письмо автору
 
   для: RV   (02.08.2005 в 20:33)
 

Для предотвращения этого следует использовать допонительный модуль
<?php
  
// Массив кирилических букв
  
$rus = array("А","а","В","Е","е","К","М","Н","О","о","Р","р","С","с","Т","Х","х");
  
// Массив латинских букв
  
$eng = array("A","a","B","E","e","K","M","H","O","o","P","p","C","c","T","X","x");
  
// Заменяем латинские буквы русскими
  
$text str_replace($eng$rus$text); 
?>

   
 
 автор: Akira   (02.08.2005 в 21:36)   письмо автору
 
   для: cheops   (02.08.2005 в 21:20)
 

Не хватает главно буквы "у" :)))

   
 
 автор: RV   (03.08.2005 в 06:26)   письмо автору
 
   для: Akira   (02.08.2005 в 21:36)
 

еще букву б можно как цифру 6 (шесть) написать, букву з как цифру 3 (три)

   
 
 автор: ravva   (07.08.2005 в 15:47)   письмо автору
 
   для: rava   (02.08.2005 в 16:45)
 

Ребята! Спасибо за внимание!
Кто-то писал тут, что при замене русской буквы латинскими.. Нет, это мы проходили и все эти фокусы я уже поборол. Даже слово м_UDAKK программа видит нормально. Те, кто обнаружил, что нематерное слово принято за мат мне очень помогли. Насколько я помпю вчерашний пьяный вечер - я кое-что исправил в программе, так что ОСКОРБЛЯТЬ - это теперь не мат. Люди! Давайте поматеримся в предоставленное мной отверстие, мне это очень поможет!!! В настоящее время программа берет от меня несколько матерных однокоренных слов, кстраняет корелляции и компилирует регулярные выражения под группы слов независимые от настройки локали. Коспилятор регэкспов мне тоже пришлось написать, так как руками три килобайта существующих регэкспов я написать бы не смог, а так - пожалуйста. Коспилятор помогает добавлять в регэкспы умный мусор, позволяюший писать вам мат через точки или пробелы. Ладно, много еще можно рассказывать. Тот участок кода, который мне предложили элементарен, и конечно использовался раньше в моем движке, сейчас это сделано хитрее. Короче на транслите мат тоже виден.
Есть проблема - моя система "компилятор+детектор_по_регэкспам" уже достигла потолка, я соображаю на тему принципиально новой системы в пользу лексического анализатора. Я хочу, чтобы когда вы писали "ДИ ТЫ НАХ", программа могла сообщить, что SMBD послал SMBD нах и так делее.
Политика применения движка - другой разговор. Сообщать модератору или материться в ответ - это все политика. Мы тут программированием занимаемся а не политикой - это потом.
Призываю посещать регулярно мой движок - иногда вечерком я заглядываю в лог и понимаю, что бы подправить, что бы добавить.
Наработанная нами система будет в конце-концов опубликована. Спасибо.
__My old password has потерян and i gon a new nick.

   
 
 автор: Евгений Петров   (07.08.2005 в 16:21)   письмо автору
 
   для: ravva   (07.08.2005 в 15:47)
 

Уже на второй фразе матов не было обнаружено.
Слово "за.битесь" (без точки естественно). Зато "за.бись" нашел.

   
 
 автор: Евгений Петров   (07.08.2005 в 16:26)   письмо автору
 
   для: Евгений Петров   (07.08.2005 в 16:21)
 

И вообще много не находит. Но все равно заслуживает уважения.

   
 
 автор: Евгений Петров   (07.08.2005 в 16:28)   письмо автору
 
   для: Евгений Петров   (07.08.2005 в 16:21)
 

Извиняюсь, прогнал, находит. :)))

   
 
 автор: napTu3aH   (07.08.2005 в 16:39)   письмо автору
 
   для: ravva   (07.08.2005 в 15:47)
 

правда много чего не находить а если тебе матов много надо
есть програмулина "мат генератор"
найди и попробуй поюзать, там такие слова встречаютсья, нарочно не придумаешь :)

   
 
 автор: Киналь   (07.08.2005 в 16:50)   письмо автору
 
   для: napTu3aH   (07.08.2005 в 16:39)
 

Да не, в основном ловит... Но меня лог-файл порадовал=) Ради него одного можно было делать:-)

   
 
 автор: Евгений Петров   (08.08.2005 в 00:52)   письмо автору
 
   для: Киналь   (07.08.2005 в 16:50)
 

Ага! Можно было даже маты на отслеживать! :)))

   
 
 автор: Akira   (08.08.2005 в 01:33)   письмо автору
 
   для: Евгений Петров   (08.08.2005 в 00:52)
 

Накрылся сайт

   
Rambler's Top100
вверх

Rambler's Top100 Яндекс.Метрика Яндекс цитирования