|
|
|
|
|
для: elenaki
(06.09.2007 в 13:47)
| | кстати для ИИ мне это и нужно:)) ну почти ИИ:-D
есть бот "болтун" он обучаеться сам , тоесть тупо запоминает все что ему говорят:) вот я и делаю для него фильтр. | |
|
|
|
|
|
|
|
для: sim5
(06.09.2007 в 13:45)
| | да чего там - сразу искусственный интеллект. :) | |
|
|
|
|
|
|
|
для: mogul
(06.09.2007 в 13:20)
| | >А так же можно создать словарь
"Словарь русского языка", Составитель С.И. Ожегов, Издание третье 1953 г., 52000 слов. | |
|
|
|
|
|
|
|
для: elenaki
(06.09.2007 в 13:38)
| | и даже три одинаковые гласные!
длинношеее | |
|
|
|
|
|
|
|
для: Poison
(06.09.2007 в 13:42)
| | автор: mogul (06.09.2007 в 13:18)
==============================
если есть 3и подряд идущие буквы, то 100%, что это слово не подходит под правила русского языка, | |
|
|
|
|
|
|
|
для: elenaki
(06.09.2007 в 13:38)
| | Это к чему?) | |
|
|
|
|
|
|
|
для: Poison
(06.09.2007 в 13:33)
| | в русском могут встречаться и 3 и 4 согласные подряд | |
|
|
|
|
|
|
|
для: mogul
(06.09.2007 в 13:20)
| | Ну вот что набросал:)
<?
function repeatSymbols($str = "") {
$str = preg_replace( "~[\s]+~i", "", strtolower( $str ) );
$str_len = strlen($str);
$s = 0;
$result = array();
while ( isset( $str{$s} ) ) {
if ( isset( $result[ $str{$s} ] ) ) {
$result[ $str{$s} ]++;
} else {
$result[ $str{$s} ] = 1;
}
$s++;
}
arsort($result);
print_r($result);
foreach ( $result as $symbol => $count ) {
$percent = round( ( $count / $str_len ) * 100 );
if ( $percent >= 15 ) {
echo "опля:) ";
}
echo $percent;
echo "\n";
}
}
|
Упопрно не тестировал но строку sim5 ловит:) предпоследнее сообщение нет.
Пойду поем... и заобно подумаю. | |
|
|
|
|
|
|
|
для: Poison
(06.09.2007 в 13:04)
| | Вот еще, можно сделать так, что сообщения не попадают в базу сразу, а идут к модератору и он решает, но это уже нужно возиться. | |
|
|
|
|
|
|
|
для: sim5
(06.09.2007 в 13:13)
| | Я знал что вы это спросите:)
Нет конечно... но все-же избавиться хоть от половины мусора. | |
|
|
|
|