Форум: Форум PHPФорум ApacheФорум Регулярные ВыраженияФорум MySQLHTML+CSS+JavaScriptФорум FlashРазное
Новые темы: 0000000
Социальная инженерия и социальные хакеры. Авторы: Кузнецов М.В., Симдянов И.В. C++. Мастер-класс в задачах и примерах. Авторы: Кузнецов М.В., Симдянов И.В. PHP 5/6. В подлиннике. Авторы: Кузнецов М.В., Симдянов И.В. PHP. Практика создания Web-сайтов (второе издание). Авторы: Кузнецов М.В., Симдянов И.В. Объектно-ориентированное программирование на PHP. Авторы: Кузнецов М.В., Симдянов И.В.
ВСЕ НАШИ КНИГИ
Консультационный центр SoftTime

Форум PHP

Выбрать другой форум

 

Здравствуйте, Посетитель!

вид форума:
Линейный форум Структурный форум

тема: Как сделать нечеткий поиск при сравнении баз
 
 автор: Valleri   (03.06.2011 в 16:00)   письмо автору
 
 

Дано
1. Две базы, набивали разные люди, со сходной инфой(есть пересечение множеств).
2. Задан алгоритм сравнения, использующий функцию array_search, обладающий нужной скоростью работы.
3.При вводе данных ошибки грамматики(в словах, кавычки, запятые, заглавные...) приводят к существенной не точности работы алгоритма.

Вопрос: Как изменить алгоритм без особого снижения скорости работы?

Краеугольный камень.
1. Хочется залить больше инфы
2. Опасность дублированного контента.
При каком проценте совпадения, поисковые системы признают дублированным контент и наказывают?

  Ответить  
 
 автор: Ильдар   (05.06.2011 в 00:54)   письмо автору
 
   для: Valleri   (03.06.2011 в 16:00)
 

http://habrahabr.ru/blogs/algorithm/114997/
про нечеткий поиск

  Ответить  
 
 автор: SHAman   (06.06.2011 в 13:56)   письмо автору
 
   для: Valleri   (03.06.2011 в 16:00)
 

Возможно, вам поможет моя статья о метрике Левенштейна. На длинных словах оно работает.

  Ответить  
Rambler's Top100
вверх

Rambler's Top100 Яндекс.Метрика Яндекс цитирования