|
|
|
| Дано
1. Две базы, набивали разные люди, со сходной инфой(есть пересечение множеств).
2. Задан алгоритм сравнения, использующий функцию array_search, обладающий нужной скоростью работы.
3.При вводе данных ошибки грамматики(в словах, кавычки, запятые, заглавные...) приводят к существенной не точности работы алгоритма.
Вопрос: Как изменить алгоритм без особого снижения скорости работы?
Краеугольный камень.
1. Хочется залить больше инфы
2. Опасность дублированного контента.
При каком проценте совпадения, поисковые системы признают дублированным контент и наказывают? | |
|
|