|
|
|
|
|
для: AcidTrash
(18.06.2008 в 22:40)
| | Этот алгоритм где-то описан? | |
|
|
|
|
|
|
|
для: Eugene77
(18.06.2008 в 21:13)
| | Судя по вашему ТЗ, это напоминает алгоритм индексирования Яндекса(в частности насчет зеркал). | |
|
|
|
|
|
|
| У меня есть примерно 10000 текстовых отрывков примерно по 100 - 300 слов.
Задача составить таблицу точных повторений более, чем по 8 слов подряд.
То есть надо узнать, нет ли одинаковых словесных цепочек в этих 10000 отрывков, а если есть,
то запомнить где.
Трудность в том, чтобы сочинить быстрый алгоритм.
Подскажите идею! | |
|
|
|
|