|
|
|
|
|
для: xpom
(27.03.2011 в 16:25)
| | Индексы хранятся в отдельном файле, запросы, которые этот индекс замедляться не будут, а запросы обращающиеся к полнотекстовому поиску без этого индекса работать не будут.
[поправлено модератором: ветка про индексы выделена в отдельную тему] | |
|
|
|
|
|
|
|
для: cheops
(27.03.2011 в 15:54)
| | А я где то читал, что если таблица с FULLTEXT-индексом, то замедляется работа выборки из этой таблицы базы данных, если будут тысячи строк в таблице с товарами, не станет база? | |
|
|
|
|
|
|
|
для: xpom
(27.03.2011 в 15:47)
| | MySQL имеет встроенный механизм полнотекстового поиска, для этого поля нужно проиндексировать FULLTEXT-индексом и искать при помощи конструкции MATCH ... AGAINST(). | |
|
|
|
|
|
|
|
для: cheops
(27.03.2011 в 15:10)
| | а пока нет базы, будут проблемы с таким методом, это можно будет в дальнейшем такое сделать..
>Тут, как правило, используется полнотекстовый поиск - его тоже можно сделать элементом парсера, почем нет.
У меня тоже такая мысль пришла...а как осуществляется полнотекстовый поиск?
Елемент парсера разбить на отдельные слова, а потом искать эти слова в базе через Like? Или есть лучший способ? | |
|
|
|
|
|
|
|
для: xpom
(27.03.2011 в 14:50)
| | >а где ж мы такую базу возьмем???
Нарабатывайте, все равно же проблему решать придется. Если ваш сервис будет работать хотя бы год и у вас будут заняты люди на постоянной сортировке и улучшении базы данных - она у вас будет.
>А например поиск по сайту, работает не по такому принципу, когда выводит только те материалы,
>где совпали только отдельные слова?
Тут, как правило, используется полнотекстовый поиск - его тоже можно сделать элементом парсера, почем нет. | |
|
|
|
|
|
|
|
для: cheops
(27.03.2011 в 00:07)
| | а где ж мы такую базу возьмем???
А например поиск по сайту, работает не по такому принципу, когда выводит только те материалы, где совпали только отдельные слова? | |
|
|
|
|
|
|
|
для: xpom
(26.03.2011 в 23:57)
| | Примерно тоже самое, строится большая база данных по признакам и по вашим прайсам (это похоже на это, а это не похоже на это), которая позволяет потом с высокой долей вероятности классифицировать новый товар. Правда новый прайс-лист может здорово выбиваться из системы наименований тех магазинов, по которым база набивалась, но не думаю, что это будет очень часто - все-таки пресса и литература жаргон и наименования достаточно быстро устаканивают, да и магазины заинтересованы в том, чтобы покупатели понимали о чем идет речь. | |
|
|
|
|
|
|
|
для: cheops
(26.03.2011 в 23:41)
| | спам то спамом...а с наименованием товара как найти сходство? Можно таким методом это сделать? | |
|
|
|
|
|
|
|
для: xpom
(26.03.2011 в 22:25)
| | По разному, например, для вычисления спам-сообщений и обычных в почте и на форумах (это самое известное приложение). | |
|
|
|
|
|
|
|
для: cheops
(26.03.2011 в 21:48)
| | а как формула Байеса применяется в рнр? | |
|
|
|
|