Форум: Форум PHPФорум ApacheФорум Регулярные ВыраженияФорум MySQLHTML+CSS+JavaScriptФорум FlashРазное
Новые темы: 0000000
MySQL на примерах. Авторы: Кузнецов М.В., Симдянов И.В. Программирование. Ступени успешной карьеры. Авторы: Кузнецов М.В., Симдянов И.В. MySQL 5. В подлиннике. Авторы: Кузнецов М.В., Симдянов И.В. PHP на примерах (2 издание). Авторы: Кузнецов М.В., Симдянов И.В. PHP Puzzles. Авторы: Кузнецов М.В., Симдянов И.В.
ВСЕ НАШИ КНИГИ
Консультационный центр SoftTime

Форум MySQL

Выбрать другой форум

 

Здравствуйте, Посетитель!

вид форума:
Линейный форум Структурный форум

тема: Как работает полнотекстовый поиск?
 
 автор: добряк   (04.09.2012 в 14:06)   письмо автору
 
 

Здравствуйте! Помогите разобраться и понять.
Можно ли на конкретном примере понять, как работает полнотекстовый поиск?
Приведите пожалуйста максимально простой пример, чтобы наглядно ощутить эффективность полнотекстового поиска.
Пример простой таблицы, с элементарным набором данных, которую можно проиндексировать

  Ответить  
 
 автор: Deed   (04.09.2012 в 22:05)   письмо автору
 
   для: добряк   (04.09.2012 в 14:06)
 

Вот хороший пример: http://potapov.com.ua/library/30/

  Ответить  
 
 автор: cheops   (05.09.2012 в 06:54)   письмо автору
 
   для: добряк   (04.09.2012 в 14:06)
 

Возможно вас заинтересуют следующие темы форуму
http://www.softtime.ru/forum/read.php?id_forum=3&id_theme=514
http://www.softtime.ru/forum/read.php?id_forum=1&id_theme=148
http://www.softtime.ru/forum/read.php?id_forum=3&id_theme=807
http://www.softtime.ru/forum/read.php?id_forum=3&id_theme=5311
http://www.softtime.ru/forum/read.php?id_forum=3&id_theme=3447
http://www.softtime.ru/forum/read.php?id_forum=3&id_theme=6620
http://www.softtime.ru/forum/read.php?id_forum=3&id_theme=5828
http://www.softtime.ru/forum/read.php?id_forum=3&id_theme=6439
http://www.softtime.ru/forum/read.php?id_forum=3&id_theme=5311
http://www.softtime.ru/forum/read.php?id_forum=3&id_theme=4699
http://www.softtime.ru/forum/read.php?id_forum=3&id_theme=3696
http://www.softtime.ru/forum/read.php?id_forum=3&id_theme=4797
http://www.softtime.ru/forum/read.php?id_forum=3&id_theme=14516

  Ответить  
 
 автор: добряк   (06.09.2012 в 13:25)   письмо автору
 
   для: cheops   (05.09.2012 в 06:54)
 

Спасибо
Все это интересно, очень, многозначно. А как понять физику сущности, она обычно имеет истинное понимание, в отличии от множественного интерфейса междумордника программиста или пользователя. Чем объяснить увеличение скорости. Есть ли математическое объяснение.Ведь физика процесса, истина, не связана MYSQL. Не может быть же много правд, одна у MYSQL, другая у ...Все это интерфейсы программиста, а истинное знание всегда единственное. Возможно ли кристаллизировать горстку истины?Научное понимание всегда единственное.

  Ответить  
 
 автор: cheops   (06.09.2012 в 13:43)   письмо автору
 
   для: добряк   (06.09.2012 в 13:25)
 

В отдельный индекс выписываются слова, искать по одному слову, состоящему из нескольких символов много проще, чем по тексту, состоящему из десятков тысяч символов, особенно, если слова отсортированы по алфавиту. Т.е. это довольно быстро, далее вы получаете вместо слова числовой идентификатор (операции с числами протекают быстрее, чем со строками). Если вы ищите несколько слов, вам фактически нужно получить их идентификаторы и проверить входят ли в этот текст слова с такими идентификаторами. Т.е. львиная доля поиска выполнена заранее, во время составления полнотекстового индекса. Искать по индексу уже не так сложно и долго, так как большую часть времени вы оперируете числами и короткими строками.

  Ответить  
 
 автор: добряк   (06.09.2012 в 13:54)   письмо автору
 
   для: cheops   (06.09.2012 в 13:43)
 

По- видимому существуют разные правды и наверное у ГУГЛА ессть своя правда. То что очевидно, не всегда правильно, не всегда единственно правильно. Однако и все таки очевидно, что ГУГЛ использует другой какой то способ, если сравнивать например с яндексом. Конечно можно сказать, что эти знания доступны только некоторым ясновидцам просвечивающим насквозь все многообразие явлений интерфейсов междумордника. Но, всегда доступно просто упорному и целеустремленному. Может познание разницы между работой ГУГЛА и ЯНДЕКСА и есть истина. Тогда в чем она, истина, чем отличаются, как математически выразить. Ведь математическое применение есть способ отражения истинного, хотя математика абстрактна, но точней естественного языка. (если есть точное, истинное понимание, то его можно применить ко всем системам, да же к простым файлам и везде это даст очевидный для всеx ситуаций выигрыш )
Каков же интересно это алмаз, сверкающий, многогранный, дающий множество явлений и имеющий одну, уникальную сущность прессованного гранита. Как оделить истинное от косметики, как получить исконно правильное?

  Ответить  
 
 автор: cheops   (11.09.2012 в 09:18)   письмо автору
 
   для: добряк   (06.09.2012 в 13:54)
 

Эээ... ну для начала истина в том, что у Google и Яндекса далеко не классический полнотекстовый поиск - они развивают собственные алгоритмы поиска, ориентированные на Web, страницы сайта связаны друг с другом, сайты связаны друг с другом ссылками, сайты имеют разную авторитетность, посещаемость, различное количество генераторов текста. Все это влияет на поиск и небольшие предпочтения при реализации, например поиск в ширину или в глубину могут отражаться на результатах. Полнотекстоый поиск в MySQL бесконечно примитивен при сравнении с тем, что на милиарды от контекстной рекламы насоздавали Яндекс и Google. За ними стоят массив серверов, которые могут позволить себе лишь немногие компании и деньги, которые позволяют нанять лучших специалистов, обслуживающих эти сервера. Один сервер обслужить морока, а когда их пол миллиона - это проблема, доступная лишь большим корпорациям и государствам.

  Ответить  
 
 автор: Sfinks   (11.09.2012 в 10:38)   письмо автору
 
   для: cheops   (11.09.2012 в 09:18)
 

Че, реально пол миллиона серверов??? Трудно представить!

  Ответить  
 
 автор: cheops   (12.09.2012 в 15:02)   письмо автору
 
   для: Sfinks   (11.09.2012 в 10:38)
 

Ага, они вообще кроме всего прочего специализируются в сдаче в аренду для других компаний... и вообще они очень сильные организаторы дата-центров, поэтому они так и развернулись - остальные просто захлебнулись в масштабировании.

  Ответить  
 
 автор: confirm   (11.09.2012 в 10:57)   письмо автору
 
   для: добряк   (06.09.2012 в 13:54)
 

Ну а кто вам мешает использовать "способ" Гугла?

  Ответить  
Rambler's Top100
вверх

Rambler's Top100 Яндекс.Метрика Яндекс цитирования