|
|
|
| Здравствуйте
есть такая таблица:
CREATE TABLE `datatable` (
`id` bigint(20) unsigned NOT NULL auto_increment,
`date` datetime NOT NULL,
`dataid` tinyint(3) unsigned NOT NULL,
`filename` varchar(30) collate latin1_general_ci NOT NULL,
`status` tinyint(3) unsigned NOT NULL,
PRIMARY KEY (`id`)
) ENGINE=MyISAM AUTO_INCREMENT=205418 ;
Для того чтобы получить список уникальных дат в виде (2008-10-28) я делаю такой запрос:
SELECT DISTINCT SUBSTRING(date, 1, 10) as date FROM `datatable` WHERE dataid=3 ORDER by date desc
Сейчас в базе более 200.000 элементов и первый раз запрос выполняется 5 секунд. Потом кэшируется и в течении некоторого времени всё работает очень быстро. Но база подразумевает наличие 2-х и более миллионов записей.
Интуитивно подозреваю что все дело в использовании [b][DISTINCT/b] но незнаю как от него избавится.
Подскажите пожалуйста как мне оптимизировать мой запрос?!!! | |
|
|
|
|
|
|
|
для: Gus
(05.11.2008 в 16:50)
| | GROUP BY date не устраивает? | |
|
|
|
|
|
|
|
для: --Lex--
(05.11.2008 в 17:10)
| | Сделал такой запрос
SELECT SUBSTRING(date, 1, 10) as date FROM `datatable` WHERE dataid=1 GROUP BY date ORDER by date desc
но он выводит все записи? А мне нужно получить список неповторяющихся дат? к в этом случаем поможет GROUP BY date ? | |
|
|
|
|
|
|
|
для: gus
(06.11.2008 в 11:40)
| | попробуйте так:
SELECT DISTINCT(SUBSTRING(date, 1, 10)) as date FROM `datatable` WHERE dataid=1 GROUP BY date ORDER by date desc
|
или что-то в этом роде (сам не проверял) | |
|
|
|
|
|
|
|
для: psychomc
(06.11.2008 в 11:45)
| | Сделал такой запрос. Время выполнения скрипта осталось прежним,.... неужели GROUP BY date должно было както ускорить выборку?
Может можно както отказатся от DISTINCT | |
|
|
|
|
|
|
|
для: gus
(06.11.2008 в 14:53)
| | DISTINCT для того чтобы выводились уникальные, с ним что, медленнее? | |
|
|
|
|
|
|
|
для: psychomc
(06.11.2008 в 16:08)
| | расставте индексы. конкретно на dataid | |
|
|
|
|
|
|
|
для: Gemorroj
(11.11.2008 в 15:43)
| | лазил сейчас по документации, вот что пишут
использование операции DISTINCT к функции SELECT вызывает потребление гораздо большего количества процессорного времени, чем обычный SELECT.
DISTINCT пытается искать уникальные значения, зачастую производя множество сравнений, подстановок и расчетов.
Причем, чем больше становится объем данных, к которому применяется DISTINCT (ведь Ваша база со временем растет),
тем медленее будет выполняться такой запрос и рост ресурсов, требуемых для выполнения такой функции,
будет происходить не прямо пропорцонально объему хранимых и обрабатываемых данных, а гораздо быстрее. | |
|
|
|