Форум: Форум PHPФорум ApacheФорум Регулярные ВыраженияФорум MySQLHTML+CSS+JavaScriptФорум FlashРазное
Новые темы: 0000000
Самоучитель PHP 5 / 6 (3 издание). Авторы: Кузнецов М.В., Симдянов И.В. Программирование. Ступени успешной карьеры. Авторы: Кузнецов М.В., Симдянов И.В. PHP 5/6. В подлиннике. Авторы: Кузнецов М.В., Симдянов И.В. PHP 5. На примерах. Авторы: Кузнецов М.В., Симдянов И.В., Голышев С.В. PHP. Практика создания Web-сайтов (второе издание). Авторы: Кузнецов М.В., Симдянов И.В.
ВСЕ НАШИ КНИГИ
Консультационный центр SoftTime

Форум MySQL

Выбрать другой форум

 

Здравствуйте, Посетитель!

вид форума:
Линейный форум Структурный форум

тема: выборка из двух таблиц
 
 автор: Моя тень   (02.09.2010 в 14:40)   письмо автору
 
 

Такая ситуация. Есть 2 таблици. Одна table1, вторая table2.
Соотношения первой ко второй 1:M.
Связь между ними по полю id_user.
Вот сам запрос

SELECT count(*) AS cnt, table2.rand_number FROM table1 INNER JOIN table2 USING (id_user)


Вообщем как видите мне здесь нужно получить количество причем чтобы вобоих таблицах присутствовала хоть одна запись. Но как видите поскольку здесь отношение один ко многим то в таблице table2 может быть более одной такой записи, а мне нужно получить ровно столько записей сколько их будет в table1

  Ответить  
 
 автор: Trianon   (02.09.2010 в 17:19)   письмо автору
 
   для: Моя тень   (02.09.2010 в 14:40)
 

а ничего , что функция COUNT() - агрегатная, а значит таблицу будет выдавать только на группирующем запросе?

  Ответить  
 
 автор: Моя тень   (02.09.2010 в 21:55)   письмо автору
 
   для: Trianon   (02.09.2010 в 17:19)
 

Ну да, согласен. Только это не меняет ситуации.Мне какбынужно дулиуаты id_user в таблице table2 отсеить.

  Ответить  
 
 автор: Моя тень   (06.09.2010 в 16:09)   письмо автору
 
   для: Trianon   (02.09.2010 в 17:19)
 

Ну что подскажите?

  Ответить  
 
 автор: Trianon   (06.09.2010 в 19:57)   письмо автору
 
   для: Моя тень   (06.09.2010 в 16:09)
 

Вы вытаскиваете поле rand_number из таблицы table2 - именно из той, в которой несколько строк на каждый id_user.
Из какой именно строки остается неопределенным.
Таблицу table1 вроде как не применяете вообще.
Без всего этого запрос прост, как грабли.
SELECT id_user,  COUNT(*) AS cnt FROM table2 GROUP BY id_user


Исправляйте условие.
В условии не должно быть неоднозначностей.

  Ответить  
 
 автор: Моя тень   (07.09.2010 в 15:45)   письмо автору
 
   для: Trianon   (06.09.2010 в 19:57)
 

>Вы вытаскиваете поле rand_number из таблицы table2 - именно из той, в которой несколько строк на каждый id_user.
>Из какой именно строки остается неопределенным.
>Таблицу table1 вроде как не применяете вообще.
>Без всего этого запрос прост, как грабли.
>
SELECT id_user,  COUNT(*) AS cnt FROM table2 GROUP BY id_user

>
>Исправляйте условие.
>В условии не должно быть неоднозначностей.

В общем я обрисую ситуацию с другой стороны. Виноват в том что до конца все не расписал.
В таблице table1 хранятся пользователи. В таблице table2 их мед. сведение. В данном случае (забор крови, группа учета итд., дата регистрации аналаза и.т.д.)
С течением времени анализы пересдаются — вносятся новые данные. Поэтому соотношение table1 к table2 равне 1:М.
Задача сводится к тому, что мне необходимо посчитать всех людей сдавших анализы с разбивкой по группе учета (атрибут table2.id_group_ac) той, у которой самый последний анализ по дате регистрации (table2.date_registration) для каждого id_user

  Ответить  
 
 автор: Trianon   (07.09.2010 в 16:31)   письмо автору
 
   для: Моя тень   (07.09.2010 в 15:45)
 

ну так тут куда больше и работы и простора для выражения.
очевидно придется группирующим запросом получить для каждого пользователя последнюю дату регистрации (удачнее было бы первичный ключ сведений, если его функция монотонна относительно даты регистрации, но можно и саму дату, если она однозначна), соединить с результатом таблицу сведений, для получения остальных полей в ней, и уже после этого добавлять условия и считать количество.

  Ответить  
 
 автор: Моя тень   (10.09.2010 в 15:51)   письмо автору
 
   для: Trianon   (07.09.2010 в 16:31)
 

Хм, Не совсем понял. Можно поточнее?
То есть сделать вложенный запрос?

  Ответить  
 
 автор: Моя тень   (10.09.2010 в 15:55)   письмо автору
 
   для: Trianon   (07.09.2010 в 16:31)
 

Я вот тут поигрался с distinct, вот что получил.
SELECT
    spid_epid_groups_account.name_group,
    count(distinct(date_registration)),
    COUNT(years) AS cnt,
    max(date_registration) AS date_registration,
    years,
    id_group_account, id_person,
    case
        when years < 16 then '0-16'
        when years < 18 then '16-18' else '18+' 
    end
    AS kind ,
    MIN(`years`) AS `min`,
    MAX(`years`) AS `max`
  FROM(
          SELECT  id_person,FLOOR((DATEDIFF(CURDATE(), `date_birth`)/365.25)) as years
         FROM `spid_epid_social_data`
  ) as social_data

INNER JOIN
        spid_epid_gu USING(id_person)
INNER JOIN
        spid_epid_groups_account ON spid_epid_groups_account.groups_id = spid_epid_gu.id_group_account
GROUP BY
    kind, id_group_account


Все вроде верно выполняет. Как по-вашему правильно ли я сделал?

  Ответить  
 
 автор: Trianon   (10.09.2010 в 16:10)   письмо автору
 
   для: Моя тень   (10.09.2010 в 15:55)
 

Я вижу в Вашем запросе висящие (неоднозначно определенные по GROUP BY) поля.
С моей точки зрения это неправильно априори.

  Ответить  
 
 автор: Моя тень   (10.09.2010 в 16:17)   письмо автору
 
   для: Trianon   (10.09.2010 в 16:10)
 

Несовсем понял. То есть неправильность в том что я не указал принадлежность атрибута к конкртеной таблице?
Это что-ли?

GROUP BY
    kind, 
 spid_epid_gu.id_group_account

  Ответить  
 
 автор: Trianon   (10.09.2010 в 17:06)   письмо автору
 
   для: Моя тень   (10.09.2010 в 16:17)
 

Нет. Неправильность в том, что если Вы применяете агрегатные функции, то в списке полей select кроме них не должно оказываться никаких полей, за исключением перечисленных в GROUP BY.
Иначе запрос оказывается семантически неоднозначным.

Пример:
SELECT p, q, r FROM t -- выбрать из таблицы все строки (поля p и q)
SELECT MAX(p) FROM t -- выбрать из таблицы максимальное значение в колонке p
SELECT MAX(p), q FROM t GROUP BY q -- для каждого q выбрать из таблицы максимальное значение в колонке p
SELECT MAX(p), q, r FROM t GROUP BY q -- неоднозначно. Неясно, из каких строк брать r

  Ответить  
 
 автор: Моя тень   (10.09.2010 в 17:22)   письмо автору
 
   для: Trianon   (10.09.2010 в 17:06)
 

Да, логично. Спасибо! В ниже описанном запросе как видите неоднозначностей теперь нет.

  Ответить  
 
 автор: Trianon   (10.09.2010 в 17:41)   письмо автору
 
   для: Моя тень   (10.09.2010 в 17:22)
 

формально говоря, есть.
Висит spid_epid_groups_account.name_group, т.к. ни в GROUP BY его нет, ни агрегатной функцией оно не является.

  Ответить  
 
 автор: Моя тень   (10.09.2010 в 19:45)   письмо автору
 
   для: Trianon   (10.09.2010 в 17:41)
 

Вообщем tbl1.id_group_account и spid_epid_groups_account.groups_id это связи к таблицам.
Есть группировка по id_group_account, хотя можно группировать и по spid_epid_groups_account.groups_id результат тот же.

Аналогичный пример — нужно подсчитать кол-во новостей в каждом разделе.
id_section — имя раздела, name_section — имя раздела.
В итоге в запросе
SELECT count(*) AS cnt, name_section .......  GROUP BY id_section

Результат выборки всегда будет однозначным,ведь name_section напрямую зависит от id_section

  Ответить  
 
 автор: Trianon   (10.09.2010 в 20:16)   письмо автору
 
   для: Моя тень   (10.09.2010 в 19:45)
 

>Аналогичный пример — нужно подсчитать кол-во новостей в каждом разделе.
>id_section — имя раздела, name_section — имя раздела.
>В итоге в запросе
SELECT count(*) AS cnt, name_section .......  GROUP BY id_section

>Результат выборки всегда будет однозначным,ведь name_section напрямую зависит от id_section

Во-первых, для того чтобы убедиться в этом, нужно как минимум видеть дамп структуры базы, а его Вы не привели. Вы же спросили, как я нахожу? Я и ответил.
Во-вторых, в этом так или иначе придется убеждаться. В то время, как честный запрос лежит на поверхности ажно двумя вариантами

SELECT  id_section, count(*) AS cnt, MAX(name_section) .......  GROUP BY id_section

SELECT id_section, count(*) AS cnt, name_section .......  GROUP BY id_section, name_section 


и таки да. В третьих.
Приличная СУБД (оракл, mssql и т.д.) запрос с неоднозначным GROUP BY отвергнет, как ошибочный.
До недавнего времени как минимум

  Ответить  
 
 автор: Моя тень   (10.09.2010 в 17:01)   письмо автору
 
   для: Trianon   (10.09.2010 в 16:10)
 

SELECT
        COUNT(*) AS cnt,
        id_group_account,
        max(years) AS max_age,
        min(years) AS min_age,
        case
            when years < 16 then '0-16'
            when years < 18 then '16-18'
            else '18+'
        end
        AS kind,
        spid_epid_groups_account.name_group,
        id_addres_registration

FROM
    ( SELECT
        id_addres_registration,
        id_person,
        id_group_account,
        date_registration,
        FLOOR((DATEDIFF(CURDATE(), `date_birth`)/365.25)) as years
    FROM
        spid_epid_gu
    INNER JOIN
        spid_epid_social_data USING(id_person)
    INNER JOIN
        spid_epid_data USING(id_person)
    GROUP BY
        id_person
    ORDER BY
        date_registration DESC )
         AS tbl1
INNER JOIN
        spid_epid_groups_account ON spid_epid_groups_account.groups_id = tbl1.id_group_account
GROUP BY
    id_group_account,
    id_addres_registration,
    kind
ORDER BY
    name_group, kind



upd: несколько поправил

  Ответить  
Rambler's Top100
вверх

Rambler's Top100 Яндекс.Метрика Яндекс цитирования