Форум: Форум PHPФорум ApacheФорум Регулярные ВыраженияФорум MySQLHTML+CSS+JavaScriptФорум FlashРазное
Новые темы: 0000000
PHP 5/6. В подлиннике. Авторы: Кузнецов М.В., Симдянов И.В. Программирование. Ступени успешной карьеры. Авторы: Кузнецов М.В., Симдянов И.В. PHP 5. На примерах. Авторы: Кузнецов М.В., Симдянов И.В., Голышев С.В. PHP Puzzles. Авторы: Кузнецов М.В., Симдянов И.В. Социальная инженерия и социальные хакеры. Авторы: Кузнецов М.В., Симдянов И.В.
ВСЕ НАШИ КНИГИ
Консультационный центр SoftTime

Форум MySQL

Выбрать другой форум

 

Здравствуйте, Посетитель!

вид форума:
Линейный форум Структурный форум

тема: Вопросы новичка про кодировку в MySQL
 
 автор: alexey_tihonenko   (08.02.2010 в 11:56)   письмо автору
32.1 Кб
 
 

Добрый день! Помогите пожалуйста разобраться с кодировками в MySQL, кое-что не понимаю.
Вопросов несколько. Задам по очереди, чтобы не смешивать мух с котлетами)
1. Какую роль играет поле "collation" ( или "сравнение" в русской версии phpMyAdmin)? На что оно влияет?

  Ответить  
 
 автор: Temnovit   (08.02.2010 в 12:16)   письмо автору
 
   для: alexey_tihonenko   (08.02.2010 в 11:56)
 

Здравствуйте!

Если говорить просто - кодировка в которой хранится информация и в которой производятся операции с ней. Подробнее почитайте по ссылке: http://dev.mysql.com/doc/refman/5.0/en/charset-connection.html

Совет из опыта: чтобы никогда не мучатся с кодировками, везде указывайте utf8_general_ci, а в скриптах сразу после подключения к базе данных выполняйте запрос:
SET NAMES 'utf8'

  Ответить  
 
 автор: Trianon   (08.02.2010 в 13:52)   письмо автору
 
   для: Temnovit   (08.02.2010 в 12:16)
 

У (большинства) языков есть различия в буквах, которые могут учитываться или игнорироваться при сравнении строк.
К ним относятся обычно
1. чувствительность к размеру букв - различие заглавных и строчных букв (case sensitivity)
2. чувствительность к акцентам (отличие е и ё)

Методика сравнения строк зависит от языка (потому что наборы букв в разных языках разные даже при едином написании) и от выбранных различий.

Выбранная методика и указывется в этом поле.

general обычно означает общая политика для большей части языков группы
cs - case sensitive - чувствительно к размеру
ci - case insensitive - нечувствительно к размеру
bin, binary - жесткое побайтовое сравнение

  Ответить  
 
 автор: Alexey_Tihonenko   (08.02.2010 в 14:15)   письмо автору
 
   для: Trianon   (08.02.2010 в 13:52)
 

А в каком виде может происходить это сравнение?

Например, запрос из скрипта:

"SELECT * FROM fruits WHERE name = 'Апельсин' "

Если у меня кодировка файла, в котором сохранен скрипт, и значение поля collation не совпадают, то соответствие не будет найдено, даже если запись "Апельсин" в таблице будет?

  Ответить  
 
 автор: Trianon   (08.02.2010 в 14:52)   письмо автору
 
   для: Alexey_Tihonenko   (08.02.2010 в 14:15)
 

кодировка - это название кодовой страницы.
Поле collation - название сравнения.
Они всяко не совпадут.
А вообще кодировка в которой идет обращение к серверу, и в которой от него ожидается результат, указывается оператором SET NAMES . Обычно это и есть кодировка файла со скриптом и кодировка сайта.

С точностью до того, что каноническое название Windows-1251 сервером MySQL не принимается. А принимается старое cp1251. А по сути это одно и то же.

  Ответить  
 
 автор: Alexey_Tihonenko   (08.02.2010 в 15:02)   письмо автору
 
   для: Trianon   (08.02.2010 в 14:52)
 

Так, теперь назначение этого более-менее прояснилось.
Только я не пойму, зачем в нем указана кодировка? Это просто префикс, который добавляется исходя из того, в какой кодировке MySQL хранит данные выбранной таблицы?

  Ответить  
 
 автор: Alexey_Tihonenko   (08.02.2010 в 14:02)   письмо автору
 
   для: Temnovit   (08.02.2010 в 12:16)
 

>Если говорить просто - кодировка в которой хранится информация и в которой производятся операции с ней.

Т.е. если я через phpMyAdmin отправлю запрос на вставку в таблицу слова, написанного русскими букками, то это слово будет сохранено в кодировке cp-1251, верно?

А если бы я изменил значение этого поля на utf8, то, тоже слово, введенное с клавиатуры русскими буквами, было бы сохранено в кодировке utf8, верно?

  Ответить  
 
 автор: Alexey_Tihonenko   (08.02.2010 в 16:42)   письмо автору
 
   для: Temnovit   (08.02.2010 в 12:16)
 

>Совет из опыта: чтобы никогда не мучатся с кодировками, везде указывайте utf8_general_ci, а в скриптах сразу после подключения к базе данных выполняйте запрос:
>
SET NAMES 'utf8'


А этот запрос что делает?

  Ответить  
Rambler's Top100
вверх

Rambler's Top100 Яндекс.Метрика Яндекс цитирования