Форум: Форум PHPФорум ApacheФорум Регулярные ВыраженияФорум MySQLHTML+CSS+JavaScriptФорум FlashРазное
Новые темы: 0000000
C++. Мастер-класс в задачах и примерах. Авторы: Кузнецов М.В., Симдянов И.В. PHP Puzzles. Авторы: Кузнецов М.В., Симдянов И.В. MySQL на примерах. Авторы: Кузнецов М.В., Симдянов И.В. Самоучитель MySQL 5. Авторы: Кузнецов М.В., Симдянов И.В. PHP 5/6. В подлиннике. Авторы: Кузнецов М.В., Симдянов И.В.
ВСЕ НАШИ КНИГИ
Консультационный центр SoftTime

Форум PHP

Выбрать другой форум

 

Здравствуйте, Посетитель!

вид форума:
Линейный форум Структурный форум

тема: Определение языка средствами пхп.
 
 автор: AlexDIXI   (12.12.2011 в 12:20)   письмо автору
 
 

Ребята нужно реализовывать функцию определения по слову языка. Даю функции слово и в ответ язык слова.
Я никогда не встречался с подобными задачами, поэтом прошу вас помочь. Видел реализацию через википедию, но это нагрузка и время.. Возможно вы знаете как это реализовать проще?

  Ответить  
 
 автор: AlexDIXI   (12.12.2011 в 14:44)   письмо автору
 
   для: AlexDIXI   (12.12.2011 в 12:20)
 

Здравствуйте, есть идеи?

  Ответить  
 
 автор: Lotanaen   (12.12.2011 в 14:58)   письмо автору
 
   для: AlexDIXI   (12.12.2011 в 14:44)
 

Забиваете словари всех языков в базу и потом поиск слова на соответствие ;)

  Ответить  
 
 автор: cheops   (12.12.2011 в 17:25)   письмо автору
 
   для: AlexDIXI   (12.12.2011 в 12:20)
 

1. Слово только одно или их будет несколько?
2. Язык совершенно произвольный или будет ограниченная группа языков?
3. Кодировка какая будет предположительно использоваться?

  Ответить  
 
 автор: AlexDIXI   (12.12.2011 в 20:04)   письмо автору
 
   для: cheops   (12.12.2011 в 17:25)
 

1. Кол-во слов в кее может быть разное - это не показатель
2. Языки произвольные
3. Кодировка без разницы

Словари не катят..

  Ответить  
 
 автор: cheops   (12.12.2011 в 20:51)   письмо автору
 
   для: AlexDIXI   (12.12.2011 в 20:04)
 

В одну строку проблему не решить... так как языки могут использовать пересекающиеся алфавиты. Некоторые кодировки для для одинаковых символов разных алфавитов используют разные коды, некоторые - одни и те же. Кроме того, некоторые слова в разных языках совпадают. А еще есть латынь, которая влияет на все европейские языки. Вообще проблему решают и есть готовые библиотеки (конкретную правда не посоветую). В конце концов есть уникальные буквы и умлауты, которые позволяют сузить класс языков, есть специфичные суффиксы и приставки, которые встречаются только в одном языке, есть правила написания вроде заглавных букв для существительных немецкого. Лучше начать с поиска готовых библиотек и посмотреть как они устроены (скорее всего вы сначала найдете perl-библиотеку, а потом python-библиотеку). Посмотрите как они работают у других, подходит или не подходит, а потом можно будет перетащить её к себе в приложение (переписав или используя прямо в исходном варианте). В любом случае нужно быть готовым к вероятностной трактовке результата.

PS Кодировку, кстати, учитывать все-равно придется, если она не задана - вы получаете задачу в меньшем масштабе, но сравнимую с той которую описали выше.

  Ответить  
Rambler's Top100
вверх

Rambler's Top100 Яндекс.Метрика Яндекс цитирования