|
|
|
| Ребята нужно реализовывать функцию определения по слову языка. Даю функции слово и в ответ язык слова.
Я никогда не встречался с подобными задачами, поэтом прошу вас помочь. Видел реализацию через википедию, но это нагрузка и время.. Возможно вы знаете как это реализовать проще? | |
|
|
|
|
|
|
|
для: AlexDIXI
(12.12.2011 в 12:20)
| | Здравствуйте, есть идеи? | |
|
|
|
|
|
|
|
для: AlexDIXI
(12.12.2011 в 14:44)
| | Забиваете словари всех языков в базу и потом поиск слова на соответствие ;) | |
|
|
|
|
|
|
|
для: AlexDIXI
(12.12.2011 в 12:20)
| | 1. Слово только одно или их будет несколько?
2. Язык совершенно произвольный или будет ограниченная группа языков?
3. Кодировка какая будет предположительно использоваться? | |
|
|
|
|
|
|
|
для: cheops
(12.12.2011 в 17:25)
| | 1. Кол-во слов в кее может быть разное - это не показатель
2. Языки произвольные
3. Кодировка без разницы
Словари не катят.. | |
|
|
|
|
|
|
|
для: AlexDIXI
(12.12.2011 в 20:04)
| | В одну строку проблему не решить... так как языки могут использовать пересекающиеся алфавиты. Некоторые кодировки для для одинаковых символов разных алфавитов используют разные коды, некоторые - одни и те же. Кроме того, некоторые слова в разных языках совпадают. А еще есть латынь, которая влияет на все европейские языки. Вообще проблему решают и есть готовые библиотеки (конкретную правда не посоветую). В конце концов есть уникальные буквы и умлауты, которые позволяют сузить класс языков, есть специфичные суффиксы и приставки, которые встречаются только в одном языке, есть правила написания вроде заглавных букв для существительных немецкого. Лучше начать с поиска готовых библиотек и посмотреть как они устроены (скорее всего вы сначала найдете perl-библиотеку, а потом python-библиотеку). Посмотрите как они работают у других, подходит или не подходит, а потом можно будет перетащить её к себе в приложение (переписав или используя прямо в исходном варианте). В любом случае нужно быть готовым к вероятностной трактовке результата.
PS Кодировку, кстати, учитывать все-равно придется, если она не задана - вы получаете задачу в меньшем масштабе, но сравнимую с той которую описали выше. | |
|
|
|