Ubuntu для китаиста: рукописный ввод

Ubuntu для китаиста: рукописный ввод

Система распознавания рукописного ввода Tegaki Продолжая тему Ubuntu и китайского языка хочу рассказать вам о найденных мною системах рукописного ввода иероглифов. Потратил на поиски не один час, и в итоге нашёл два приемлемых варианта, сегодня речь пойдет о Tegaki.

Tegaki — это open-source проект, позволяющий распознавать иероглифы китайского (полные и сокращенные формы) и японского языков. Есть версии для Windows, MacOS, мобильной платформы Maemo. А ещё есть исходники, которые, при желании можно собрать. Пользователям Ubuntu Lucid (по поводу более ранних версий не знаю)  проще: все нужные пакеты есть в официальных репозиториях.

1. Установка.

Через терминал выполняем команду:

sudo aptitude install tegaki-recognize tegaki-train tegaki-zinnia-simplified-chinese

Необходимые зависимости подтянутся сами. Итого получится 18 Мб.

Для японского языка нужно установить пакет tegaki-zinnia-japanese.

2. Запуск.

Запустить программу можно из Applications -> Accessories -> Tegaki Recognize.

В случае если вы вдруг не обнаружите ярлыка там, загляните Applications -> System Tools. У меня они, почему-то, есть в обоих местах.

Если же вдруг по какой-то причине ярлыка нет ни здесь, ни там, запустить программу можно через  терминал, либо ALT+F2, командой tegaki-recognize.

3. Настройка и использование.

Так выглядит Tegaki Recognize в действии:

Из-за стены можно попробовать посмотреть с официального сайта.

6 кнопок управления, два поля для ввода иероглифов, строка для отображения результата. Нам нужна шестая кнопка управления, Настройка. Разработчики рекомендуют выставить там значение Search after в 200 ms. Всё, можно писать. Обратите внимание на то, что каждое поле для рисования разделено на 4 части, это имеет значение. Писать иероглиф нужно «с размахом», на все 4 части. Если вдруг программа не распознала написанный иероглиф, вы можете щелкнуть мышью по предложенному варианту в строке, и выбрать нужный иероглиф. Насколько большая база у программы, увы, не знаю.

Теперь, собственно, как этим пользоваться. Я вот не сразу разобрался. К примеру, вам нужно найти иероглиф в словаре. Запускаете словарь, запускаете Tegaki. Теперь щелкаете в поле ввода словаря, затем пишете иероглиф в Tegaki, нажимаете зелёную галочку и иероглиф появляется в поле ввода словаря. Вобщем, появляется он в том поле ввода, которое последний раз было в фокусе.

Раньше приходилось для рукописного ввода запускать Wenlin через Wine, а теперь есть Tegaki. Никак не замена Wenlin’ю, конечно, но рукописный ввод реализован, и это уже радует.

Дополнительные модели распознавания, исходники и документацию можно найти на официальном сайте Tegaki.

В следующий раз будет рассмотрена ещё одна система распознавания рукописного ввода, оставайтесь на связи :)

Фото аватара

Автор: 司马骏

Учусь в Санкт-Петербургском Политехническом университете, в ИМОП, по специальности "Регионоведение: Китай". Дважды ездил в Китай: сначала в 长沙, затем в 深圳, оба раза по одному семестру. Китай очень люблю, и с удовольствием бы там пожил подольше. Увлекаюсь музыкой, слушать музыку - моё основное занятие. Пытаюсь вести блог о том, как я учу китайский язык.