Китайско-русский словарь на основе композиционного ввода от Макара®

Китайско-русский словарь на основе композиционного ввода от Макара®

Китайско-русский словарь на основе композиционного ввода от Макара®

Логичное завершение “набора для ленивых” – словарь, основа коего – композиционный ввод (кроме композиционного ввода “традиционалисты” могут использовать и фонетический в обоих вариантах: пиньинь-палладий). Реализация словаря позволяет продемонстрировать объявленные ранее преимущества такого типа ввода особенно по поиску незнакомых и “немых” иероглифов, звучание которых забылось или неизвестно вообще.

Конечно, самое главное в словаре не “программные кости”, хотя это и важно, и обеспечивает его удобство и “красоту”, и устойчивость, и “прочность”, как панцирь черепахи, но самое “вкусное”, конечно же то, что находится внутри. Поскольку, в первую очередь, словарь делался что называется “для себя”, т.е. для человека в китайском невежественного (не сочтите за кокетство, в переводе на современный русский язык это означает “китайского не знающего”, только и всего), то проблема выбора “мяса” для наполнения “программных костей” была решена просто – использовалось то, что доступно. А доступным оказался UniversalChRu_new.txt – текстовый файл словаря Котова, выложенный добрыми людьми на “Дао выраженное словами” по адресу: http://www.daokedao.ru/blog/wp-content/pleco/Pleco_dic.rar. В процессе обработки и конвертации текста в базу обнаружилось энное количество ошибок в файлике. Часть этих ошибок была исправлена. Нахально надеюсь, что при этом я наплодил своих ошибок не больше :).

Я не знаю, что было раньше – яйцо или курица, но все обнаруженные ошибки повторяются в электронной версии этого словаря в Lingvo. В бумажном издании словаря Котова их нет. Посему, уважаемые пользователи Lingvo, будьте осторожны! Но как быть осторожным новичку, который словарь воспринимает как “слово бога”? Я не знаю. Знаю только, что такое небрежение транскрипцией в словарях недопустимо. Мало того, что в некоторых карточках в словосочетаниях пропущены иероглифы. Это понятно (тильду тупо меняли на головной иероглиф вместо предыдущего сочетания), но не простительно. Иногда путаются диакритические знаки (видимо, для лингвистов из ABBY диакритика – простой “набор крючков” над буквами, а не указатель тонов) и переставляются буквы в слогах… (Попутно спешу заметить, что композиционный ввод от такого рода “ляпов” избавлен в принципе :).

Еще одна проблема – сегментация непрерывного иероглифического текста на слова, другими словами проблема пробелов (символов пробела) в транскрипции. Как следует писать: “чжунго” или “чжун го”? Эту проблему обсуждать не берусь, но констатировать ее существование вынужден. Как только возникнет необходимость организовать фонетический ввод для поиска иероглифов и их сочетаний в словаре, эта проблема выползет наружу и станет изрядным препятствием для “словареписателей”.

Две эти “закавыки” заставили меня оставить словарные статьи что называется “as is”, без всяческих изменений. Поэтому, все претензии, пожалуйста, к издателю Lingvo. Единственное, что я позволил себе, это сверить транскрипцию по пиньиню в иероглифах и их сочетаниях в заголовках статей с базой UniHan, конвертировать ее в палладия и, в случае несовпадения отметить “звездочкой” (*). Сюда попали, кроме случаев “законного” изменения тонов слогов в сочетаниях, и все “ляпы” электронной версии. Таковых несовпадений оказалось чуть больше 1200 шт. (из более чем 26-ти тыс. словарных статей). В этих случаях я предлагаю возможным пользователям словаря быть осторожными (“предупрежден, значит вооружен”), не верить мне на слово и, по возможности, свериться с другими источниками.

Страничка программы
Скачать


Привет! Меня зовут Саша. Я главный редактор Магазеты.

Мы собираем базу знаний о Китае и китайском языке при поддержке читателей уже 16 лет.

У нас нет рекламы, есть только вы. Поддержите Магазету и помогите сохранить её бесплатной и без рекламы.


Автор: Criptozavr

Знает где достать полезный софт по китайскому языку

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *