Китайско-русский словарь на основе композиционного ввода от Макара®

Китайско-русский словарь на основе композиционного ввода от Макара®

Логичное завершение «набора для ленивых» — словарь, основа коего — композиционный ввод (кроме композиционного ввода «традиционалисты» могут использовать и фонетический в обоих вариантах: пиньинь-палладий). Реализация словаря позволяет продемонстрировать объявленные ранее преимущества такого типа ввода особенно по поиску незнакомых и «немых» иероглифов, звучание которых забылось или неизвестно вообще.

Китайско-русский словарь на основе композиционного ввода от Макара®

Конечно, самое главное в словаре не «программные кости», хотя это и важно, и обеспечивает его удобство и «красоту», и устойчивость, и «прочность», как панцирь черепахи, но самое «вкусное», конечно же то, что находится внутри. Поскольку, в первую очередь, словарь делался что называется «для себя», т.е. для человека в китайском невежественного (не сочтите за кокетство, в переводе на современный русский язык это означает «китайского не знающего», только и всего), то проблема выбора «мяса» для наполнения «программных костей» была решена просто — использовалось то, что доступно. А доступным оказался UniversalChRu_new.txt — текстовый файл словаря Котова, выложенный добрыми людьми на «Дао выраженное словами» по адресу: http://www.daokedao.ru/blog/wp-content/pleco/Pleco_dic.rar. В процессе обработки и конвертации текста в базу обнаружилось энное количество ошибок в файлике. Часть этих ошибок была исправлена. Нахально надеюсь, что при этом я наплодил своих ошибок не больше :).

Я не знаю, что было раньше — яйцо или курица, но все обнаруженные ошибки повторяются в электронной версии этого словаря в Lingvo. В бумажном издании словаря Котова их нет. Посему, уважаемые пользователи Lingvo, будьте осторожны! Но как быть осторожным новичку, который словарь воспринимает как «слово бога»? Я не знаю. Знаю только, что такое небрежение транскрипцией в словарях недопустимо. Мало того, что в некоторых карточках в словосочетаниях пропущены иероглифы. Это понятно (тильду тупо меняли на головной иероглиф вместо предыдущего сочетания), но не простительно. Иногда путаются диакритические знаки (видимо, для лингвистов из ABBY диакритика — простой «набор крючков» над буквами, а не указатель тонов) и переставляются буквы в слогах… (Попутно спешу заметить, что композиционный ввод от такого рода «ляпов» избавлен в принципе :).

Еще одна проблема — сегментация непрерывного иероглифического текста на слова, другими словами проблема пробелов (символов пробела) в транскрипции. Как следует писать: «чжунго» или «чжун го»? Эту проблему обсуждать не берусь, но констатировать ее существование вынужден. Как только возникнет необходимость организовать фонетический ввод для поиска иероглифов и их сочетаний в словаре, эта проблема выползет наружу и станет изрядным препятствием для «словареписателей».

Две эти «закавыки» заставили меня оставить словарные статьи что называется «as is», без всяческих изменений. Поэтому, все претензии, пожалуйста, к издателю Lingvo. Единственное, что я позволил себе, это сверить транскрипцию по пиньиню в иероглифах и их сочетаниях в заголовках статей с базой UniHan, конвертировать ее в палладия и, в случае несовпадения отметить «звездочкой» (*). Сюда попали, кроме случаев «законного» изменения тонов слогов в сочетаниях, и все «ляпы» электронной версии. Таковых несовпадений оказалось чуть больше 1200 шт. (из более чем 26-ти тыс. словарных статей). В этих случаях я предлагаю возможным пользователям словаря быть осторожными («предупрежден, значит вооружен»), не верить мне на слово и, по возможности, свериться с другими источниками.

Страничка программы
Скачать

Orphus: Нашли опечатку? Нажмите Ctrl+Enter

Автор: Criptozavr

Знает где достать полезный софт по китайскому языку