Китайско-русский словарь с композиционным вводом и палладицей

Почти год назад Магазета писала о композиционном вводе. Не хочется упоминать нечистого к ночи, все и так знают, что произошло в мире за это время. Зато не все ещё знают, что технология композиционного ввода получила подтверждение статуса изобретения (US Patent No. US 10,656,830 B2, May 19, 2020) и двинулась в широкие массы — под андроидом появился первый китайско-русский словарь для клавиатуры от China Touch Typing.

Композиционный ввод потому и “композиционный”, что он собирает иероглифы как головоломки из кусочков. Сама идея разложения иероглифов элементы была очевидна с седой древности. Только делали это люди из совершенно разных соображений, отсюда и широко распространенная практика выделения разного рода ключей, детерминативов, фонетиков, графем, и тому подобных элементов по мере надобности с той или иной степенью точности и произвольности.

“Технологические” ограничения методов ввода не позволяли относиться к иероглифам иначе, чем как к набору черт. Вводить иероглиф, состоящий, скажем, всего из двух легко выделяемых визуально компонентов, можно было только повторяя последовательность черт этих компонентов, причём черт иногда весьма изощренных (вспомните горизонтальную трижды ломаную с вертикальной и крюком влево). Кисть задавала способ воспроизведения иероглифа. Даже изобретение наборного книгопечатания не изменило ситуацию: появились кассы иероглифов, но не появилось касс иероглифических компонентов. Разделить иероглиф на компоненты просто: сверху пиши “дао” (刀), под ним “юн” (用) — получишь “цзяо” (角). А как реально собрать эти компоненты? “Взять” их не за что, кроме как за чёрточки, и копирование иероглифа на бумаге по-прежнему производилось, как последовательное копирование его черт.

Появление компьютера должно было изменить ситуацию, но оказалось, что научить компьютер понимать написанные человеческой рукой иероглифы гораздо сложнее, чем рассчитать траекторию полета ракеты до Луны. Во всяком случае, приемлемые системы распознавания рукописного ввода иероглифов появились только в 21-ом веке. И если фонетические системы ввода алфавитного письма по скорости были в несколько раз быстрее рукописного ввода, то ускорения рукописного ввода иероглифов не произошло — пальцем на экране телефона нарисовать иероглиф ничуть не быстрее, чем начертить его палочкой на песке.

Вы, конечно, вправе возразить, что я умолчал об изобретении фонетического ввода иероглифов, но я отвечу вам, что сделал это сознательно. Речь идет, если вы помните, о словаре, то есть о наборе слов иностранного (в частности, китайского) языка изначально неизвестных (или основательно забытых), которые и хотелось бы узнать, понять и запомнить. Изначально неизвестный иероглиф имеет образ, но не имеет звука, вы его видите, а не слышите. Какой фонетический ввод поможет вам найти его? А привычка раскладывать иероглифы на компоненты, которые знает компьютер, позволяет найти неизвестный иероглиф по нескольким его компонентам. Найдя иероглиф в словаре, вы узнаете и звучание, и значение, и как его в следующий раз быстро ввести на клавиатуре.

Интерфейс китайско-русского словаря ChinaTouchTyping.

Пока это бэта-версия словаря, работающего на композиционном вводе, зато она бесплатна. Вас не заставляют оплачивать “фантазии” разработчиков и ненужные вам “звоночки и свисточки”. Основная отличительная характеристика словаря — простота управления. Всего три кнопки обеспечивают все три его функции: поиск, выбор из списка, очистка экрана, — всё. Ввели иероглиф (или слово), нашли его значение или выбрали слово среди тех, где данный иероглиф встречается в первой, второй или любой другой позиции.

В любом словаре главное — его словарный материал. Тут ничего оригинального, Котов и Ошанин. Объём словаря всего 42535 словарных карточек. Но почти все эти слова входят в 50 тыс. самых широко используемых в Китае. “Дао дэ цзин” с таким словарём переводить не возьмешься, но для начинающих иметь в кармане смартфон со словарём в 42 тыс. слов — самое то.

Ещё одна отличительная особенность словаря — наличие транскрипции Палладия. Не все уже помнят о “священ­ных войнах” десятых годов нашего века за “отлучение” Палладия от церкви “Святой Синоло­гии”, хотя нынче можно уверенно констатировать, что труды достопочтенного архимандрита всё-таки не пропали да­ром. Теперь его апологеты могут без труда найти в сети ресурсы, позволяющие перевести пинь­инь в палладицу. Но, много ли в сети словарей, с транскрипцией Палладия? Нет таковых. Публикаторы словаря Ошанина (БКРС) в сети старательно “выпилили” палладицу даже из заголовков словарных статей, не говоря о том, что в примерах его не было и в оригинале. А теперь есть. И в заголовках “гнезда”, и в примерах. Пиньинь, конечно же, оставлен в целях обратной со­вместимости.

О преимуществах одной транскрипции перед другой можно рассуждать бесконечно, если не определить, что есть преимущество. По скорости фонетического ввода, например, палладица опережает пиньинь приблизительно на 5%. Если сравнить таблицу записи всех 422 слогов китайского языка новым китайским фонетическим алфавитом пиньинь в словаре под редакцией И.М. Ошанина и таблицу традиционной русскоязычной транскрипции Палладия, то потребуется 1355 символов латиницы, а по-палладию достаточно 1284 символа. Разница составляет 71 символ в пользу палладицы, что и дает те самые “приблизительно 5%”. А если говорить о 57188 общеупотребительных словах китайского языка, то для записи требуется 411709 символов латиницы и только 385207 символов кириллицы. Этот выигрыш палладицы составляет уже 6,44%.

По простоте освоения ввода транскрипция Палладия дает пиньинь сто очков вперёд: мне кажется, что средне подготовленный студент пишет на кириллице заметно быстрее, чем на латинице, и специально этому его учить не надо.

Отдельная и самая любимая тема споров – это передача оригинального звучания языка. Какая транскрипция больше соответствует оригинальному звучанию китайского? Никакая. Никакая транскрипция ничего “не передаёт”. Она лишь заставляет вас произносить те или иные звуки, которые “передали” вам ваши учителя, учившие вас фонетике. Любая транскрипция – это не что иное как графическая метка артикуляционных стереотипов, которые вырабатываются только бесконечным повторением, почти условный рефлекс — видишь в тексте “что”, и произносишь на автомате “чё”. Хотя, по задумке учительницы русского языка должен был сказать “што” :) При этом, какой знак является сигнальным стимулом для запуска этого рефлекса, совершенно безразлично. Поэтому спокойно учите свой пиньинь, если вы его ещё не знаете. Но вдруг придет вам в голову написать то, что вам рассказали китайцы, тогда текст переводить вам придётся на русский, а не на пиньинь. А в русском свои стереотипы. Пиньинь китайцы придумали в пятидесятых годах для себя, под свои конкретные задачи, а не для нас. И слишком давно, когда в Китае ещё не было компьютеров. Тогда никому не могло прийти в голову, что такое логичное и красивое обозначение тонов диакритическими знаками при переносе текстов в компьютер вдруг породит сортировку по-пиньинь в странном порядке тонов: a, á, à, ǎ, ā (5, 2, 4, 3, 1). А в палладице всё по порядку…

Скачать словарь можно здесь, и пользоваться им свободно и бесплатно до выхода следующей версии, которая грядёт неизбежно и, я надеюсь, раньше, чем через год. Разработчики готовы к обсуждению и к сотрудничеству со всеми заинтересованными лицами и организациями.

Для заглавной иллюстрации использовано фото Chalk Academy.

Автор: Борис Путько

Вам понравилась наша статья? Поделитесь ею в соцсетях (достаточно кликнуть на иконку внизу страницы).

Если вы хотите быть в курсе наших публикаций, подписывайтесь на страницу Магазеты в facebookvkinstagramtelegram и наш аккаунт в WeChat — magazeta_com.

Фото аватара

Автор: Борис Путько

Биолог, программист, переводчик. С 2011-го года пытается научить свой компьютер вводить иероглифы. У компьютера уже получается.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *