Всем, кто так или иначе сталкивается с китайским языком, порой приходится переводить на русский имена собственные. Еще в 19 веке для этого была придумана транскрипционная система Палладия.
Одно время и мне приходилось переводить очень много китайских названий на русский язык. Очень-очень много. И для этого я также использовал систему Палладия. Все это сводилось к тому, что я открывал указанную выше страничку в Википедии с таблицей и внимательно смотрел соответствие. Затем я немного устал это делать и стал искать онлайн-сервисы, которые автоматически переводят пиньинь в палладицу. Те, что нашел, не распознавали тоны и имели перегруженный и неудобный интерфейс. Устав и от этого, я сделал небольшой, легкий и удобный сервис для перевода пиньиня в палладицу – Палладиус.
Работает быстро (нет перезагрузки страницы при отправке формы благодаря технологии AJAX), удобный и простой интерфейс – в общем, все, что нужно! Пока что сервис еще дорабатывается и я буду рад, если вы найдете какие-то ошибки да и вообще отпишите свои комментарии.
В ближайшее время по совету посетителей планирую добавить исключения – географические названия, а также возможность вводить не только пиньинь, но и иероглифы (тут, кстати, поблагодарю от души, если кто посоветует API для перевода китайских иероглифов 汉子 в пиньинь).
Хорошо, если сервис кому-то еще пригодится! Я заметил, что все ругаются на журналистов, поэтому если это и им упростит жизнь и научит правильно переводить китайские названия – будет здорово!
Обновление от 2020
В Палладиус добавлена функция записи иероглифов кириллицей. Маредакция также рекомендует использовать для проверки сервисы StudyChinese.ru и bkrs.info. Особенно это касается имён и названий.
Также можно использоваться сервис Google Translate для быстрого получения полной транскрипции китайских иероглифов (это может пригодится, например, если вам нужно быстро получить пиньинь к китайскому тексту).
Больше статей про пиньинь, систему Палладия и альтернативы:
Яндекс переводчик показывает транскрипции китайских иероглифов
Респект автору.
Появились следующие мысли. Можно воспринимать, как пожелания.
Первая – (Демян частично уже высказал) – строчные/прописные буквы расставлять в соответствии с оригинальным текстом, а не все-с-большой.
Полуторная:
контроль ввода – сообщать, если введенный текст не является пиньинем
(В идеале – предлагать варианты того, чем он является).
Вторая (собственно, первая моя, полуторная получилась путем додумывания этой мысли):
Может быть, это не фича, а целый отдельный проект.
Добавить распознавание транскрипции Уэйда-Жиля. Так, чтобы по маркерам типа tse или tung можно было распознать Мао Цзэдуна. В случае спорных результатов – выдавать оба варианта:
taichi -> тайчи; может быть вы имели в виду дайцзи
Вторая с половиной мысль:
Добавить словарь часто встречающихся исключений а-ля
Haerbin, taichi, Sun Yat-sen, Chiang Kai-shek, Wong Karwai и др.
Ведь даже многие поверхностно знакомые с китайской тематикой люди могут не воспринимать (бесосознательно ли, или демонстративно) таких “тонкостей” (одна дама как-то упорно не могла взять в толк, почему Гонконг не передается как Хункун). Типичная же реакция непосвященных примерно такова: “Тьфу, нагородили там, один хрен никто этих ваших чанкайшеков не знает”.
селф-фикс:
Демьян
эрцзы
фикс №2
может быть, вы имели
Добавить в словарь часто встречающихся исключений
Баг-репорты:
Фича-реквесты:
Великолепно, полезно, спасибо!
Константин, спасибо огромное! журналистам обычно в голову не приходит, что написание отличается от чтения. вот и появляются всевозможные Ксяо и Ченгду. ну и чтение берут как правило из англоязычных источников (и это понятно).
(пока писала косяк с ü уже поправили! спасибо!)
Есть небольшой совет/feature request: для пиньиня типа 西安 Xian, и прочих двоякостей (jian, zhu-ang) может быть стоит примечание писать, типа
Xian => Сянь (или Cиань, если два иероглифа)
Константин, спасибо огромное за сервис. Умоляю – исправьте косяки с ü. А то я-то могу ввести lüzhou, но переводит сервис это все равно как лучжоу, что очень смущает. Уже собралась рекомендавать сервис везде и всюду, но с такими ошибками от него будет больше вреда, чем пользы.
И еще раз спасибо!
Ольга, подправил, посмотрите :)
Мерси!
И казалось-бы, причем тут Тёма Лебедев..
Баг-репорт:
1. Не воспринимает “nv”, а умляута у меня нет на клавиатуре :)
2. Если сразу после входа на страницу нажать кнопку перевода, то получим “Введите Пиньинь Здесь…”, может дефолтную фразу-то не принимать?
Важные репорты (я автору свои еще пару месяцев назад засылал ;). Спасибо!
Спасибо!! Отдельно за CJK! Буду дорабатывать ;)
Ну, если переводить “много”, то вся палладица запоминается слов через 10, благо она довольно логична :) Но для журналистов самое то, да. Только в этом случае я бы все-таки написал какое-то краткое пояснение насчет того, что такое “пиньинь” и “система Палладия” прямо на стартовой странице – тем, кто знает, что это, переводилка чаще всего уже не нужна.
Насчет иероглифов могу посоветовать CJK https://pypi.python.org/pypi/cjklib – действительно очень мощная штука, с ее помощью можно даже порядок черт в иероглифах показывать, а иероглифы в пиньинь – это так, семечки.
И везде у меня получается город Shenchou. Сортировал бы cjklib по частоте употребления (http://bkrs.info/slovo.php?ch=%E5%9C%B3) – цены бы ему не было.
Вот да. Из-за этого иногда еще более нелепые вещи случаются – к примеру, в моих карточках Anki с предложениями по HSK пиньинь, видимо, добавляли таким же методом, и там в половине карточек 会 идет как “kuai”, а 没 как “mo”.
По идее там есть и словарь, плюс это все хранится в обычной БД. Можно смотреть в словарь на составные слова и самому строить индекс частоты (сохранять его по мере обращения, например).