Всем, кто так или иначе сталкивается с китайским языком, порой приходится переводить на русский имена собственные. Еще в 19 веке для этого была придумана транскрипционная система Палладия.
Одно время и мне приходилось переводить очень много китайских названий на русский язык. Очень-очень много. И для этого я также использовал систему Палладия. Все это сводилось к тому, что я открывал указанную выше страничку в Википедии с таблицей и внимательно смотрел соответствие. Затем я немного устал это делать и стал искать онлайн-сервисы, которые автоматически переводят пиньинь в палладицу. Те, что нашел, не распознавали тоны и имели перегруженный и неудобный интерфейс. Устав и от этого, я сделал небольшой, легкий и удобный сервис для перевода пиньиня в палладицу — Палладиус.
Работает быстро (нет перезагрузки страницы при отправке формы благодаря технологии AJAX), удобный и простой интерфейс — в общем, все, что нужно! Пока что сервис еще дорабатывается и я буду рад, если вы найдете какие-то ошибки да и вообще отпишите свои комментарии.
В ближайшее время по совету посетителей планирую добавить исключения — географические названия, а также возможность вводить не только пиньинь, но и иероглифы (тут, кстати, поблагодарю от души, если кто посоветует API для перевода китайских иероглифов 汉子 в пиньинь).
Хорошо, если сервис кому-то еще пригодится! Я заметил, что все ругаются на журналистов, поэтому если это и им упростит жизнь и научит правильно переводить китайские названия — будет здорово!
Обновление от 2020
В Палладиус добавлена функция записи иероглифов кириллицей. Маредакция также рекомендует использовать для проверки сервисы StudyChinese.ru и bkrs.info. Особенно это касается имён и названий.
Также можно использоваться сервис Google Translate для быстрого получения полной транскрипции китайских иероглифов (это может пригодится, например, если вам нужно быстро получить пиньинь к китайскому тексту).
Больше статей про пиньинь, систему Палладия и альтернативы:
Яндекс переводчик показывает транскрипции китайских иероглифов
Респект автору.
Появились следующие мысли. Можно воспринимать, как пожелания.
Первая — (Демян частично уже высказал) — строчные/прописные буквы расставлять в соответствии с оригинальным текстом, а не все-с-большой.
Полуторная:
контроль ввода — сообщать, если введенный текст не является пиньинем
(В идеале — предлагать варианты того, чем он является).
Вторая (собственно, первая моя, полуторная получилась путем додумывания этой мысли):
Может быть, это не фича, а целый отдельный проект.
Добавить распознавание транскрипции Уэйда-Жиля. Так, чтобы по маркерам типа tse или tung можно было распознать Мао Цзэдуна. В случае спорных результатов — выдавать оба варианта:
taichi -> тайчи; может быть вы имели в виду дайцзи
Вторая с половиной мысль:
Добавить словарь часто встречающихся исключений а-ля
Haerbin, taichi, Sun Yat-sen, Chiang Kai-shek, Wong Karwai и др.
Ведь даже многие поверхностно знакомые с китайской тематикой люди могут не воспринимать (бесосознательно ли, или демонстративно) таких «тонкостей» (одна дама как-то упорно не могла взять в толк, почему Гонконг не передается как Хункун). Типичная же реакция непосвященных примерно такова: «Тьфу, нагородили там, один хрен никто этих ваших чанкайшеков не знает».
селф-фикс:
Демьян
эрцзы
фикс №2
может быть, вы имели
Добавить в словарь часто встречающихся исключений
Баг-репорты:
Фича-реквесты:
Великолепно, полезно, спасибо!
Константин, спасибо огромное! журналистам обычно в голову не приходит, что написание отличается от чтения. вот и появляются всевозможные Ксяо и Ченгду. ну и чтение берут как правило из англоязычных источников (и это понятно).
(пока писала косяк с ü уже поправили! спасибо!)
Есть небольшой совет/feature request: для пиньиня типа 西安 Xian, и прочих двоякостей (jian, zhu-ang) может быть стоит примечание писать, типа
Xian => Сянь (или Cиань, если два иероглифа)
Константин, спасибо огромное за сервис. Умоляю — исправьте косяки с ü. А то я-то могу ввести lüzhou, но переводит сервис это все равно как лучжоу, что очень смущает. Уже собралась рекомендавать сервис везде и всюду, но с такими ошибками от него будет больше вреда, чем пользы.
И еще раз спасибо!
Ольга, подправил, посмотрите :)
Мерси!
И казалось-бы, причем тут Тёма Лебедев..
Баг-репорт:
1. Не воспринимает «nv», а умляута у меня нет на клавиатуре :)
2. Если сразу после входа на страницу нажать кнопку перевода, то получим «Введите Пиньинь Здесь…», может дефолтную фразу-то не принимать?
Важные репорты (я автору свои еще пару месяцев назад засылал ;). Спасибо!
Спасибо!! Отдельно за CJK! Буду дорабатывать ;)
Ну, если переводить «много», то вся палладица запоминается слов через 10, благо она довольно логична :) Но для журналистов самое то, да. Только в этом случае я бы все-таки написал какое-то краткое пояснение насчет того, что такое «пиньинь» и «система Палладия» прямо на стартовой странице — тем, кто знает, что это, переводилка чаще всего уже не нужна.
Насчет иероглифов могу посоветовать CJK https://pypi.python.org/pypi/cjklib — действительно очень мощная штука, с ее помощью можно даже порядок черт в иероглифах показывать, а иероглифы в пиньинь — это так, семечки.
И везде у меня получается город Shenchou. Сортировал бы cjklib по частоте употребления (http://bkrs.info/slovo.php?ch=%E5%9C%B3) — цены бы ему не было.
Вот да. Из-за этого иногда еще более нелепые вещи случаются — к примеру, в моих карточках Anki с предложениями по HSK пиньинь, видимо, добавляли таким же методом, и там в половине карточек 会 идет как «kuai», а 没 как «mo».
По идее там есть и словарь, плюс это все хранится в обычной БД. Можно смотреть в словарь на составные слова и самому строить индекс частоты (сохранять его по мере обращения, например).