Палладиус — онлайн-сервис для перевода пиньинь в систему Палладия

Всем, кто так или иначе сталкивается с китайским языком, порой приходится переводить на русский имена собственные. Еще в 19 веке для этого была придумана транскрипционная система Палладия.

Одно время и мне приходилось переводить очень много китайских названий на русский язык. Очень-очень много. И для этого я также использовал систему Палладия. Все это сводилось к тому, что я открывал указанную выше страничку в Википедии с таблицей и внимательно смотрел соответствие. Затем я немного устал это делать и стал искать онлайн-сервисы, которые автоматически переводят пиньинь в палладицу. Те, что нашел, не распознавали тоны и имели перегруженный и неудобный интерфейс. Устав и от этого, я сделал небольшой, легкий и удобный сервис для перевода пиньиня в палладицу – Палладиус.

Работает быстро (нет перезагрузки страницы при отправке формы благодаря технологии AJAX), удобный и простой интерфейс – в общем, все, что нужно! Пока что сервис еще дорабатывается и я буду рад, если вы найдете какие-то ошибки да и вообще отпишите свои комментарии.

В ближайшее время по совету посетителей планирую добавить исключения – географические названия, а также возможность вводить не только пиньинь, но и иероглифы (тут, кстати, поблагодарю от души, если кто посоветует API для перевода китайских иероглифов 汉子 в пиньинь).

Хорошо, если сервис кому-то еще пригодится! Я заметил, что все ругаются на журналистов, поэтому если это и им упростит жизнь и научит правильно переводить китайские названия – будет здорово!

Обновление от 2020

В Палладиус добавлена функция записи иероглифов кириллицей. Маредакция также рекомендует использовать для проверки сервисы StudyChinese.ru и bkrs.info. Особенно это касается имён и названий.

Также можно использоваться сервис Google Translate для быстрого получения полной транскрипции китайских иероглифов (это может пригодится, например, если вам нужно быстро получить пиньинь к китайскому тексту).

Больше статей про пиньинь, систему Палладия и альтернативы:

Автор: Константин Гергель

大家好!Живу в Хабаровске, занимаюсь дизайном и стартапами. Пью чай, учу китайский, воспитываю английского бульдога Жору.

18 комментариев

  1. Респект автору.
    Появились следующие мысли. Можно воспринимать, как пожелания.
    Первая – (Демян частично уже высказал) – строчные/прописные буквы расставлять в соответствии с оригинальным текстом, а не все-с-большой.

    Во ши НУНМИНЬДЭ эрцы.

    Полуторная:
    контроль ввода – сообщать, если введенный текст не является пиньинем
    (В идеале – предлагать варианты того, чем он является).

    Вторая (собственно, первая моя, полуторная получилась путем додумывания этой мысли):
    Может быть, это не фича, а целый отдельный проект.
    Добавить распознавание транскрипции Уэйда-Жиля. Так, чтобы по маркерам типа tse или tung можно было распознать Мао Цзэдуна. В случае спорных результатов – выдавать оба варианта:
    taichi -> тайчи; может быть вы имели в виду дайцзи

    Вторая с половиной мысль:
    Добавить словарь часто встречающихся исключений а-ля
    Haerbin, taichi, Sun Yat-sen, Chiang Kai-shek, Wong Karwai и др.
    Ведь даже многие поверхностно знакомые с китайской тематикой люди могут не воспринимать (бесосознательно ли, или демонстративно) таких “тонкостей” (одна дама как-то упорно не могла взять в толк, почему Гонконг не передается как Хункун). Типичная же реакция непосвященных примерно такова: “Тьфу, нагородили там, один хрен никто этих ваших чанкайшеков не знает”.

      1. фикс №2
        может быть, вы имели
        Добавить в словарь часто встречающихся исключений

  2. Баг-репорты:

    1. хорошо б, чтобы ошибочное написание пиньиня конвертировалось во что-то осмысленное или выдавало предупреждение. А то wong конвертируется в Воng
    2. ещё баги: xi’an -> Сянь, tu’ou -> Тоu
    3. почему в палладице каждый слог с заглавной буквы?

    Фича-реквесты:

    1. перевод ютпхина и йельской транслитерации в кантонско-русскую практическую транскрипцию
    2. перевод Палладия в систему пиньиня
    3. удобный REST-сервис, который бы позволил не отходя от блога конвертировать нужные слова
  3. Константин, спасибо огромное! журналистам обычно в голову не приходит, что написание отличается от чтения. вот и появляются всевозможные Ксяо и Ченгду. ну и чтение берут как правило из англоязычных источников (и это понятно).
    (пока писала косяк с ü уже поправили! спасибо!)

  4. Есть небольшой совет/feature request: для пиньиня типа 西安 Xian, и прочих двоякостей (jian, zhu-ang) может быть стоит примечание писать, типа

    Xian => Сянь (или Cиань, если два иероглифа)

  5. Константин, спасибо огромное за сервис. Умоляю – исправьте косяки с ü. А то я-то могу ввести lüzhou, но переводит сервис это все равно как лучжоу, что очень смущает. Уже собралась рекомендавать сервис везде и всюду, но с такими ошибками от него будет больше вреда, чем пользы.

    И еще раз спасибо!

  6. Баг-репорт:
    1. Не воспринимает “nv”, а умляута у меня нет на клавиатуре :)
    2. Если сразу после входа на страницу нажать кнопку перевода, то получим “Введите Пиньинь Здесь…”, может дефолтную фразу-то не принимать?

  7. Ну, если переводить “много”, то вся палладица запоминается слов через 10, благо она довольно логична :) Но для журналистов самое то, да. Только в этом случае я бы все-таки написал какое-то краткое пояснение насчет того, что такое “пиньинь” и “система Палладия” прямо на стартовой странице – тем, кто знает, что это, переводилка чаще всего уже не нужна.

    Насчет иероглифов могу посоветовать CJK https://pypi.python.org/pypi/cjklib – действительно очень мощная штука, с ее помощью можно даже порядок черт в иероглифах показывать, а иероглифы в пиньинь – это так, семечки.

    1. from cjklib.characterlookup import CharacterLookup
      cjk = CharacterLookup(‘T’)
      print u’ / ‘.join(cjk.getReadingForCharacter(u’圳’, ‘Pinyin’))
      chóu/huái/quǎn/zhèn

      И везде у меня получается город Shenchou. Сортировал бы cjklib по частоте употребления (http://bkrs.info/slovo.php?ch=%E5%9C%B3) – цены бы ему не было.

      1. Вот да. Из-за этого иногда еще более нелепые вещи случаются – к примеру, в моих карточках Anki с предложениями по HSK пиньинь, видимо, добавляли таким же методом, и там в половине карточек 会 идет как “kuai”, а 没 как “mo”.

        По идее там есть и словарь, плюс это все хранится в обычной БД. Можно смотреть в словарь на составные слова и самому строить индекс частоты (сохранять его по мере обращения, например).

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *