Палладиус — онлайн-сервис для перевода пиньиня в систему Палладия

Палладиус — онлайн-сервис для перевода пиньиня в систему Палладия

Всем, кто так или иначе сталкивается с китайским языком, порой приходится переводить на русский имена собственные. Еще в 19 веке для этого была придумана транскрипционная система Палладия.

РЕКЛАМА

Медиакит и ценыНативная рекламаСвязаться

Одно время и мне приходилось переводить очень много китайских названий на русский язык. Очень-очень много. И для этого я также использовал систему Палладия. Все это сводилось к тому, что я открывал указанную выше страничку в Википедии с таблицей и внимательно смотрел соответствие. Затем я немного устал это делать и стал искать онлайн-сервисы, которые автоматически переводят пиньинь в палладицу. Те, что нашел, не распознавали тоны и имели перегруженный и неудобный интерфейс. Устав и от этого, я сделал небольшой, легкий и удобный сервис для перевода пиньиня в палладицу — Палладиус.

Работает быстро (нет перезагрузки страницы при отправке формы благодаря технологии AJAX), удобный и простой интерфейс — в общем, все, что нужно! Пока что сервис еще дорабатывается и я буду рад, если вы найдете какие-то ошибки да и вообще отпишите свои комментарии.

В ближайшее время по совету посетителей планирую добавить исключения — географические названия, а также возможность вводить не только пиньинь, но и иероглифы (тут, кстати, поблагодарю от души, если кто посоветует API для перевода 汉子 в пиньинь).

Хорошо, если сервис кому-то еще пригодится! Я заметил, что все ругаются на журналистов, поэтому если это и им упростит жизнь и научит правильно переводить китайские названия — будет здорово!

  • 12
  • 21
  •  
  •  
  •  
РЕКЛАМА

Медиакит и ценыНативная рекламаСвязаться

  Подписаться  
новые старые популярные
Уведомления на
wangwei
Редактор

Ну, если переводить «много», то вся палладица запоминается слов через 10, благо она довольно логична :) Но для журналистов самое то, да. Только в этом случае я бы все-таки написал какое-то краткое пояснение насчет того, что такое «пиньинь» и «система Палладия» прямо на стартовой странице — тем, кто знает, что это, переводилка чаще всего уже не нужна.

Насчет иероглифов могу посоветовать CJK https://pypi.python.org/pypi/cjklib — действительно очень мощная штука, с ее помощью можно даже порядок черт в иероглифах показывать, а иероглифы в пиньинь — это так, семечки.

MS
Гость
MS

from cjklib.characterlookup import CharacterLookup
cjk = CharacterLookup(‘T’)
print u’ / ‘.join(cjk.getReadingForCharacter(u’圳’, ‘Pinyin’))
chóu/huái/quǎn/zhèn

И везде у меня получается город Shenchou. Сортировал бы cjklib по частоте употребления (http://bkrs.info/slovo.php?ch=%E5%9C%B3) — цены бы ему не было.

wangwei
Редактор

Вот да. Из-за этого иногда еще более нелепые вещи случаются — к примеру, в моих карточках Anki с предложениями по HSK пиньинь, видимо, добавляли таким же методом, и там в половине карточек 会 идет как «kuai», а 没 как «mo».

По идее там есть и словарь, плюс это все хранится в обычной БД. Можно смотреть в словарь на составные слова и самому строить индекс частоты (сохранять его по мере обращения, например).

wangwei
Редактор

Баг-репорт:
1. Не воспринимает «nv», а умляута у меня нет на клавиатуре :)
2. Если сразу после входа на страницу нажать кнопку перевода, то получим «Введите Пиньинь Здесь…», может дефолтную фразу-то не принимать?

Александр Мальцев
Редактор

Важные репорты (я автору свои еще пару месяцев назад засылал ;). Спасибо!

ahenobarbus
Гость
ahenobarbus

И казалось-бы, причем тут Тёма Лебедев..

Ольга Мерёкина
Редактор

Константин, спасибо огромное за сервис. Умоляю — исправьте косяки с ü. А то я-то могу ввести lüzhou, но переводит сервис это все равно как лучжоу, что очень смущает. Уже собралась рекомендавать сервис везде и всюду, но с такими ошибками от него будет больше вреда, чем пользы.

И еще раз спасибо!

Александр Мальцев
Редактор

Есть небольшой совет/feature request: для пиньиня типа 西安 Xian, и прочих двоякостей (jian, zhu-ang) может быть стоит примечание писать, типа

Xian => Сянь (или Cиань, если два иероглифа)

k40
Читатель

Константин, спасибо огромное! журналистам обычно в голову не приходит, что написание отличается от чтения. вот и появляются всевозможные Ксяо и Ченгду. ну и чтение берут как правило из англоязычных источников (и это понятно).
(пока писала косяк с ü уже поправили! спасибо!)

invidia
Читатель

Великолепно, полезно, спасибо!

Infusiastic
Гость

Баг-репорты:

  1. хорошо б, чтобы ошибочное написание пиньиня конвертировалось во что-то осмысленное или выдавало предупреждение. А то wong конвертируется в Воng
  2. ещё баги: xi’an -> Сянь, tu’ou -> Тоu
  3. почему в палладице каждый слог с заглавной буквы?

Фича-реквесты:

  1. перевод ютпхина и йельской транслитерации в кантонско-русскую практическую транскрипцию
  2. перевод Палладия в систему пиньиня
  3. удобный REST-сервис, который бы позволил не отходя от блога конвертировать нужные слова
Чин-ту-фат
Гость
Чин-ту-фат

Респект автору. Появились следующие мысли. Можно воспринимать, как пожелания. Первая — (Демян частично уже высказал) — строчные/прописные буквы расставлять в соответствии с оригинальным текстом, а не все-с-большой. Во ши НУНМИНЬДЭ эрцы. Полуторная: контроль ввода — сообщать, если введенный текст не является пиньинем (В идеале — предлагать варианты того, чем он является). Вторая (собственно, первая моя, полуторная получилась путем додумывания этой мысли): Может быть, это не фича, а целый отдельный проект. Добавить распознавание транскрипции Уэйда-Жиля. Так, чтобы по маркерам типа tse или tung можно было распознать Мао Цзэдуна. В случае спорных результатов — выдавать оба варианта: taichi -> тайчи; может быть… Читать далее »

Чин-ту-фат
Гость
Чин-ту-фат

селф-фикс:
Демьян
эрцзы

Фаньце Цзян
Гость
Фаньце Цзян

фикс №2
может быть, вы имели
Добавить в словарь часто встречающихся исключений