Палладиус — онлайн-сервис для перевода пиньиня в систему Палладия

Палладиус —  онлайн-сервис для перевода пиньиня в систему Палладия

Всем, кто так или иначе сталкивается с китайским языком, порой приходится переводить на русский имена собственные. Еще в 19 веке для этого была придумана транскрипционная система Палладия.

Одно время и мне приходилось переводить очень много китайских названий на русский язык. Очень-очень много. И для этого я также использовал систему Палладия. Все это сводилось к тому, что я открывал указанную выше страничку в Википедии с таблицей и внимательно смотрел соответствие. Затем я немного устал это делать и стал искать онлайн-сервисы, которые автоматически переводят пиньинь в палладицу. Те, что нашел, не распознавали тоны и имели перегруженный и неудобный интерфейс. Устав и от этого, я сделал небольшой, легкий и удобный сервис для перевода пиньиня в палладицу — Палладиус.

Работает быстро (нет перезагрузки страницы при отправке формы благодаря технологии AJAX), удобный и простой интерфейс — в общем, все, что нужно! Пока что сервис еще дорабатывается и я буду рад, если вы найдете какие-то ошибки да и вообще отпишите свои комментарии.

В ближайшее время по совету посетителей планирую добавить исключения — географические названия, а также возможность вводить не только пиньинь, но и иероглифы (тут, кстати, поблагодарю от души, если кто посоветует API для перевода 汉子 в пиньинь).

Хорошо, если сервис кому-то еще пригодится! Я заметил, что все ругаются на журналистов, поэтому если это и им упростит жизнь и научит правильно переводить китайские названия — будет здорово!

comments powered by HyperComments

Orphus: Нашли опечатку? Нажмите Ctrl+Enter

Автор: Константин Гергель

大家好!Живу в Хабаровске, занимаюсь дизайном и стартапами. Пью чай, учу китайский, воспитываю английского бульдога Жору.

wangwei
2013-03-18 14:14:16
<p>Ну, если переводить "много", то вся палладица запоминается слов через 10, благо она довольно логична :) Но для журналистов самое то, да. Только в этом случае я бы все-таки написал какое-то краткое пояснение насчет того, что такое "пиньинь" и "система Палладия" прямо на стартовой странице - тем, кто знает, что это, переводилка чаще всего уже не нужна.</p> <p>Насчет иероглифов могу посоветовать CJK https://pypi.python.org/pypi/cjklib - действительно очень мощная штука, с ее помощью можно даже порядок черт в иероглифах показывать, а иероглифы в пиньинь - это так, семечки.</p>
wangwei
2013-03-18 14:18:25
<p>Баг-репорт: 1. Не воспринимает "nv", а умляута у меня нет на клавиатуре :) 2. Если сразу после входа на страницу нажать кнопку перевода, то получим "Введите Пиньинь Здесь...", может дефолтную фразу-то не принимать?</p>
ahenobarbus
2013-03-18 14:20:27
И казалось-бы, причем тут Тёма Лебедев..
Александр Мальцев
2013-03-18 15:04:43
<p>Важные репорты (я автору свои еще пару месяцев назад засылал ;). Спасибо!</p>
Константин Гергель
2013-03-18 15:06:51
Спасибо!! Отдельно за CJK! Буду дорабатывать ;)
MS
2013-03-18 15:27:39
<blockquote> <blockquote> <blockquote> from cjklib.characterlookup import CharacterLookup cjk = CharacterLookup('T') print u' / '.join(cjk.getReadingForCharacter(u'圳', 'Pinyin')) chóu/huái/quǎn/zhèn </blockquote> </blockquote> </blockquote> И везде у меня получается город Shenchou. Сортировал бы cjklib по частоте употребления (http://bkrs.info/slovo.php?ch=%E5%9C%B3) - цены бы ему не было.
wangwei
2013-03-19 01:55:58
<p>Вот да. Из-за этого иногда еще более нелепые вещи случаются - к примеру, в моих карточках Anki с предложениями по HSK пиньинь, видимо, добавляли таким же методом, и там в половине карточек 会 идет как "kuai", а 没 как "mo".</p> <p>По идее там есть и словарь, плюс это все хранится в обычной БД. Можно смотреть в словарь на составные слова и самому строить индекс частоты (сохранять его по мере обращения, например).</p>
Ольга Мерёкина
2013-03-19 12:55:18
<p>Константин, спасибо огромное за сервис. Умоляю - исправьте косяки с ü. А то я-то могу ввести lüzhou, но переводит сервис это все равно как лучжоу, что очень смущает. Уже собралась рекомендавать сервис везде и всюду, но с такими ошибками от него будет больше вреда, чем пользы.</p> <p>И еще раз спасибо!</p>
Александр Мальцев
2013-03-19 13:32:56
<p>Есть небольшой совет/feature request: для пиньиня типа 西安 Xian, и прочих двоякостей (jian, zhu-ang) может быть стоит примечание писать, типа</p> <p>Xian => Сянь (или Cиань, если два иероглифа)</p>
Константин Гергель
2013-03-19 13:40:00
Ольга, подправил, посмотрите :)
k40
2013-03-19 13:54:54
Константин, спасибо огромное! журналистам обычно в голову не приходит, что написание отличается от чтения. вот и появляются всевозможные Ксяо и Ченгду. ну и чтение берут как правило из англоязычных источников (и это понятно). (пока писала косяк с ü уже поправили! спасибо!)
invidia
2013-03-19 15:05:29
Великолепно, полезно, спасибо!
Infusiastic
2013-03-19 16:45:45
<p>Баг-репорты:</p> <ol> <li>хорошо б, чтобы ошибочное написание пиньиня конвертировалось во что-то осмысленное или выдавало предупреждение. А то wong конвертируется в Воng</li> <li>ещё баги: xi'an -> Сянь, tu'ou -> Тоu</li> <li>почему в палладице каждый слог с заглавной буквы?</li> </ol> <p>Фича-реквесты:</p> <ol> <li>перевод ютпхина и йельской транслитерации в кантонско-русскую практическую транскрипцию</li> <li>перевод Палладия в систему пиньиня</li> <li>удобный REST-сервис, который бы позволил не отходя от блога конвертировать нужные слова</li> </ol>
Ольга Мерёкина
2013-03-20 10:32:20
<p>Мерси!</p>
Чин-ту-фат
2013-03-20 13:01:46
Респект автору. Появились следующие мысли. Можно воспринимать, как пожелания. Первая - (Демян частично уже высказал) - строчные/прописные буквы расставлять в соответствии с оригинальным текстом, а не все-с-большой. <blockquote> Во ши НУНМИНЬДЭ эрцы. </blockquote> Полуторная: контроль ввода - сообщать, если введенный текст не является пиньинем (В идеале - предлагать варианты того, чем он является). Вторая (собственно, первая моя, полуторная получилась путем додумывания этой мысли): Может быть, это не фича, а целый отдельный проект. Добавить распознавание транскрипции Уэйда-Жиля. Так, чтобы по маркерам типа tse или tung можно было распознать Мао Цзэдуна. В случае спорных результатов - выдавать оба варианта: taichi -&gt; <strong>тайчи</strong>; может быть вы имели в виду <strong>дайцзи</strong> Вторая с половиной мысль: Добавить словарь часто встречающихся исключений а-ля Haerbin, taichi, Sun Yat-sen, Chiang Kai-shek, Wong Karwai и др. Ведь даже многие поверхностно знакомые с китайской тематикой люди могут не воспринимать (бесосознательно ли, или демонстративно) таких "тонкостей" (одна дама как-то упорно не могла взять в толк, почему Гонконг не передается как Хункун). Типичная же реакция <em>непосвященных</em> примерно такова: "Тьфу, нагородили там, один хрен никто этих ваших чанкайшеков не знает".
Чин-ту-фат
2013-03-20 13:04:13
селф-фикс: Демьян эрцзы
Фаньце Цзян
2013-03-20 13:13:29
фикс №2 может быть, вы имели Добавить в словарь часто встречающихся исключений