Мультиязычная Tatoeba

Этот чудесный пост был прислан нам Вячеславом Рожковым через вот эту волшебную форму. Большое спасибо, Вячеслав, это супер!

“1. 我们试试看!
ENG: Let’s have a try!
РУС: Щас заценим!» :)

Сегодня на просторах инета был обнаружен интересный ресурс, называемый Tatoeba Project — веселое имечко, не правда ли? ;)

Участники проекта создают общими силами базу предложений на всевозможных языках, и что самое главное, со взаимными ссылками друг на друга — то есть, получается эдакий мультиязычный разговорник. В общем, всем интересующимся языками можно его посоветовать как один из источников информации по нужным языкам.

Помимо этого, с сайта можно скачать всю базу фраз целиком. База представляет из себя два отдельных файла с собственно фразами, и ссылками друг на друга. К сожалению, разобраться в этой мешанине и перевести ее в понятный вид под силу только программисту. Я не мог пройти мимо этой интересной задачки. Просидев пару часиков с кружкой чая, и получив массу программерского удовольствия, я привел базу в божеский вид, и хочу предложить вашему вниманию плоды своих трудов.

Из базы были отобраны только фразы на китайском, с их переводами на понятные всем нам языки: русский и английский. Из более чем 12 тысяч китайских фраз в итогде осталось только 5 тысяч с хвостиком (все остальные имеют переводы на французский, хинди и прочие чудесные языки). В итоге получился текстовый файл примерно такого содержания:

61. 不要再把我看成”正常»人!
ENG: Stop seeing me as a «normal» person!

62. 一切都是创造的,也是真实的。
ENG: All that which is invented, is true.
RUS: Всё то, что было изобретено, правильно.

63. 感到惊讶、感到惊奇就是明白的开始。
ENG: To be surprised, to wonder, is to begin to understand.
RUS: Изумление, удивление — это первый шаг на пути к постижению.

В дополнение прилагается файл, который содержит все 12 тысяч китайских фраз со всеми имеющимися переводами. Некоторые фразы, правда, переведены только на арабский ; )

Скачать архив можно здесь: http://snark.vl.ru/files/chinese_sentences.rar

P.S. Если кому-то потребуется подобный файл для других языков (скажем, все переводы с японского на итальянский), или в другом формате, то обращайтесь ко мне через почту snarky-собака-inbox-точка-ru
С радостью помогу 8 )

предупреждаем, китайская база — полные, т.е. не упрощенные формы иероглифов (использующиеся на Тайване и в Гонконге). Впрочем, в интернете есть много онлайн-конвертеров полных форм в упрощенные и обратно — например, тут или тут.

Фото аватара

Автор: Виктор Ширяев

Выпускник востфака СПбГУ, кафедра истории стран ДВ, Китай. Выпускник университета JFKU в Калифорнии, Integral Studies. Живу в Шанхае.