Печатающая машинка Линь Юйтана: из прошлого в будущее

Здравствуйте, уважаемые читатели Магазеты. На этот раз тема статьи совсем уж сугубо техническая, а может быть даже и механистическая… Современные пользователи компьютерных методов ввода для китайского языка, наверное, не представляют, как же обстояло дело с вводом и печатью иероглифов в докомпьютерную «эру», когда были только лишь механические печатающие машинки. Нет, непомерно огромные наборные кассы иероглифов здесь не в счёт. Речь в статье пойдёт о настоящей китайской печатающей машинке Ming Kwai (明快), изобретённой Линь Юйтаном (林語堂) и запатентованной им в 1946 году.

РЕКЛАМА

Медиакит и ценыНативная рекламаСвязаться

Ming Kwai Печатающая машинка Линь Юйтана: из прошлого в будущее

Нет смысла упоминать здесь об истории жизни этого человека и об этапах создания его изобретения. Это всё можно найти в Сети. Достаточно упомянуть, что проект печатающей машинки, к сожалению, так и не пошёл в массовое производство по различным причинам. А ведь это изобретение было самым первым методом ввода китайских иероглифов, пусть даже и чисто механическим! Также в статье я попробую заново рассмотреть базовую идею этой пишущей машинки в современном аспекте композиционной генерации китайских знаков.

Да, сейчас в эпоху компьютерных технологий многие из нас не задумываются, какие сложности сопровождали печать текстового документа на обычной печатающей машинке: опечатки, замазывания и т.п. Те, кто родился в 70-х и даже в начале 80-х, ещё наверняка помнят, что у папы или мамы на работе стоял на столе такой интересный железный агрегат, у которого при нажатии на кнопочку на бумажке появлялась буковка. А как же обстояли аналогичные дела в Китае, Гонконге, Тайване – страшно представить? Но не всё так страшно, как кажется на первый взгляд.

Есть такой патент US2613795, мало чем отличающийся от тысяч других таких же патентов.

Однако для знатоков китайской иероглифической письменности и разработчиков систем методов ввода китайского языка этот патент должен стать главной информационной реликвией. Поначалу довольно трудно понять принцип работы машинки Линь Юйтана. Но если вникнуть, то сразу понимаешь – всё гениальное просто.

Развёрнутую организацию расположения печатающих головок этой машинки можно представить себе в виде простейшей трёхмерной структуры 36х29х8=8352 литеры. Реализовано это на трёх различных вращениях. Вот эти вращения: главный барабан, затем на нём каждый из больших шести вращающихся барабанов несёт ещё шесть печатающих барабанов поменьше. Эти меньшие барабаны могут также вращаться и содержат 8 рядов по 29 литер в каждом. Вот и вся арифметика с комбинаторикой.

Ming Kwai Печатающая машинка Линь Юйтана: из прошлого в будущее

Теперь о принципе организации ввода. Ещё до изобретения машинки Линь Юйтан изобрёл свой принцип сортировки в иероглифическом словаре. Собственно, многие авторы иногда строят свои схемы упорядочивания иероглифов в словарях, например, вместо ключевой из 214 классических ключей, в советском БКРС используется схема упорядочивания по черте или элементу. Свою схему Линь Юйтан так и назвал «Китайский алфавит», здесь подчёркивается, не фонетический алфавит, а именно структурный. А состоит он из десяти базовых символов, происходящих от китайских числительных. Подробнее по ссылке.

Анализируются только два угла иероглифа левый верхний и правый нижний. Возможно, тут берёт свои истоки другой метод ввода – 4 угла. Клавиатуру своей машинки Линь Юйтан построил по следующему принципу: 36 клавиш кодируют начало знака (левый верхний угол либо верхняя часть), а 28 кодируют окончание начертания знака (правый нижний угол либо нижняя часть). Почему в нижней части клавиатуры было не 29 клавиш – я сперва немного не понял. Теперь для вывода на печать нужен выбор одного варианта из 8. За это отвечают 8 больших клавиш в нижнем ряду (нумерация 1–8). Для возможности выбора необходима индикация облика уже готового варианта иероглифа на заранее заготовленной бумаге или другом материале. Всё это должно отображаться в специальном окошечке выбора, где на пронумерованных позициях от 1 до 8 будут уже заранее напечатаны знаки. Вот и вся механика. Сразу нужно сказать, что вообще-то сам принцип классификации должен обеспечивать равномерность заполнения каждого из 8-ми вариантов, без «перекосов», иначе часть не уместившихся знаков (неоднозначность кодирования более 8) придётся переносить в другие незаполненные ряды печатающего барабана. Да и незаполненность одного круга из 8 литер тут также не особо желательна.

Всё-таки, перечитывая описание изобретения Линь Юйтана, чувствуется – что-то у него логически немного не сходится. Нет, с чисто механической позиции и числа сочетаний комбинаций всё абсолютно ясно, а вот с точки зрения часто упоминаемой в патенте возможности печати иероглифа из составных компонентов – не совсем понятно. В начале описания он многократно подчёркивает и обращает внимание на возможность печати из двух различных компонентов умопомрачительного числа знаков – около 90 000. И это касается только сочетания ключ слева + фонетик.

Но в рассказе одного автора приводится пример ввода, где становится ясно, что автор всё-таки не пошел на реализацию печати иероглифов по двум составным компонентам: ключ + фонетик. Схема, иллюстрирующая ввод, в вышеприведённом источнике расположена на странице 411, fig.5.

То есть автор мог пойти по пути фиксированного списка из не более чем 8352 знаков. Ну, в принципе, даже для Гонконга это было бы уже вполне приемлемое число. Однако сегодня хочется рассмотреть это изобретение с позиции печатной генерации (в несколько нажатий) очень большого количества знаков, состоящих из ключа и фонетика. Даже сам Линь Юйтан в описании патента упоминает всего лишь о 1300 фонетиках, исчерпывающе описывающих множество неключевых частей иероглифов. Кстати, интересное совпадение, в путунхуа как раз где-то около 1400 фонем с учётом тонов.

Чтобы убедиться в порядке этого числа, предлагаю подсчитать число знаков в самом населённом ключе «вода» из основной плоскости Юникода: (U+6C34 – U+706A), ответ — 1079. В этом ключе доминирует композиция [LR] с ключевым знаком в начале начертания знака. Долго я не мог понять в описании патента, почему клавиш в машинке для второго нажатия было 28, а литер в ряду малого печатающего барабана было на единицу больше – 29, их в US2613795 можно даже сосчитать на одном из рисунков. Это можно объяснить тем, что автор изобретения изначально планировал оставлять первое нажатие именно под ключевой знак. Тогда в таком раскладе вариантов ключевых знаков было бы 6х6х8=288. Кстати, Линь Юйтан упоминал всего лишь о 70–80 основных ключевых знаках, которые целесообразно было использовать в качестве составных компонентов.

Ming Kwai Печатающая машинка Линь Юйтана: из прошлого в будущее

Теперь перенесёмся в сегодняшнее время и немного повоображаем. Представим себе, что имеется некая система структурного ввода с алфавитом из 36 символов. Это количество радикалов где-то близкó к тайваньским методам ввода DaYi, Array30. Далее, представим, что также в два нажатия мы кодируем все необходимые для печатной генерации фонетики: начальный элемент знака + конечный элемент. Тогда полное число кодируемых самостоятельных фонетиков будет 36х36=1296 почти то же, что и указывал Линь Юйтан. Но вот очень маленькое условие: наша воображаемая система ввода должна кодировать всего лишь двумя знаками любой фонетик совершенно однозначно, без каких либо совпадений строки кода из двух символов. И вот, при строгом соблюдении этого условия, мы сможем на прототипе машинки Линь Юйтана применить современный принцип печатной композиции знака, давно заложенный в стандарте Юникод. То есть на печатающем барабане вместо 8 рядов по 29 символов, как это было в оригинале, мы должны будем применить, например… 12 рядов по 37 символов: 12 – для задания типа композиции, 36 – для различных фонетиков, а +1 (37) – под варианты ключевых знаков. А ещё, деление окружности на 12 – это довольно легко реализуемая техническая задача. Вообще, по Юникоду типов декомпозиции 12, но +1 базовый неизменённый композицией знак фонетика, равно 13 – не умещается один, однако. Но можно пожертвовать одним типом композиции UP_CENTER_BOTTOM – это тот, который вертикально делит знак на три равные части. В сочетании с ключами он почти не встречается. В итоге, на любом из 6х6 печатающих малых барабанов в самой первой окружности будут всегда располагаться 12 вариантов двух-трёх ключей, а в остальных 36 окружностях – 12 вариантов одного фонетика, расставленные по типам композиции. Тогда максимальное количество возможных вариантов ключей будет равно 36х12=432 – вполне приемлемое число. Максимально возможное число сочетаний ключа и фонетика в такой печатающей машинке будет равно 432х1296=559 872 (Юникод нервно курит в сторонке!). Печать одного знака в таком варианте машинки будет идти двумя путями:

1) Печать просто отдельного фонетика (кнопка отмены ключа, затем два нажатия: начало знака и завершение знака). Окна выбора здесь не нужно, и отдельной кнопки ПЕЧАТЬ не потребуется, поскольку её функции в этом варианте возьмет кнопка выбора 1 (всего их 12). Остальные одиннадцать могут быть вообще заблокированы. Итого – 4 нажатия без окошка выбора. Хотя, наличие окна индикации для единственного фонетика перед печатью – желательно.

2) Печать составного знака. Первое нажатие одной из 36 кнопок – выбор варианта ключевого знака. Печать ключа (второе нажатие) осуществляется по нажатию одной из 12 кнопок. Отображение списка выбора ключевых знаков в отдельном окошечке здесь уже строго необходимо. Затем, третье и четвёртое нажатия – начало и завершение фонетика. И пятое нажатие – печать одной из 11 форм фонетика в композиции с ключом. Ответственность за правильное сочетание варианта ключа и соответствующей формы фонетика возлагается на пользователя. Итого – пять нажатий с контролем в окошке выбора ключа.

Вот и вся техническая реализация. Хотя нет, почти вся. Индикация гарантированно единственного фонетика может быть выполнена в виде толстого цилиндра с 36х36 ячейками с выводом в одном малом квадратном окошке. Индикация всех вариантов ключа может быть выполнена в другом прямоугольном окошке в виде уплощённого цилиндра 36х12. А ещё, чтоб не получить количество клавиш по схеме 36+36 (у автора патента оно было равно 36+28), техническими приёмами можно было бы разделить два нажатия на одну клавиатуру из 36 клавиш. Вот такая у нас получается абстрактная китайская пишущая машинка на новый лад. Главная проблема здесь – это создание абсолютно однозначной кодировки, состоящей всего из двух знаков алфавита из 36 графем, которая одинаково однозначно будет задавать и варианты различных ключей и жёсткий список 1296 фонетиков. Да, кажется, задача почти невыполнима, но вот продумать правила исключений неоднозначностей, например, для завершающих символов редко используемых иероглифов в виде перехода на предыдущий знак от конца кодировочной строки символа – это вполне возможно.

На патент не имею права претендовать, поскольку это была всего лишь личная трактовка гениальных идей Линь Юйтана. А вообще, печатающие машинки сейчас… как-то это старомодно и неактуально звучит. Но почему-то истоки развития современных технологий всё равно так и манят к себе пытливые умы! Надеюсь, что было интересно.

  Подписаться  
новые старые популярные
Уведомления на
Александр Мальцев
Редактор

Афигенно! Потрясающий интересный пост. Большое спасибо!

Хоть вы и не стали рассказывать про автора-изобретателя машинки, все же очень хотелось бы про него больше узнать на русском. Может в следующей статье расскажите? Может у него и другие изобретения были?

Большое спасибо еще раз!

dalong
Читатель

Супер! Огромное спасибо! 加油!

Александр Мальцев
Редактор

О, Далун в комментах? Когда новых постов от тебя ждать?

ChinaRedDevil
Гость

А у меня дома в России есть две китайских пишущих машинки, одна та самая наборная касса иероглифов, другая электрическая… обе в условно-рабочем состоянии))))
Автору спасибо! Про такую модель не слышал. Попробую разузнать

андрей дерябин
Гость

Крайне неожиданный аспект китаистики! Снимаю шляпу.

Дмитрий
Гость

Старый вопрос «какова же она клавиатура для китайского языка» обрел ещё один теперь механистический ответ. :)
Спасибо за статью.

Леонид Ивлев
Читатель

WERTA, Вы поднимаете очень интересные темы, но, к сожалению, редко — можно Вас где-нибудь зафолловить или эрэсэсить для регулярного чтения?