Печатная машинка Линь Юйтана: из прошлого в будущее

Печатающая машинка Линь Юйтана: из прошлого в будущее

Здравствуйте, уважаемые читатели Магазеты. На этот раз тема статьи совсем уж сугубо техническая, а может быть даже и механистическая… Современные пользователи компьютерных методов ввода для китайского языка, наверное, не представляют, как же обстояло дело с вводом и печатью иероглифов в докомпьютерную «эру», когда были только лишь механические печатающие машинки. Нет, непомерно огромные наборные кассы иероглифов здесь не в счёт. Речь в статье пойдёт о настоящей китайской печатающей машинке Ming Kwai (明快), изобретённой Линь Юйтаном (林語堂) и запатентованной им в 1946 году.

Ming Kwai Печатающая машинка Линь Юйтана: из прошлого в будущее

Нет смысла упоминать здесь об истории жизни этого человека и об этапах создания его изобретения. Это всё можно найти в Сети. Достаточно упомянуть, что проект печатающей машинки, к сожалению, так и не пошёл в массовое производство по различным причинам. А ведь это изобретение было самым первым методом ввода китайских иероглифов, пусть даже и чисто механическим! Также в статье я попробую заново рассмотреть базовую идею этой пишущей машинки в современном аспекте композиционной генерации китайских знаков.

Да, сейчас в эпоху компьютерных технологий многие из нас не задумываются, какие сложности сопровождали печать текстового документа на обычной печатающей машинке: опечатки, замазывания и т.п. Те, кто родился в 70-х и даже в начале 80-х, ещё наверняка помнят, что у папы или мамы на работе стоял на столе такой интересный железный агрегат, у которого при нажатии на кнопочку на бумажке появлялась буковка. А как же обстояли аналогичные дела в Китае, Гонконге, Тайване – страшно представить? Но не всё так страшно, как кажется на первый взгляд.

Есть такой патент US2613795, мало чем отличающийся от тысяч других таких же патентов.

Однако для знатоков китайской иероглифической письменности и разработчиков систем методов ввода китайского языка этот патент должен стать главной информационной реликвией. Поначалу довольно трудно понять принцип работы машинки Линь Юйтана. Но если вникнуть, то сразу понимаешь – всё гениальное просто.

Развёрнутую организацию расположения печатающих головок этой машинки можно представить себе в виде простейшей трёхмерной структуры 36х29х8=8352 литеры. Реализовано это на трёх различных вращениях. Вот эти вращения: главный барабан, затем на нём каждый из больших шести вращающихся барабанов несёт ещё шесть печатающих барабанов поменьше. Эти меньшие барабаны могут также вращаться и содержат 8 рядов по 29 литер в каждом. Вот и вся арифметика с комбинаторикой.

Ming Kwai Печатающая машинка Линь Юйтана: из прошлого в будущее

Теперь о принципе организации ввода. Ещё до изобретения машинки Линь Юйтан изобрёл свой принцип сортировки в иероглифическом словаре. Собственно, многие авторы иногда строят свои схемы упорядочивания иероглифов в словарях, например, вместо ключевой из 214 классических ключей, в советском БКРС используется схема упорядочивания по черте или элементу. Свою схему Линь Юйтан так и назвал «Китайский алфавит», здесь подчёркивается, не фонетический алфавит, а именно структурный. А состоит он из десяти базовых символов, происходящих от китайских числительных. Подробнее по ссылке.

Анализируются только два угла иероглифа левый верхний и правый нижний. Возможно, тут берёт свои истоки другой метод ввода – 4 угла. Клавиатуру своей машинки Линь Юйтан построил по следующему принципу: 36 клавиш кодируют начало знака (левый верхний угол либо верхняя часть), а 28 кодируют окончание начертания знака (правый нижний угол либо нижняя часть). Почему в нижней части клавиатуры было не 29 клавиш – я сперва немного не понял. Теперь для вывода на печать нужен выбор одного варианта из 8. За это отвечают 8 больших клавиш в нижнем ряду (нумерация 1–8). Для возможности выбора необходима индикация облика уже готового варианта иероглифа на заранее заготовленной бумаге или другом материале. Всё это должно отображаться в специальном окошечке выбора, где на пронумерованных позициях от 1 до 8 будут уже заранее напечатаны знаки. Вот и вся механика. Сразу нужно сказать, что вообще-то сам принцип классификации должен обеспечивать равномерность заполнения каждого из 8-ми вариантов, без «перекосов», иначе часть не уместившихся знаков (неоднозначность кодирования более 8) придётся переносить в другие незаполненные ряды печатающего барабана. Да и незаполненность одного круга из 8 литер тут также не особо желательна.

Всё-таки, перечитывая описание изобретения Линь Юйтана, чувствуется – что-то у него логически немного не сходится. Нет, с чисто механической позиции и числа сочетаний комбинаций всё абсолютно ясно, а вот с точки зрения часто упоминаемой в патенте возможности печати иероглифа из составных компонентов – не совсем понятно. В начале описания он многократно подчёркивает и обращает внимание на возможность печати из двух различных компонентов умопомрачительного числа знаков – около 90 000. И это касается только сочетания ключ слева + фонетик.

Но в рассказе одного автора приводится пример ввода, где становится ясно, что автор всё-таки не пошел на реализацию печати иероглифов по двум составным компонентам: ключ + фонетик. Схема, иллюстрирующая ввод, в вышеприведённом источнике расположена на странице 411, fig.5.

То есть автор мог пойти по пути фиксированного списка из не более чем 8352 знаков. Ну, в принципе, даже для Гонконга это было бы уже вполне приемлемое число. Однако сегодня хочется рассмотреть это изобретение с позиции печатной генерации (в несколько нажатий) очень большого количества знаков, состоящих из ключа и фонетика. Даже сам Линь Юйтан в описании патента упоминает всего лишь о 1300 фонетиках, исчерпывающе описывающих множество неключевых частей иероглифов. Кстати, интересное совпадение, в путунхуа как раз где-то около 1400 фонем с учётом тонов.

Чтобы убедиться в порядке этого числа, предлагаю подсчитать число знаков в самом населённом ключе «вода» из основной плоскости Юникода: (U+6C34 – U+706A), ответ — 1079. В этом ключе доминирует композиция [LR] с ключевым знаком в начале начертания знака. Долго я не мог понять в описании патента, почему клавиш в машинке для второго нажатия было 28, а литер в ряду малого печатающего барабана было на единицу больше – 29, их в US2613795 можно даже сосчитать на одном из рисунков. Это можно объяснить тем, что автор изобретения изначально планировал оставлять первое нажатие именно под ключевой знак. Тогда в таком раскладе вариантов ключевых знаков было бы 6х6х8=288. Кстати, Линь Юйтан упоминал всего лишь о 70–80 основных ключевых знаках, которые целесообразно было использовать в качестве составных компонентов.

Ming Kwai Печатающая машинка Линь Юйтана: из прошлого в будущее

Теперь перенесёмся в сегодняшнее время и немного повоображаем. Представим себе, что имеется некая система структурного ввода с алфавитом из 36 символов. Это количество радикалов где-то близкó к тайваньским методам ввода DaYi, Array30. Далее, представим, что также в два нажатия мы кодируем все необходимые для печатной генерации фонетики: начальный элемент знака + конечный элемент. Тогда полное число кодируемых самостоятельных фонетиков будет 36х36=1296 почти то же, что и указывал Линь Юйтан. Но вот очень маленькое условие: наша воображаемая система ввода должна кодировать всего лишь двумя знаками любой фонетик совершенно однозначно, без каких либо совпадений строки кода из двух символов. И вот, при строгом соблюдении этого условия, мы сможем на прототипе машинки Линь Юйтана применить современный принцип печатной композиции знака, давно заложенный в стандарте Юникод. То есть на печатающем барабане вместо 8 рядов по 29 символов, как это было в оригинале, мы должны будем применить, например… 12 рядов по 37 символов: 12 – для задания типа композиции, 36 – для различных фонетиков, а +1 (37) – под варианты ключевых знаков. А ещё, деление окружности на 12 – это довольно легко реализуемая техническая задача. Вообще, по Юникоду типов декомпозиции 12, но +1 базовый неизменённый композицией знак фонетика, равно 13 – не умещается один, однако. Но можно пожертвовать одним типом композиции UP_CENTER_BOTTOM – это тот, который вертикально делит знак на три равные части. В сочетании с ключами он почти не встречается. В итоге, на любом из 6х6 печатающих малых барабанов в самой первой окружности будут всегда располагаться 12 вариантов двух-трёх ключей, а в остальных 36 окружностях – 12 вариантов одного фонетика, расставленные по типам композиции. Тогда максимальное количество возможных вариантов ключей будет равно 36х12=432 – вполне приемлемое число. Максимально возможное число сочетаний ключа и фонетика в такой печатающей машинке будет равно 432х1296=559 872 (Юникод нервно курит в сторонке!). Печать одного знака в таком варианте машинки будет идти двумя путями:

1) Печать просто отдельного фонетика (кнопка отмены ключа, затем два нажатия: начало знака и завершение знака). Окна выбора здесь не нужно, и отдельной кнопки ПЕЧАТЬ не потребуется, поскольку её функции в этом варианте возьмет кнопка выбора 1 (всего их 12). Остальные одиннадцать могут быть вообще заблокированы. Итого – 4 нажатия без окошка выбора. Хотя, наличие окна индикации для единственного фонетика перед печатью – желательно.

2) Печать составного знака. Первое нажатие одной из 36 кнопок – выбор варианта ключевого знака. Печать ключа (второе нажатие) осуществляется по нажатию одной из 12 кнопок. Отображение списка выбора ключевых знаков в отдельном окошечке здесь уже строго необходимо. Затем, третье и четвёртое нажатия – начало и завершение фонетика. И пятое нажатие – печать одной из 11 форм фонетика в композиции с ключом. Ответственность за правильное сочетание варианта ключа и соответствующей формы фонетика возлагается на пользователя. Итого – пять нажатий с контролем в окошке выбора ключа.

Вот и вся техническая реализация. Хотя нет, почти вся. Индикация гарантированно единственного фонетика может быть выполнена в виде толстого цилиндра с 36х36 ячейками с выводом в одном малом квадратном окошке. Индикация всех вариантов ключа может быть выполнена в другом прямоугольном окошке в виде уплощённого цилиндра 36х12. А ещё, чтоб не получить количество клавиш по схеме 36+36 (у автора патента оно было равно 36+28), техническими приёмами можно было бы разделить два нажатия на одну клавиатуру из 36 клавиш. Вот такая у нас получается абстрактная китайская пишущая машинка на новый лад. Главная проблема здесь – это создание абсолютно однозначной кодировки, состоящей всего из двух знаков алфавита из 36 графем, которая одинаково однозначно будет задавать и варианты различных ключей и жёсткий список 1296 фонетиков. Да, кажется, задача почти невыполнима, но вот продумать правила исключений неоднозначностей, например, для завершающих символов редко используемых иероглифов в виде перехода на предыдущий знак от конца кодировочной строки символа – это вполне возможно.

На патент не имею права претендовать, поскольку это была всего лишь личная трактовка гениальных идей Линь Юйтана. А вообще, печатающие машинки сейчас… как-то это старомодно и неактуально звучит. Но почему-то истоки развития современных технологий всё равно так и манят к себе пытливые умы! Надеюсь, что было интересно.

comments powered by HyperComments

Orphus: Нашли опечатку? Нажмите Ctrl+Enter

Автор: WERTA

Фанат грамоты на кiтайскiхъ знакахъ. Родился в 1977 г. Проживаю в РФ. Интерес к китайскому я зыку и культуре внезапно проснулся в 1997 г. Особенно интересует меня все, что касается: международных стандартов CJKV унификации, кодировок, методов ввода, схем романизации и общей фонологии основных кит. диалектных групп. За границей не был, КНР не посещал. Опыта языкового общения с носителями китайского языка не имею. Перевел в 2011 г. c традиционного китайского на русский язык компьютерную игру 殖民計劃 — Colonial Project (DOS, RTS, 1996, T-Time Corp.).

Александр Мальцев
2013-12-25 15:15:57
<p>Афигенно! Потрясающий интересный пост. Большое спасибо!</p> <p>Хоть вы и не стали рассказывать про автора-изобретателя машинки, все же очень хотелось бы про него больше узнать на русском. Может в следующей статье расскажите? Может у него и другие изобретения были?</p> <p>Большое спасибо еще раз!</p>
WERTA
2013-12-25 17:57:25
Про Линь Юйтана только в русской Википедии более менее исчерпывающая информация есть. http://ru.wikipedia.org/wiki/%D0%9B%D0%B8%D0%BD%D1%8C_%D0%AE%D0%B9%D1%82%D0%B0%D0%BD Изобретений от него более я не встречал, кроме машинки. Однако его метод кодирования иероглифов, собственно, также является отдельным изобретением. В Кит-Англ. иероглифическом словаре Линь Юйтана как раз применена такая система. А сам он вообще был писателем, что уже впечатляет - какая была разносторонность интересов.
dalong
2013-12-25 17:38:45
Супер! Огромное спасибо! 加油!
Александр Мальцев
2013-12-25 18:31:45
<p>О! Спасибо за ссылку, там довольно сухой набор дат, но все равно прочитал с интересом. Получается машинка не пошла в производства из-за волнений/революции в Китае? Или еще какие-то причины?</p>
ChinaRedDevil
2013-12-25 18:55:52
А у меня дома в России есть две китайских пишущих машинки, одна та самая наборная касса иероглифов, другая электрическая... обе в условно-рабочем состоянии)))) Автору спасибо! Про такую модель не слышал. Попробую разузнать
WERTA
2013-12-25 21:21:37
Не помню где прочитал, он хотел её "толкнуть" в производство, кажется Ремингтону, но на официальном показе машинка закапризничала и отказалась работать. А вообще, я понял, особо сложной механики в ней почти не было кроме зубчатых передач.
WERTA
2013-12-25 21:25:28
Оооо! А можно поподробней и с фотографиями? Насчет кассы - это понятно, А вот то, что электрическое - весьма интересно. Я кстати, запланировал еще статью по корейской машинке и нескольким китайским (все патенты - US#######). Может это именно то, о чем я подумал? C 1946 г. и до компьютерного времени я припоминаю около пяти патентов на печатающие машинки на чистой механике.
Александр Мальцев
2013-12-26 17:51:11
<p>О, Далун в комментах? Когда новых постов от тебя ждать?</p>
WERTA
2013-12-26 17:40:23
А, ну если с дискетой... Рискну предположить, значит там электромеханическая реализация с матричной печатью. Возможно есть матрица 16х16 с ПЗУ для хранения знаков. А вот какой там метод ввода - даже не берусь гадать. А машинка какая? Тайвань или КНР? Меня-то интересуют именно чисто механические вещи в конструкциях азиатских печатающих машинок, поскольку электромеханика резко расширяет возможности. А чистая механика заставляет изобретателя максимально выкручиваться с конструктивными решениями.
ChinaReDdevil
2013-12-26 15:57:53
С фотографиями, увы, не получится, так как я сейчас далеко оттуда. Касса обычная, а электрическая машинка образца конца 80- начала 90 годов. Вроде включается, но требует установочную дискету 3.5″, которая, похоже размагнитилась...
ChinaReDdevil
2013-12-26 16:07:32
А статьи ваши будем ждать! Тема оень интересная, мне по крайней мере.
андрей дерябин
2013-12-26 20:22:14
Крайне неожиданный аспект китаистики! Снимаю шляпу.
Дмитрий
2013-12-27 04:46:42
Старый вопрос "какова же она клавиатура для китайского языка" обрел ещё один теперь механистический ответ. :) Спасибо за статью.
Леонид Ивлев
2013-12-29 01:36:37
WERTA, Вы поднимаете очень интересные темы, но, к сожалению, редко - можно Вас где-нибудь зафолловить или эрэсэсить для регулярного чтения?
WERTA
2013-12-29 10:15:32
Редко?.... Да пожалуй, на то они и интересные темы, и их нужно выискивать. Кроме как в Ма, я нигде более не печатаю свои мысли на тему кит. языка и техн. аспектов с ним связанных. Поэтому ждите...