Была придумана простая и удобная система из 6 рельефных точек, кодирующих буквы алфавита, цифры, знаки препинания и арифметических действий и даже ноты, которая используется и в наши дни. Всего в этой системе можно закодировать 64 символа (2 в 6 степени). Но для кодирования всей текстовой информации этого мало. И Брайль впервые ввел так называемые коды-переключатели (выражаясь современным языком, shift- и escape-коды). Наличие shift-кода перед знаком означает, что все последующие знаки надо читать определенным образом (например, как цифры, а не буквы) до тех пор, пока не встретится другой подобный знак. Escape-код действует только на один знак после такого кода. Такие системы кодирования с переключением получили в дальнейшем широкое распространение в компьютерной технике (например, принцип устройства языка HTML).
Расстояние между двумя точками Брайля составляет 2 - 2,5 мм, и для прочтения текста необходимо водить кончиками пальцев по выдавленным строчкам, читая с помощью осязания.
Позже предлагались другие системы выпуклого письма вместо системы Брайля, например, система Уильяма Муна (W.Moon, 1818-1894 гг.), который в 1847 разработал систему осязательного шрифта на основе латинского алфавита, упростив форму букв. Эта система в настоящее время распространена в Великобритании, Германии, Швейцарии, Южно-Африканской Республике и других странах. Кроме того, делались многочисленные попытки модернизировать саму систему Брайля, однако все эти попытки были малоуспешны.
Несколько лет назад меня заинтересовали проблемы записи и кодирования текстовой информации в контексте создания алфавита для всемирного языка. Работы, которые проводились в этой области, можно условно разделить на два направления:
1. Разработка новых форм кодирования текстовой
№1 2006 Интеллектуальная собственность в Беларуси
информации, которые отражают потребности человека: азбука для слепых людей (Л.Брайль, 1837 г.), телеграфный код (С.Морзе, 1838 г.), система кодирования с помощью двоичных последовательностей (Ж.Бодо, 1884 г.).
2. Создание алфавитов искусственных языков, основанных на латинской графике: Волапюк (И.М. Шлейер, 1879 г.), Эсперанто (Л.Замменгоф, 1887 г.), Логлан (Дж. Кук Браун, 1955 г.) и многие другие, в том числе и искусственных алфавитов (Дж. Р. Р. Толкин, 1919 г.).
Интересуясь этими вопросами, я стремился разработать новую форму записи и кодирования текстовой информации, которая могла бы стать удобной для запоминания и употребления, иметь простую графику, быть рациональной и экономичной.
Начнем с того, что любой знак, отображающий звук, букву или цифру, состоит из простых графических элементов - составных частей, которые графически самостоятельны. Это могут быть точка, отрезок прямой линии или дуга. С помощью этих элементов можно изобразить практически любую букву или символ. И чем проще эти элементы, тем проще, как правило, и сам знак. Поэтому в качестве простых графических элементов я выбрал точку и отрезок, а в качестве элементарной ячейки для записи одного знака - квадрат со стороной равной 1, помещенный в прямоугольную систему координат XY (рис.1). При этом точки и отрезки в этой системе имеют определенные координаты. Этот квадрат я назвал «информационным квадратом» (information square - InS), а совокупность графических элементов, записанных в InS - «информационно-графической системой» (ИГС).
Количество графических элементов в ИГС определяется числом фиксированных параметров (Р) в системе XY. В общем случае их число представляет собой натуральный ряд чисел, включая нуль (Р = n, где n больше или равно 0) и, в зависимости от выбранного в каж-
дом конкретном случае n, такая ИГС будет называться ИГСО, ИГС1, ИГС2 и т.д. (см.рис.1). Из рисунка 1 видно, что ИГСО это InS. В ИГС1 можно изобразить только один графический элемент (точку, с координатами 0;0 или 1;1 или 0,5;0,5 и т.д. ).
Первой ИГС, имеющей значение для записи или кодирования текстовой информации, является ИГС2, которая содержит 10 простых графических элементов: 4 точки и 6 отрезков. ИГС2 теоретически дает 1024 графических элемента (2 в 10-й степени), которые образуются с помощью комбинации простых. Этого вполне достаточно, чтобы записать практически любой алфавит, а также все символы и знаки, необходимые для чтения и письма (цифры, знаки пунктуации, арифметических действий и т.д.).
Конечно, если по каким-то причинам количества графических элементов в системе двух параметров 0 и 1 окажется недостаточно, можно перейти в систему трех фиксированных параметров - ИГСЗ, четырех -ИГС4, пяти - ИГС5 и так далее.
ИГС0(InS) ИГС1 ИГС2 ИГС3 ИГС4 ИГС5
Рисунок 1. Информационно-графические системы
Однако можно остаться в системе двух фиксированных параметров (0 и 1) и при этом значительно увеличить количество графических элементов за счет перехода в третье измерение (ХУZ). То есть в качестве
элементарной ячейки для записи информации будет выступать куб с ребром равным 1 (рис. 2), который по аналогии с информационным квадратом я назвал «ин - формационным кубом» (information cube - InС). При Арабские Л. Брайль этом запись информации про- цифры изводится на гранях куба и внутри него, совокупность же графических элементов те- перь представляет собой объемную информационно- графическую систему, образо- ванную по двум фиксирован- ным параметрам - ОИГС2 (рис. 3). Эта графическая сис- тема состоит из 8 точек и 28 отрезков. На рисунке изобра- жено 7 точек и 15 отрезков, ос- тальные не видны. Количество графических элементов, тео- ретически возможное в этой
№1 '2006 Интеллектуальная собственность в Беларуси
системе, составляет 68 719 476 736 (2 в 36-й степени). Конечно, и здесь можно не ограничиваться только двумя параметрами.
Таким образом, обобщая, можно дать следующее определение:
Универсальная информационно-графическая система (УнИГраС - UnIGraS) - это совокупность графических элементов, состоящих из точки (точек) и (или) отрезка (отрезков), используемых для записи или кодирования текстовой информации, и количество которых определяется числом фиксированных параметров, выбранных в прямоугольной системе координат на плоскости или в объеме.
Из изложенного видно, что информационная емкость описанных графических систем зависит только от количества используемых параметров, что свидетельствует об их универсальности и возможности использовать их как для записи, так и кодирования практически любой текстовой информации.
ИГС2 (рис. 1) - самая простая из информационно-графических систем, которую можно использовать для записи и кодирования текстовой информации. Точки расположены на вершинах InS. Их комбинации дают 15 разных графических элементов, плюс 1 пустой InS. Эти элементы в системе записи
текстовой информации являются вспомогательными, которые располагаются по сторонам InS или являются его диагоналями, - основными. Если наложить вспомогательные графические элементы (точки) на основные (отрезки), то получатся производные графические элементы.
Вспомогательные графические элементы можно использовать для записи знаков пунктуации (точка, запятая, тире, восклицательный и вопросительный знаки, точка с запятой, двоеточие) и знаков арифметических действий (сложение, вычитание, умножение, деление, извлечение корня, возведение в степень). Пустой InS - в качестве пробела (отделение слов друг от друга).
Для записи алфавитов, таких как английский (26 букв), русский (33 буквы), белорусский (34 буквы), эсперанто (28 букв), а также арабских цифр, применялись основные (отрезки) и производные (отрезки и точки) графические элементы. Таким образом, алфавиты получились линейно-точечными. Все алфавиты, записанных в ИГС2, графически оказались очень
УнИГраС Арабские Л. Брайль УнИГраС
ИГС2 ИГС3 цифры ИГС2 ИГС3
Рисунок 4. Арабские цифры в различных системах записи.
простыми: самые сложные из букв изображаются двумя точками и одним отрезком, то есть тремя простыми графическими элементами. Кроме того, был применен следующий известный принцип: буквы, имеющие одинаковое написание или близкое произношение, отображать одним графическим знаком. Неожиданно для меня, алфавиты, записанные в
Русский язык и арабские цифры
|
|
ИГС2
|
ИГСЗ
|
Л.Брайль
|
Рисунок 5. Образцы текста в различных формах записи записи.
ИГС2, получились настолько простые, что их рельефные варианты вполне могли быть использованы в качестве шрифта для слепых и слабовидящих людей. Причем этот шрифт оказался более компактным, а в некоторых случаях проще традиционного рельефно-точечного шрифта Л. Брайля.
В качестве примера приведу запись арабских цифр в УнИГраС (рис. 4) и образец текста (рис. 5). Для сравнения я расположил рядом традиционную запись цифр и запись цифр шрифтом Л.Брайля. Как видно из рисунка, для изображения арабских цифр с помощью ИГС2 достаточно всего двух простых графических элементов: точки и отрезка. Причем зрительно цифры отличаются от букв, так как для их записи выбраны диагонали квадрата. Кроме того, четные цифры отличаются от нечетных.
Интересно, что линейно-точечный шрифт легко трансформируется в точечный, если заменить отрезки на точки, которые располагаются на середине этих отрезков. Координаты этих точек приобретают новый параметр - 0,5. Следовательно ИГС2 переходит в ИГСЗ (рис. 1). Количество точек в этой системе - 9, поэтому количество графических элементов, теоретически возможное в этой системе, составляет - 512 (2 в 9 степени), что в 8 раз больше чем в системе Л. Брайля. Этого вполне достаточно для кодирования текстовой информации на английском, русском и дру гих языках, кроме того, можно обойтись без применения кодов-переключателей, что упрощает чтение и
уменьшает объем печати. К сожалению, запись арабских цифр нельзя изменить простой заменой отрезков на точки при переходе в ИГСЗ. Для этого нужно применить другой принцип: использовать точку с координатами (0,5; 0,5), то есть точку, расположенную в центре InS . Наличие этой точки является отличительным признаком цифр, кроме того четные и нечетные цифры, как и в случае ИГС2, отличаются друг от друга. Количество простых графических элементов, которые используются для записи букв, и в ИГС2 и в ИГСЗ остается одинаковым (самая сложная в написании буква содержит только 3 точки). Для цифр в ИГСЗ используется на два графических элемента больше. Запись знаков пунктуации и арифметических действий для этих двух систем аналогична. Положительным также является и то, что человек освоивший алфавит, записанный в ИГС2, легко прочитает и текст, записанный в ИГСЗ.
На рисунке 6 представлены минимальные размеры ячеек для записи одного символа в различных формах записи при условии, что расстояние между точками должно быть 2,5 мм в натуральную величину. Как видно из рисунка, наиболее компактна запись в ИГС2. Площадь, занимаемая одним символом в этой системе, в 2 раза меньше, чем ячейки Л. Брайля. Площадь одной ячейки в ИГСЗ больше, чем у Л. Брайля, однако, как уже было отмечено, и здесь есть свои преимущества. Кроме того, эту запись можно использовать как вспомогательную в процессе обучения и для письма.
Рисунок 6. Минимальный размер ячейки для записи одного символа: 1 - ИГСЗ; 2 - Брайль; 3 - ИГС2.
В заключение следует отметить, что эта короткая статья далеко не исчерпывает возможности Универсальной Информационно-Графической Системы
Литература:
-
Минин П. Прикосновение гения. Пчела №19, 1999 г, www.pchela.ru.
-
Ревич Ю. Полный СНАRSЕТ, 2002 г., http://www.russ.ru
-
Стивен Дж.Сирл. Краткая история систем кодирования символов естественных языков в США, Европе и Восточ но-азиатских странах. 2001 г., http://consumer.stormwav.ru/charhist.htm
-
Платова М. Лингвопроектирование. Докторская диссертация, 2003 г., http://gallardo.narod.ru/tolkien/diss/vvedenie.html
-
Котусов В.В. Всемирный язык - новая форма записи и кодирования текстовой информации. М.:«УНИВЕРСУМ», №4, 28 - 33, 2005 г.
-
СФЕРА. Всероссийское общество слепых. Азбука Брайля. httр:// www.sfe.ru.