что такое символы кириллицы кодовое слово
Как работают кодировки текста. Откуда появляются «кракозябры». Принципы кодирования. Обобщение и детальный разбор
Данная статья имеет цель собрать воедино и разобрать принципы и механизм работы кодировок текста, подробно этот механизм разобрать и объяснить. Полезна она будет тем, кто только примерно представляет, что такое кодировки текста и как они работают, чем отличаются друг от друга, почему иногда появляются не читаемые символы, какой принцип кодирования имеют разные кодировки.
Чтобы получить детальное понимание этого вопроса придется прочитать и свести воедино не одну статью и потратить довольно значительное время на это. В данном материале же это все собрано воедино и по идее должно сэкономить время и разбор на мой взгляд получился довольно подробный.
О чем будет под катом: принцип работы одно байтовых кодировок (ASCII, Windows-1251 и т.д.), предпосылки появления Unicode, что такое Unicode, Unicode-кодировки UTF-8, UTF-16, их отличия, принципиальные особенности, совместимость и несовместимость разных кодировок, принципы кодирования символов, практический разбор кодирования и декодирования.
Вопрос с кодировками сейчас конечно уже потерял актуальность, но все же знать как они работают сейчас и как работали раньше и при этом не потратить много времени на это думаю лишним не будет.
Предпосылки Unicode
Начать думаю стоит с того времени когда компьютеризация еще не была так сильно развита и только набирала обороты. Тогда разработчики и стандартизаторы еще не думали, что компьютеры и интернет наберут такую огромную популярность и распространенность. Собственно тогда то и возникла потребность в кодировке текста. В каком то же виде нужно было хранить буквы в компьютере, а он (компьютер) только единицы и нули понимает. Так была разработана одно-байтовая кодировка ASCII (скорее всего она не первая кодировка, но она наиболее распространенная и показательная, по этому ее будем считать за эталонную). Что она из себя представляет? Каждый символ в этой кодировке закодирован 8-ю битами. Несложно посчитать что исходя из этого кодировка может содержать 256 символов (восемь бит, нулей или единиц 2 8 =256).
Первые 7 бит (128 символов 2 7 =128) в этой кодировке были отданы под символы латинского алфавита, управляющие символы (такие как переносы строк, табуляция и т.д.) и грамматические символы. Остальные отводились под национальные языки. То есть получилось что первые 128 символов всегда одинаковые, а если хочешь закодировать свой родной язык пожалуйста, используй оставшуюся емкость. Собственно так и появился огромный зоопарк национальных кодировок. И теперь сами можете представить, вот например я находясь в России беру и создаю текстовый документ, у меня по умолчанию он создается в кодировке Windows-1251 (русская кодировка использующаяся в ОС Windows) и отсылаю его кому то, например в США. Даже то что мой собеседник знает русский язык, ему не поможет, потому что открыв мой документ на своем компьютере (в редакторе с дефолтной кодировкой той же самой ASCII) он увидит не русские буквы, а кракозябры. Если быть точнее, то те места в документе которые я напишу на английском отобразятся без проблем, потому что первые 128 символов кодировок Windows-1251 и ASCII одинаковые, но вот там где я написал русский текст, если он в своем редакторе не укажет правильную кодировку будут в виде кракозябр.
Думаю проблема с национальными кодировками понятна. Собственно этих национальных кодировок стало очень много, а интернет стал очень широким, и в нем каждый хотел писать на своем языке и не хотел чтобы его язык выглядел как кракозябры. Было два выхода, указывать для каждой страницы кодировки, либо создать одну общую для всех символов в мире таблицу символов. Победил второй вариант, так создали Unicode таблицу символов.
Небольшой практикум ASCII
Возможно покажется элементарщиной, но раз уж решил объяснять все и подробно, то это надо.
Вот таблица символов ASCII:
Тут имеем 3 колонки:
Unicode
С предпосылками создания общей таблицы для всех в мире символов, разобрались. Теперь собственно, к самой таблице. Unicode — именно эта таблица и есть (это не кодировка, а именно таблица символов). Она состоит из 1 114 112 позиций. Большинство этих позиций пока не заполнены символами, так что вряд ли понадобится это пространство расширять.
Разделено это общее пространство на 17 блоков, по 65 536 символов в каждом. Каждый блок содержит свою группу символов. Нулевой блок — базовый, там собраны наиболее употребляемые символы всех современных алфавитов. Во втором блоке находятся символы вымерших языков. Есть два блока отведенные под частное использование. Большинство блоков пока не заполнены.
Итого емкость символов юникода составляет от 0 до 10FFFF (в шестнадцатиричном виде).
Записываются символы в шестнадцатиричном виде с приставкой «U+». Например первый базовый блок включает в себя символы от U+0000 до U+FFFF (от 0 до 65 535), а последний семнадцатый блок от U+100000 до U+10FFFF (от 1 048 576 до 1 114 111).
Отлично теперь вместо зоопарка национальных кодировок, у нас есть всеобъемлющая таблица, в которой зашифрованы все символы которые нам могут пригодиться. Но тут тоже есть свои недостатки. Если раньше каждый символ был закодирован одним байтом, то теперь он может быть закодирован разным количеством байтов. Например для кодирования всех символов английского алфавита по прежнему достаточно одного байта например тот же символ «o» (англ.) имеет в юникоде номер U+006F, то есть тот же самый номер как и в ASCII — 6F в шестнадцатиричной и 111 в десятеричной. А вот для кодирования символа «U+103D5» (это древнеперсидская цифра сто) — 103D5 в шестнадцатиричной и 66 517 в десятеричной, тут нам потребуется уже три байта.
Решить эту проблему уже должны юникод-кодировки, такие как UTF-8 и UTF-16. Далее речь пойдет про них.
UTF-8 является юникод-кодировкой переменной длинны, с помощью которой можно представить любой символ юникода.
Давайте поподробнее про переменную длину, что это значит? Первым делом надо сказать, что структурной (атомарной) единицей этой кодировки является байт. То что кодировка переменной длинны, значит, что один символ может быть закодирован разным количеством структурных единиц кодировки, то есть разным количеством байтов. Так например латиница кодируется одним байтом, а кириллица двумя байтами.
Немного отступлю от темы, надо написать про совместимость ASCII и UTF
То что латинские символы и основные управляющие конструкции, такие как переносы строк, табуляции и т.д. закодированы одним байтом делает utf-кодировки совместимыми с кодировками ASCII. То есть фактически латиница и управляющие конструкции находятся на тех же самых местах как в ASCII, так и в UTF, и то что закодированы они и там и там одним байтом и обеспечивает эту совместимость.
Сравним на практике как будет выглядеть фраза «Hello мир» в трех разных кодировках: Windows-1251 (русская кодировка), ISO-8859-1 (кодировка западно-европейских языков), UTF-8 (юникод-кодировка). Суть данного примера состоит в том что фраза написана на двух языках. Посмотрим как она будет выглядеть в разных кодировках.
В кодировке ISO-8859-1 нет таких символов «м», «и» и «р».
Теперь давайте поработаем с кодировками и разберемся как преобразовать строку из одной кодировки в другую и что будет если преобразование неправильное, или его нельзя осуществить из за разницы в кодировках.
Будем считать что изначально фраза была записана в кодировке Windows-1251. Исходя из таблицы выше запишем эту фразу в двоичном виде, в кодировке Windows-1251. Для этого нам потребуется всего только перевести из десятеричной или шестнадцатиричной системы (из таблицы выше) символы в двоичную.
01001000 01100101 01101100 01101100 01101111 00100000 11101100 11101000 11110000
Отлично, вот это и есть фраза «Hello мир» в кодировке Windows-1251.
Теперь представим что вы имеете файл с текстом, но не знаете в какой кодировке этот текст. Вы предполагаете что он в кодировке ISO-8859-1 и открываете его в своем редакторе в этой кодировке. Как сказано выше с частью символов все в порядке, они есть в этой кодировке, и даже находятся на тех же местах, но вот с символами из слова «мир» все сложнее. Этих символов в этой кодировке нет, а на их местах в кодировке ISO-8859-1 находятся совершенно другие символы. А конкретно «м» — позиция 236, «и» — 232. «р» — 240. И на этих позициях в кодировке ISO-8859-1 находятся следующие символы позиция 236 — символ «ì», 232 — «è», 240 — «ð»
Значит фраза «Hello мир» закодированная в Windows-1251 и открытая в кодировке ISO-8859-1 будет выглядеть так: «Hello ìèð». Вот и получается что эти две кодировки совместимы лишь частично, и корректно перекодировать строку из одной кодировке в другую не получится, потому что там просто напросто нет таких символов.
Тут и будут необходимы юникод-кодировки, а конкретно в данном случае рассмотрим UTF-8. То что символы в ней могут быть закодированы разным количеством байтов от 1 до 4 мы уже выяснили. Теперь стоит сказать что с помощью UTF могут быть закодированы не только 256 символов, как в двух предыдущих, а вобще все символы юникода
Работает она следующим образом. Первый бит каждого байта кодирующего символ отвечает не за сам символ, а за определение байта. То есть например если ведущий (первый) бит нулевой, то это значит что для кодирования символа используется всего один байт. Что и обеспечивает совместимость с ASCII. Если внимательно посмотрите на таблицу символов ASCII то увидите что первые 128 символов (английский алфавит, управляющие символы и знаки препинания) если их привести к двоичному виду, все начинаются с нулевого бита (будьте внимательны, если будете переводить символы в двоичную систему с помощью например онлайн конвертера, то первый нулевой ведущий бит может быть отброшен, что может сбить с толку).
Если первый бит не нулевой то символ кодируется несколькими байтами.
Для двухбайтовых символов первые три бита должны быть такие — 110
для трех-байтовых символов в первом байте ведущие биты — 1110
1110 1000 10 000111 10 1010101 — суммируем все кроме управляющих битов и получаем что в 16-ричной равно 103В5, U+103D5 — древнеперситдская цифра сто ( 10000001111010101 )
для четырех-байтовых символов в первом байте ведущие биты — 11110
11110 100 10 001111 10 111111 10 111111 — U+10FFFF это последний допустимый символ в таблице юникода ( 100001111111111111111 )
Теперь, при желании, можем записать нашу фразу в кодировке UTF-8.
UTF-16
UTF-16 также является кодировкой переменной длинны. Главное ее отличие от UTF-8 состоит в том что структурной единицей в ней является не один а два байта. То есть в кодировке UTF-16 любой символ юникода может быть закодирован либо двумя, либо четырьмя байтами. Давайте для понятности в дальнейшем пару таких байтов я буду называть кодовой парой. Исходя из этого любой символ юникода в кодировке UTF-16 может быть закодирован либо одной кодовой парой, либо двумя.
Начнем с символов которые кодируются одной кодовой парой. Легко посчитать что таких символов может быть 65 535 (2в16), что полностью совпадает с базовым блоком юникода. Все символы находящиеся в этом блоке юникода в кодировке UTF-16 будут закодированы одной кодовой парой (двумя байтами), тут все просто.
символ «o» (латиница) — 00000000 01101111
символ «M» (кириллица) — 00000100 00011100
Теперь рассмотрим символы за пределами базового юникод диапазона. Для их кодирования потребуется уже две кодовые пары (4 байта). И механизм их кодирования немного сложнее, давайте по порядку.
Для начала введем понятия суррогатной пары. Суррогатная пара — это две кодовые пары используемые для кодирования одного символа (итого 4 байта). Для таких суррогатных пар в таблице юникода отведен специальный диапазон от D800 до DFFF. Это значит, что при преобразовании кодовой пары из байтового вида в шестнадцатиричный вы получаете число из этого диапазона, то перед вами не самостоятельный символ, а суррогатная пара.
Чтобы закодировать символ из диапазона 10000 — 10FFFF (то есть символ для которого нужно использовать более одной кодовой пары) нужно:
Для примера зашифруем символ, а потом расшифруем. Возьмем древнеперсидскую цифру сто (U+103D5):
Что такое кириллические символы в пароле
В статье рассказывается о том, что такое кириллица в пароле, почему использовать ее нельзя, и из-за чего возникает ошибка с таким содержанием.
Пароль
В наш век цифровых технологий сложно найти человека, который бы не пользовался различными электронными устройствами и гаджетами. И в каждом из них порой возникает необходимость защиты информации от доступа посторонних, и самое удачное решение – это обычный пароль. Также нужен он и для авторизации в программах и интернет-сервисах. И если с именем все понятно, то как понять, что именно его владелец пытается войти в тот же «ВКонтакте»? В этом случае на помощь приходит пароль. Но часто система его не принимает, ругаясь на наличие русских букв. Так что такое кириллица в пароле, и почему ее использование ошибочно?
«Неправильный пароль»
Подобное системное сообщение возникает в случае его ошибочности. К примеру, пользователь случайно ввел не тот символ и не обратил на это внимания. Но порой, казалось бы, все верно, многократно проверено, но войти под своей учетной записью все не выходит. Одна из возможных причин ошибки – это то, что человек забыл сменить раскладку клавиатуры или же использовал в нем кириллический символ. Обычно для удобства пользователей сайт или приложение может об этом предупредить, выдав подсказку, что в кодовой фразе есть буква русского алфавита. Но подобная функциональность встречается не во всех сервисах. Так что мы разобрались с тем, что такое кириллица в пароле.
Для исправления такой ошибки нужно просто быть внимательнее, – проверить, на каком языке вводится информация, и не включена ли клавиша Caps Lock. Ведь к примеру, Planeta и PlAnEtA – совершенно разные пароли, и об этом стоит помнить. Но почему использование наших «родных» букв запрещено?
Универсальность
Разбирая вопрос, что такое кириллица в пароле, нужно упомянуть общее положение дел в компьютерном мире. Все дело в том, что они и Интернет распространены по всем странам, как и их различные сервисы. И большое количество программного обеспечения, названий, документации и прочего переводится на язык нужного региона, но так бывает не всегда и не со всеми. Ведь одно дело – интерфейс программы или сайта, а другое – техническая информация, внутренние файлы настроек и то, что обычному пользователю вовсе не понадобится. Все это составляется на английском языке. Как и с реальной жизнью, в компьютерном мире он тоже является универсальным и международным.
Именно потому в пароле нельзя использовать кириллицу, как и арабские символы с китайскими иероглифами.
В России имеется свой алфавит и свои особенности написания. Они выражаются в так называемой кириллице, которую используют как для письма в любых видах, так и для регистрации в доменной зоне Российской Федерации.
Современная версия кириллицы представляет собой усовершенствованный вариант алфавита от Кирилла и Мефодия. Именно она и станет предметом изучения статьи.
Немного предыстории
Начало кириллического правописания восходит к IX веку. Инициатором ее создания выступил византийский император Михаил Третий, желавший донести религиозные тексты до верующих. Разработка этой темы была поручена Кириллу и Мефодию.
Теперь немного интересных фактов из истории кириллицы:
Вместе с развитием языка начинается распространение таких книг, как Библия, Евангелие, иные церковнославянские издания. Однако в своем первоначальном виде кириллица не сохранилась. Она претерпела изменения вместе с развитием страны.
Современный алфавит
В своем нынешнем виде кириллический алфавит имеет всего 33 буквы. Современный русский язык стал таковым в результате масштабной орфографической реформы, проведенной в 1917—1918 годах. Целью данных преобразований было упрощение алфавита и более широкий доступ к соответствующей письменности простых граждан. Именно современная версия кириллической азбуки стала основой для ряда неславянских языков на территории бывшего СССР и Монголии. Самым распространенным является гражданский шрифт, которым пользуются большинство граждан России, Украины, Беларуси, Болгарии и многих других.
Кириллица в кодировке
В настоящее время получило распространение использование кириллицы при регистрации сайтов, доменов, различных операторов в Интернете. Некоторые люди задаются вопросом: что такое кириллица в пароле? Это означает, что она записана в вордовском документе или зарегистрирована с помощью определенной кодировки.
На сегодняшний день имеются следующие виды кодировки, применяемые на компьютере:
Каждая из кодировок имеет место в качестве используемой в том или ином документе. Вы можете настроить в документе в соответствующем разделе собственную кодировку. Однако наиболее популярно написание русских символов, настраиваемое через юникод, потому что данная программа установлена на большинстве компьютеров.
Юникодовская кириллица
Последняя, 9 версия программы Юникод установила для данной письменности 5 блоков. Помимо основного кода под названием Cirillic, имеются дополнения в виде Supplement, Extended-A, B, C. Последние 3 варианта кодировки представляют собой расширенную версию кириллицы.
В стандартной кодировке имеются обычные буквы, исторические, дополнительные символы для славянских языков. В расширенных версиях также добавляются такие элементы, как надстрочные буквы, предназначенные для церковнославянского языка, исторические начертания современных букв и некоторые другие старинные буквы.
При этом следует отметить, что юникод не имеет в своем арсенале ударений. Если это необходимо использовать при написании тех или иных документов, то следует делать их составными. Для этого добавляют так называемый U+0301, он же combining acute accent. Его ставят после гласной ударной буквы, это такие, как е, ы, ю, я и некоторые другие гласные, в которых надо поставить ударение.
Достаточно длительное время для юникода было проблемным составлять церковнославянскую письменность, но после версии 5.1 данная проблема практически исчезла и нужные символы были добавлены в качестве используемых.
История данной письменности достаточно интересная и познавательная. Претерпев значительные изменения, она обрела свой нынешний вид и активно используется как в обычном письме, так и в компьютерных программах. Последние предлагают немало вариантов кодировки, каждый из которых подойдет под определенные задачи. Несмотря на относительную простоту, кириллица имеет значительную популярность и применяется даже в неславянских языках в качестве базы для дальнейшего развития.
При этом предпринимаются попытки отказа от кириллической письменности в пользу латиницы, что произвели немало стран бывшего советского пространства. Однако кириллическая письменность продолжает существовать и развиваться. Удачного изучения кириллицы и русского алфавита, в них можно найти много познавательных вещей!
Видео
Из этого видео вы узнаете, что же такое кириллица.
Для ввода имени пользователя и пароля разрешается применять следующие символы. Имя пользователя и пароль следует вводить с учетом регистра.
Заглавные латинские буквы: от A до Z (26 символов)
Строчные латинские буквы: от a до z (26 символов)
Цифры от 0 до 9 (10 символов)
Имя пользователя для входа в систему
Пробелы, двоеточия и кавычки не допускаются.
Оно не может состоять только из цифр, и поле нельзя оставлять незаполненным.
Длина ограничивается 32 символами.
Пароль для входа в систему
Максимально допустимая длина пароля для администраторов и супервайзера составляет 32 символа, тогда как для пользователей длина ограничивается 128 символами.
В отношении типов символов, которые могут использоваться для задания пароля, никаких ограничений не установлено. В целях безопасности рекомендуется создавать пароли, содержащие буквы верхнего и нижнего регистров, цифры и другие символы. Чем большее число символов используется в пароле, тем более трудной является задача его подбора для посторонних лиц.
В подразделе [Политика паролей] раздела [Расширенная безопасность] вы можете установить требование в отношении обязательного включения в пароль букв верхнего и нижнего регистров, цифр и других символов, а также минимально необходимое количество символов в пароле. Для получения сведений об определении политики паролей см. Настройка функций расширенной безопасности.
Символ кириллицы как написать
Русскоязычную раскладку клавиатуры во всем мире называют кириллицей. Она популярна среди носителей языка и узнаваема даже теми, кто никогда не занимался изучением языков славянской группы. Разберемся, какие буквы называются кириллицей, а какие латиницей.
Раскладка клавиатуры по-русски
Первая клавиатура создавалась с латинскими символами. Но распространяясь, она обзавелась дополнительными символами других языков, от которых слабо отличалась (например, немецкий). А для других языков и вовсе поменяла свой внешний вид. Яркий тому пример кириллица.
Почему русская раскладка называется кириллицей
Как ни странно, символы на «русской» клавиатуре не являются самой кириллицей, а лишь созданы на основе ее. Кириллица — это старославянская письменность, которая в настоящее время в повседневном письме не используется. Так как кириллица была некогда создана апостолами Кириллом и Мефодием, она стала, по сути, первой письменностью на Руси. В честь нее решили назвать и русскоязычную раскладку на клавиатуре.
Как расположен русский алфавит на клавиатуре
Буквы кириллической раскладки, созданной уже после опытов с Qwerty, расположены не в алфавитном порядке, а в зависимости от частоты их использования. Так как российская раскладка создавалась несколько позднее латинской, то были учтены ошибки последнего опыта.
ВАЖНО! Российская раскладка является более эргономичной и удобной как для простой печати, так и для набора вслепую.
Буквы в ней расположены по следующему принципу:
СПРАВКА! Основным недостатком кириллической раскладки является расположение запятой, которой не досталось отдельной клавиши.
Чтобы ее поставить в тексте, необходимо использовать сразу две клавиши. Некоторые считают, что именно это послужило причиной частого опускания запятых при быстрой электронной переписке.
Переход с кириллицы на латиницу и обратно
В адаптированных компьютерах и ноутбуках перейти на кириллицу не составит труда. Однако если установленная у вас система не предполагает сразу быстрого доступа к русской раскладке, то необходимо будет произвести дополнительные настройки.
СПРАВКА! Аналогично можно будет подключить и любые другие раскладки, что наиболее актуально для тех, кто изучает несколько иностранных языков.
Второй язык клавиатуры — латиница
Латиница часто выступает в роли основной раскладки, так как без ее использования буквально не обойтись. Мало того, что все общение в интернете (URL-адреса сайтов, e-mail) прописываются латиницей, так и операции в той же командной строке набираются именно латинскими буквами.
Если у вас нет в настройках быстрого доступа к кириллице, то придется произвести несколько действий по ее добавлению. Для этого достаточно следовать простому алгоритму.
Справка: в этой же вкладке при необходимости можно изменить язык интерфейса Windows.
Как перейти с кириллицы на латиницу и вернуться назад
При печати часто требуется смена раскладки, будь то сообщения на иностранных языках, адреса сайтов и электронных почт, а также некоторые специальные символы, которые недоступны на кириллической раскладке (например, квадратные скобки).
Сочетание клавиш
Если бы переключение раскладки производилось каждый раз вручную через настройки, то это значительно бы замедлило скорость печати. Поэтому выделили несколько сочетаний клавиш, которые для переключения необходимо нажимать одновременно:
Справка: если вы подключили несколько раскладок, то они будут переключаться по очереди. Поэтому возможно, придется нажать на клавиши несколько раз.
Панель быстрого доступа
Чуть менее быстрый способ изменения раскладки через панель быстрого доступа. Однако он более удобен, если у вас подключено более трех раскладок. Справа в нижней панели есть значок раскладки, представляющий собой 2–3 буквы от названия алфавита (EN — латиница, РУС — кириллица). При нажатии на него левой кнопкой мыши будут отображены все подключенные раскладки. Из них еще одним щелчком вы можете выбрать необходимую.
В старославянской и древнерусской письменности числа передавались с помощью букв. Эта система пришла на Русь вместе со славянскими азбуками (а ее истоки лежат в греческом письме). Числовые значения можно было передавать символами и кириллицы, и глаголицы, но сегодня речь пойдет о кириллице.
Как уже говорилось в одной из прошлых статей, большинство кириллических букв были заимствованы из византийского устава — торжественного письма. Создатели славянской азбуки переняли из греческого алфавита и числовые значения данных символов. А те знаки кириллицы, которые отсутствовали в греческом письме, числового значения не получили. Исключениями стали три буквы:
Но если буквы употреблялись для передачи и звуков, и чисел, то как же удавалось избежать путаницы на письме? Как читатели понимали, когда букву надо воспринимать как число?
Числа меньше 10 000
Если какой-либо символ кириллицы употреблялся для обозначения числа, то он записывался определенным образом. А именно: над буквой ставилось титло, а по обеим сторонам буквы на середине ее высоты – точки. Например, число 4 записывали как ·д҃·, а 600 – как ·х҃·. Ниже приведена сводная таблица числовых значений.
Числовые значения букв кириллицы
Буква | Число | Буква | Число | Буква | Число |
·а҃· (аз) | 1 | ·ɪ҃· (и десят.) | 10 | ·р҃· (рцы) | 100 |
·в҃· (веди) | 2 | ·к҃· (како) | 20 | ·с҃· (слово) | 200 |
·г҃· (глаголь) | 3 | ·л҃· (люди) | 30 | ·т҃· (твердо) | 300 |
·д҃· (добро) | 4 | ·м҃· (мыслете) | 40 | ·ѵ҃· (ижица) ·о҃у· (ук) | 400 |
·є҃· (есть) | 5 | ·ɴ҃· (наш) | 50 | ·ф҃· (ферт) | 500 |
·s҃· (зело) | 6 | ·ѯ҃· (кси) | 60 | ·х҃· (хер) | 600 |
·з҃· (земля) | 7 | ·о҃· (он) | 70 | ·ѱ҃· (пси) | 700 |
·н҃· (и восьм.) | 8 | ·п҃· (покой) | 80 | ·ѡ҃· (от) | 800 |
·ѳ҃· (фита) | 9 | ·ч҃· (червь) | 90 | ·ц҃· (цы) ·ѧ҃· (юс мал.) | 900 |
Числа больше десяти обозначались сочетаниями букв, записывающимися так же между точками и под титлом. Например: ·п҃в· — 82, ·сл҃ѳ· — 239. При записи чисел второго десятка (от 11 до 19) на первое место ставили букву, обозначающую единицы, а на второе — обозначение одного десятка в виде «и десятеричного»:
·а҃ɪ· — 11, ·з҃ɪ· — 17 и т. д.
Запись чисел третьего и последующих десятков производилась в обратном порядке: там на первом месте стояли десятки, на втором — единицы. Например:
Такой же порядок десятков и единиц наблюдается и в языке: семнадцать (буквально ‘семь на десяти’; сначала указаны единицы, затем — десяток), но сорок три (сначала названы десятки, затем — единицы).
Тысячи обозначались теми же буквами, что и единицы, только перед буквой слева внизу ставился особый знак ҂. Например, запись ·҂д҃· означала 4000 (четыре тысячи), а ·҂sф҃ла· — 6531 (шесть тысяч пятьсот тридцать один).
Числа от 10 000
Они передавались на письме с помощью особых обрамлений для букв. Эти обрамления не были заимствованы из греческого письма, они разрабатывались в основном на древнерусской почве. Данная система была не совсем устоявшейся, допускала варианты и разночтения, поскольку находилась тогда в процессе развития и использовалась относительно редко: подавляющему большинству людей такие огромные числа не требовались в практической деятельности.
Для расчетов или определений количества чего-либо обычно использовался так называемый «малый счет», с числами не очень больших разрядов. Например, число, называемое тьма, в «малом счете» составляло 10 000. Но позже, для работы с математическими значениями более миллиона, был создан «великий счет». В нем использовались числа на многие порядки больше, нежели в «малом счете», хотя названия у них оставались те же. Скажем, упомянутая выше тьма в «великом счете» составляла уже не десять тысяч, а миллион.
Конечно, вся эта система не была изобретена сразу в одно время: уже в XII столетии на Руси пользовались знаками для десятков тысяч, но обозначения миллионов вошли в обиход лишь в XIV – начале XV века.
Ниже мы приводим таблицу с обозначениями больших чисел на примере буквы «аз», обозначающей 1: одна тысяча, один десяток или сотня тысяч, один миллион и т. д. Оговоримся, что в реальности одни и те же значения могли изображаться на письме по-разному; в нашу таблицу включены лишь некоторые часто встречающиеся варианты. Числовые значения системы «малого счета» даны без скобок, «великого счета» — в скобках.
Запись больших чисел с помощью кириллицы
Некоторые символы больших чисел включены в таблицу «Юникода», и их можно изобразить средствами текстового редактора Word или OpenOffice. Точнее говоря, это касается трех знаков:
҈ (U+0488) — для сотен тысяч (легионы в «малом счете»);
҉ (U+0489) — для миллионов (леодры в «малом счете»).
Несмотря на эти трудности, находились на Руси одаренные люди с математическим складом ума, которые могли производить сложные вычисления, успешно оперируя малыми и большими числами (видимо, с помощью специальных приспособлений наподобие абака). К числу таких людей древнерусской эпохи следует отнести Кирика Новгородца, жившего в XII столетии и ставшего автором «Учения о числах» («Учение, им же ведати человеку числа всех лет»).
Система записи чисел с помощью букв азбуки была упразднена в России в начале XVIII века, в период правления Петра I.
Истрин В. А. 1100 лет славянской азбуки. — М., 1988.
Хабургаев Г. А. Старославянский язык. — М., 1974.
Симонов Р. А. Математическая мысль Древней Руси. — М., 1977.
Успенский Л. В. По закону буквы. — М., 1973.
Депман И. Я. Из истории математики. — М., 1950.
На фото: часы с «кириллическим» циферблатом в Суздале.
Если в нерусскоязычную страницу требуется вставить русские буквы или же в русском тексте необходимы старославянские (кириллические) символы, например, буква » ѣ » («ять») (см. страницу «КИРИЛЛИЦА: азбука, буквенное счисление «), то я предложу Вам несколько решений:
1. Рисовать
банально рисуем буквы графикой:
преимущества: 1) гибкость – так можно написать любую букву любого алфавита; 2) универсальность – каждый читатель увидит букву именно в том виде, в каком Вы рассчитывали, со всеми загогулинами, диактрическими значками и т. п.
недостатки: вагон и маленькая тележка. Главное – текст перестает быть текстом, а становится картинкой, непригодной ни к анализу, ни к последующей обработке. Да и «тяжесть» графики – не последний аргумент («вес» приведенной здесь для примера фразы «иже херувимы» – около 1000 байт, та же фраза, написанная текстом в качестве примера внизу этой страницы «весит» 36 байт); по сравнению с «голым» текстом картинки загружаются невероятно медленно. И подумайте, как тяжело будет Вам создавать и редактировать документ. Простая опечатка выльется в сильнейшую головную боль.
2. Подменять
довольно неплохой результат дает замена недостающих символов другими: например, за букву «ять» сойдет перечеркнутый мягкий знак: Ь, «фиту» нам даст зачеркнутая «О» или цифра ноль: ; кси-пси-омегу-ижицу и т. п. можно «сотворить» из похожих греческих букв: ξ ψ ω υ (см. коды греческих букв для HTML); «и десятеричное» и та же «ижица» получаются из латиницы: i v; и т. д.
преимущества: текст остается легким и при этом читаемым
недостатки: все-таки ноль или греческая и-псилон – вещи чуждые в русских словах
3. Кодировать
Таблица символов кириллицы, современного русского алфавита и некоторых знаков:
буква/знак | название кир. | название рус. | код | ||
загл. | строчн. | загл. | строчн. | ||
буквы кириллицы и русского алфавита (вперемешку): | |||||
А | а | аз | а | А | а |
Б | б | буки | бэ | Б | б |
В | в | веди | вэ | В | в |
Г | г | глаголь | гэ | Г | г |
Д | д | добро | дэ | Д | д |
Є | є | есть | – | Є | є |
Е | е | – | е | Е | е |
Ё | ё | – | ё | Ё | ё |
Ж | ж | живете | же | Ж | ж |
Ѕ | ѕ | зело | – | Ѕ | ѕ |
З | з | земля | зэ | З | з |
І | і | и (десятеричное) | – | І | і |
И | и | иже | и | И | и |
Й | й | – | и краткое | Й | й |
К | к | како | ка | К | к |
Л | л | люди | эль | Л | л |
М | м | мыслете | эм | М | м |
Н | н | наш | эн | Н | н |
О | о | он | о | О | о |
П | п | покой | пэ | П | п |
Р | р | рцы | эр | Р | р |
С | с | слово | эс | С | с |
Т | т | твердо | тэ | Т | т |
Ѹ | ѹ | ук | – | Ѹ | ѹ |
У | у | – | у | У | у |
Ф | ф | ферт | эф | Ф | ф |
Х | х | хер | ха | Х | х |
Ѡ | ѡ | омега | – | Ѡ | ѡ |
Ц | ц | цы | це | Ц | ц |
Ч | ч | червь | че | Ч | ч |
Ш | ш | ша | ша | Ш | ш |
Щ | щ | ща | ща | Щ | щ |
Ъ | ъ | ер | твердый знак | Ъ | ъ |
Ы | ы | еры | ы | Ы | ы |
Ь | ь | ерь | мягкий знак | Ь | ь |
Ѣ | ѣ | ять | – | Ѣ | ѣ |
Э | э | – | э (оборотное) | Э | э |
Ю | ю | ю | ю | Ю | ю |
– | – | (й)я | – | – | – |
Ѥ | ѥ | (й)е | – | Ѥ | ѥ |
Ѧ | ѧ | юс малый | – | Ѧ | ѧ |
Я | я | – | я | Я | я |
Ѫ | ѫ | юс большой | – | Ѫ | ѫ |
Ѩ | ѩ | йотированный юс малый | – | Ѩ | ѩ |
Ѭ | ѭ | йотированный юс большой | – | Ѭ | ѭ |
Ѯ | ѯ | кси | – | Ѯ | ѯ |
Ѱ | ѱ | пси | – | Ѱ | ѱ |
Ѳ | ѳ | фита | – | Ѳ | ѳ |
Ѵ | ѵ | ижица | – | Ѳ | ѳ |
+ дополнительные полезные буквы: | |||||
Ї | ї | i с двумя точками (крапками), i-умляут | – | Ї | ї |
Ѿ | ѿ | от | – | Ѿ | ѿ |
Ѻ | ѻ | омега круглая | – | Ѻ | ѻ |
полезные знаки: | |||||
ˊ | оксия (прямое (острое) ударение) (?) | ˊ | |||
ˋ | вария (обратное (тупое) ударение) (?) | ˋ | |||
а̑ | камора (?) * | ̑ | |||
˘ | краткая (знак краткости) | ˘ | |||
д̾ | ерок (ерик) (?) * | ̾ | |||
¨ | две точки (умляут) | ¨ | |||
҃ | титло | ҃ | |||
¯ | надчеркивание | ¯ | |||
ˀ | придыхание (?) | ˀ | |||
а̉ | крюк (?) * | ̉ | |||
҄ | смягчение (?) | ҄ | |||
҂ | знак тысячи | ҂ |
* ) данные знаки не являются отдельными символами, не занимают место отдельной буквы в тексте, а «наскакивают» на букву, после которой стоят
Итак, как же использовать наши знания «секретных» кодов для создания web-страниц?