Главная Обратная связь

Дисциплины:

Архитектура (936)
Биология (6393)
География (744)
История (25)
Компьютеры (1497)
Кулинария (2184)
Культура (3938)
Литература (5778)
Математика (5918)
Медицина (9278)
Механика (2776)
Образование (13883)
Политика (26404)
Правоведение (321)
Психология (56518)
Религия (1833)
Социология (23400)
Спорт (2350)
Строительство (17942)
Технология (5741)
Транспорт (14634)
Физика (1043)
Философия (440)
Финансы (17336)
Химия (4931)
Экология (6055)
Экономика (9200)
Электроника (7621)






Кодирование числовых, текстовых и графических данных



Кодирование чисел

Вопрос о кодировании чисел возникает по той причине, что в машину нельзя либо нерационально вводить числа в том виде, в котором они изображаются человеком на бумаге. Во-первых, нужно кодировать знак числа. Во-вторых, по различным причинам, которые будут рассмотрены ниже, приходится иногда кодировать и остальную часть числа.

Кодирование целых чисел производиться через их представление в двоичной системе счисления: именно в этом виде они и помещаются в ячейке. Один бит отводиться при этом для представления знака числа (нулем кодируется знак "плюс", единицей - "минус").

Для кодирования действительных чисел существует специальный формат чисел с плавающей запятой. Число при этом представляется в виде: N = M * qp, где M - мантисса, p - порядок числа N, q - основание системы счисления. Если при этом мантисса M удовлетворяет условию 0,1 <= | M | <= 1 то число N называют нормализованным.

Кодирование текста

Для кодирования букв и других символов, используемых в печатных документах, необходимо закрепить за каждым символом числовой номер – код. В англоязычных странах используются 26 прописных и 26 строчных букв (A … Z, a … z), 9 знаков препинания (. , : ! " ; ? ( ) ), пробел, 10 цифр, 5 знаков арифметических действий (+,-,*, /, ^) и специальные символы (№, %, _, #, $, &, >, <, |, \) – всего чуть больше 100 символов. Таким образом, для кодирования этих символов можно ограничиться максимальным 7-разрядным двоичным числом (от 0 до 1111111, в десятичной системе счисления – от 0 до 127).

Кодирование графической информации

В видеопамяти находится двоичная информация об изображении, выводимом на экран. Почти все создаваемые, обрабатываемые или просматриваемые с помощью компьютера изображения можно разделить на две большие части – растровую и векторную графику.

Растровые изображения представляют собой однослойную сетку точек, называемых пикселами (pixel, от англ. picture element). Код пиксела содержит информации о его цвете.

В противоположность растровой графике векторное изображение многослойно. Каждый элемент векторного изображения – линия. Каждый элемент векторного изображения является объектом, который описывается с помощью математических уравнении. Сложные объекты (ломаные линии, различные геометрические фигуры) представляются в виде совокупности элементарных графических объектов.



 

 

Таблица кодировки. Код Ascii

В человеческом мире информация представляется последовательностями символов. Каждый символ имеет каноническое изображение, которое позволяет однозначно идентифицировать данный символ. Варианты начертания символов задают разные шрифты.

В вычислительных машинах для представления информации используются цепочки байтов. Поэтому для перевода информации из машинного представления в человеческий необходимы таблицы кодировки символов - таблицы соответствия между символами определенного языка и кодами символов. Их еще называют кодовыми страницами или применяют английский термин character set (который иногда сокращают до charset).

Самой известной таблицей кодировки является код ASCII (Американский стандартный код для обмена информацией). Первоначально он был разработан для передачи текстов по телеграфу, причем в то время он был 7-битовым, то есть для кодирования символов английского языка, служебных и управляющих символов использовались только 128 7-битовых комбинаций. При этом первые 32 комбинации (кода) служили для кодирования управляющих сигналов (начало текста, конец строки, перевод каретки, звонок, конец текста и т.д.). При разработке первых компьютеров фирмы IBM этот код был использован для представления символов в компьютере. Поскольку в исходном коде ASCII было всего 128 символов, для их кодирования хватило значений байта, у которых 8-ой бит равен 0. Значения байта с 8-ым битом, равным 1, стали использовать для представления символов псевдографики, математических знаков и некоторых символов из языков, отличных от английского (греческого, немецких умляутов, французских диакритических знаков и т.п.).

Когда стали приспосабливать компьютеры для других стран и языков, места для новых символов уже не стало хватать. Для того, чтобы полноценно поддерживать помимо английского и другие языки, фирма IBM ввела в употребление несколько кодовых таблиц, ориентированных на конкретные страны. Так для скандинавских стран была предложена таблица 865 (Nordic), для арабских стран - таблица 864 (Arabic), для Израиля - таблица 862 (Israel) и так далее. В этих таблицах часть кодов из второй половины кодовой таблицы использовалась для представления символов национальных а лфавитов (за счет исключения некоторых символов псевдографики).



С русским языком ситуация развивалась особым образом. Очевидно, что замену символов во второй половине кодовой таблицы можно произвести разными способами. Вот и появились для русского языка несколько разных таблиц кодировки символов кириллицы: KOI8-R, IBM-866, CP-1251, ISO-8551-5. Все они одинаково изображают символы первой половины таблицы (от 0 до 127) и различаются представлением символов русского алфавита и псевдографики.

Для таких же языков, как китайский или японский, вообще 256 символов недостаточно. Кроме того, всегда существует проблема вывода или сохранения в одном файле одновременно текстов на разных языках (например, при цитировании). Поэтому была разработана универсальная кодовая таблица UNICODE, содержащая символы, применяемые в языках всех народов мира, а также различные служебные и вспомогательные символы (знаки препинания, математические и технические символы, стрелки, диакритические знаки и т.д.). Очевидно, что одного байта недостаточно для кодирования такого большого множества символов. Поэтому в UNICODE используются 16-битовые (2-байтовые) коды, что позволяет представить 65 536 символов. К настоящему времени задействовано около 49 000 кодов (последнее значительное изменение - введение символа валюты EURO в сентябре 1998 г.).

Для совместимости с предыдущими кодировками первые 256 кодов совпадают со стандартом ASCII.

В стандарте UNICODE кроме определенного двоичного кода (эти коды принято обозначать буквой U, после которой следуют знак + и собственно код в шестнадцатиричном представлении) каждому символу присвоено определенное имя.

Еще одним компонентом стандарта UNICODE являются алгоритмы для взаимно-однозначного преобразования кодов UNICODE в последовательности байтов переменной длины. Необходимость таких алгоритмов обусловлена тем, что не все приложения умеют работать с UNICODE. Некоторые приложения понимают только 7-битовые ASCII-коды, другие приложения - 8-битовые ASCII-коды. Такие приложения используют для представления символов, не поместившихся, соответственно, в 128-символьный или 256-символьный набор, так называемые расширенные ASCII-коды, когда символы кодируются цепочками байтов переменной длины. Алгоритм UTF-7 служит для обратимого преобразования кодов UNICODE в расширенные 7-битовые ASCII-коды, а UTF-8 - для обратимого преобразования кодов UNICODE в расширенные 8-битовые ASCII-коды.

Отметим, что и ASCII и UNICODE и другие стандарты кодировки символов не определяют изображения символов, а только состав набора символов и способ его представления в компьютере. Кроме того (что, может быть, не сразу очевидно), очень важен порядок перечисления символов в наборе, так как он влияет самым существенным образом на алгоритмы сортировки. Именно таблицу соответствия символов из какого-то определенного набора (скажем, символов, применяемых для представления информации на английском языке, или на разных языках, как в случае с UNICODE) и обозначают термином таблица кодировки символов или charset. Каждая стандартная кодировка имеет имя, например, KOI8-R, ISO_8859-1, ASCII. К сожалению, стандарта на имена кодировок не существует.

 

11).ПОКОЛЕНИЕ ЭВМ Первое поколение ЭВМ (1948 — 1958 гг.)Элементной базой машин этого поколения были электронные лампы – диоды и триоды. Машины предназначались для решения сравнительно несложных научно-технических задач. К этому поколению ЭВМ можно отнести: МЭСМ, БЭСМ-1, М-1, М-2, М-З, “Стрела”, “Минск-1”, “Урал-1”, “Урал-2”, “Урал-3”, M-20, "Сетунь", БЭСМ-2, "Раздан". Они были значительных размеров, потребляли большую мощность, имели невысокую надежность работы и слабое программное обеспечение. Быстродействие их не превышало 2—3 тысяч операций в секунду, емкость оперативной памяти—2К или 2048 машинных слов (1K=1024) длиной 48 двоичных знаков. В 1958 г. появилась машина M-20 с памятью 4К и быстродействием около 20 тысяч операций в секунду. В машинах первого поколения были реализованы основные логические принципы построения электронно-вычислительных машин и концепции Джона фон Неймана, касающиеся работы ЭВМ по вводимой в память программе и исходным данным (числам). Этот период явился началом коммерческого применения электронных вычислительных машин для обработки данных. В вычислительных машинах этого времени использовались электровакуумные лампы и внешняя память на магнитном барабане. Они были опутаны проводами и имели время доступа 1х10-3 с. Производственные системы и компиляторы пока не появились. В конце этого периода стали выпускаться устройства памяти на магнитных сердечниках. Надежность ЭВМ этого поколения была крайне низкой. Второе поколение ЭВМ (1959 — 1967 гг.) Элементной базой машин этого поколения были полупроводниковые приборы. Машины предназначались для решения различных трудоемких научно-технических задач, а также для управления технологическими процессами в производстве. Появление полупроводниковых элементов в электронных схемах существенно увеличело емкость оперативной памяти, надежность и быстродействие ЭВМ. Уменьшились размеры, масса и потребляемая мощность. С появлением машин второго поколения значительно расширилась сфера использования электронной вычислительной техники, главным образом за счет развития программного обеспечения. Появились также специализированные машины, например ЭВМ для решения экономических задач, для управления производственными процессами, системами передачи информации и т.д. К ЭВМ второго поколения относятся:

Урал -11, -14, -16 - ЭВМ общего назначения, ориентированные на решение инженерно-технических и планово-экономических задач;

Минск -2, -12, -14 для решения инженерных, научных и конструкторских задач математического и логического характера; Третье поколение ЭВМ (1968 — 1973 гг.)Элементная база ЭВМ - малые интегральные схемы (МИС). Машины предназначались для широкого использования в различных областях науки и техники (проведение расчетов, управление производством, подвижными объектами и др.). Благодаря интегральным схемам удалось существенно улучшить технико-эксплуатационные характеристики ЭВМ. Например, машины третьего поколения по сравнению с машинами второго поколения имеют больший объем оперативной памяти, увеличилось быстродействие, повысилась надежность, а потребляемая мощность, занимаемая площадь и масса уменьшились. В СССР в 70-е годы получают дальнейшее развитие АСУ. Закладываются основы государственной и межгосударственной, охватывающей страны - члены СЭВ (Совет Экономической Взаимопомощи) системы обработки данных. Разрабатываются универсальные ЭВМ третьего поколения ЕС, совместимые как между собой (машины средней и высокой производительности ЕС ЭВМ), так и с зарубежными ЭВМ третьего поколения (IBM-360 и др. - США). В разработке машин ЕС ЭВМ принимают участие специалисты СССР, Народной Республики Болгария (НРБ), Венгерской Народной Республики (ВНР), Польской Народной Республики (ПНР), Чехословацкой Советской Социалистической Республики (ЧССР) и Германской Демократической Республики (ГДР). В то же время в СССР создаются многопроцессорные и квазианалоговые ЭВМ, выпускаются мини-ЭВМ "Мир-31", "Мир-32", "Наири-34". Для управления технологическими процессами создаются ЭВМ сериии АСВТ М-6000 и М-7000 (разработчики В.П.Рязанов и др.). Разрабатываются и выпускаются настольные мини-ЭВМ на интегральных микросхемах М-180, "Электроника -79, -100, -125, -200", "Электроника ДЗ-28", "Электроника НЦ-60" и др. К машинам третьего поколения относились "Днепр-2", ЭВМ Единой Системы (ЕС-1010, ЕС-1020, ЕС-1030, ЕС-1040, ЕС-1050, ЕС-1060 и несколько их промежуточных модификаций - ЕС-1021 и др.), МИР-2, "Наири-2" и ряд других. Характерной чертой данного периода явилось резкое снижение цен на аппаратное обеспечение. Этого удалось добиться главным образом за счет использования интегральных схем. Обычные электрические соединения с помощью проводов при этом встраивались в микросхему. Это позволило получить значение времени доступа до 2х10 -9 с. В этот период на рынке появились удобные для пользователя рабочие станции, которые за счет объединения в сеть значительно упростили возможность получения малого времени доступа, обычно присущего большим машинам. Дальнейший прогресс в развитии вычислительной техники был связан с разработкой полупроводниковой памяти, жидкокристаллических экранов и электронной памяти. В конце этого периода произошел коммерческий прорыв в области микроэлектронной технологии. Четвертое поколение ЭВМ (1974 — 1982 гг.)Элементная база ЭВМ - большие интегральные схемы (БИС). Машины предназначались для резкого повышения производительности труда в науке, производстве, управлении, здравоохранении, обслуживании и быту. Высокая степень интеграции способствует увеличению плотности компоновки электронной аппаратуры, повышению ее надежности, что ведет к увеличению быстродействия ЭВМ и снижению ее стоимости. Все это оказывает существенное воздействие на логическую структуру (архитектуру) ЭВМ и на ее программное обеспечение. Более тесной становится связь структуры машины и ее программного обеспечения, особенно операционной системы (или монитора)—набора программ, которые организуют непрерывную работу машины без вмешательства человека. К этому поколению можно отнести ЭВМ ЕС: ЕС-1015, -1025, -1035, -1045, -1055, -1065 (“Ряд 2”), -1036, -1046, -1066, СМ-1420, -1600, -1700, все персональные ЭВМ (“Электроника МС 0501”, “Электроника-85”, “Искра-226”, ЕС-1840, -1841, -1842 и др.), а также другие типы и модификации. К ЭВМ четвертого поколения относится также многопроцессорный вычислительный комплекс "Эльбрус". "Эльбрус-1КБ" имел быстродействие до 5,5 млн. операций с плавающей точкой в секунду, а объем оперативной памяти до 64 Мб. У "Эльбрус-2" производительность до 120 млн. операций в секунду, емкость оперативной памяти до 144 Мб или 16 Мслов ( слово 72 разряда), максимальная пропускная способность каналов ввода-вывода - 120 Мб/с.


Эта страница нарушает авторские права

allrefrs.ru - 2019 год. Все права принадлежат их авторам!