Информация
(лат. informatio разъяснение, пояснение) – совокупность сведений (данных),
которая воспринимается из окружающей
среды (входная информация), выдается в окружающую среду (исходная информация)
или сохраняется внутри определенной системы.
Свойства информации:
объективность и субъективность;
полнота;
достоверность;
адекватность;
доступность;
актуальность.
Материальный
носитель – материальный объект или среда, служащая для передачи информации.
Изменение
характеристики носителя называется сигналом, а значение этой
характеристики параметром сигнала.
Источник информации – это субъект или объект,
порождающий нформацию и представляющий ее в виде сообщения.
Получатель информации – это субъект или объект,
принимающий сообщение и способный правильно его интерпретировать.
Сигнал – материальный носитель, который фиксирует
информацию для переноса ее от источника к потребителю.
Рисунок
1 –
Передача сообщения
Семиотика
(греч.
semeion – знак, признак) –
науа, занимающаяся исследованием свойств знаков и знаковых
систем.
Семиотика выделяет следующие уровни передачи информации:
Синтаксический,
рассматриваются внутренние свойства сообщений.
Семантический,анализируется смысловое содержание сообщения, его отношение к источнику
информации
Прагматический,рассматривается потребительское содержание сообщения, его отношение к
получателю.
Существуют три меры информации:
синтаксическая;
семантическая;
прагматическая.
На синтаксическом
уровне для измерения информации вводятся два параметра:
Объем информации (объемный подход)
.
Количество информации (вероятностный подход)
I
Идея объемного подхода.
Есликоличество информации,
содержащейся в сообщении из одного символа, принять за единицу, то объем
информации (данных) в любом другом сообщении будет равен количествусимволов (разрядов) в этом сообщении. В памяти компьютера объем
информации записывается двоичными знаками и равен количеству требуемых для этой
записи двоичных кодов.
Объём данных
в техническом смысле этого слова как информационный объём сообщения или
как объём памяти, необходимый для хранения сообщения без каких-либо изменений.
Единицы измерения информации: 1 бит = количество двоичных
цифр (0 и 1). Пример: код 11001011 имеет объем данных V= 8 бит.
События, о которых нельзя сказать произойдут они или нет,
пока не будет осуществлен эксперимент, называются
случайными.
Отдельный повтор случайного события называется опытом, а
интересующий нас исход этого опыта – благоприятным.
Если N – общее
число опытов, а NА –
количество благоприятных исходов случайного события А, то отношение NA/N,
называется относительной частотой появления события А.
В разных серияхопытов частота может быть различна, но при увеличении количества опытов
относительная частота все меньше отклоняется от некоторой константы, ее наличие
называется статической устойчивостью
частот.
Если все исходы опыта конечны и равновозможные, то их
вероятность равна
,где n - число
исходов.
ФормулаХартли для равновозможных исходов.
ФормулаШеннона для неравновозможных исходов
.
Количество
информации (в битах), заключенное в двоичном слове, равно числу двоичных знаков
в нем.
Семантическая мера информации
Тезаурус — это совокупность сведений,
которыми располагает пользователь или система.
Рисунок
2 –
Зависимость количества семантической информации, воспринимаемой потребителем, от
его тезауруса
При
Sp→0 пользователь не воспринимает, не понимает поступающую
информацию;
При
Sp→∞ пользователь все знает, и поступающая информация ему не
нужна.
Прагматическая мера информации
Эта мера определяет полезность информации (ценность) для
достижения пользователем поставленной цели. Эта мера также величина
относительная, обусловленная особенностями использования этой информации в той
или иной системе.
Ценность информации целесообразно измерять в тех же самых
единицах (или близких к ним), в которых измеряется целевая функция.
Целевая
функция– есть математическое выражение некоторого критерия
качества одного объекта (решения, процесса и т.д.) в сравнении с другим.
Кодирование информации
Рисунок
3 –
Процесс передачи информации
Алфавит – множество знаков, в котором определен их
порядок (общеизвестен порядок знаков в русском алфавите: А, Б,..., Я)
Алфавит прописных русских букв
Алфавит Морзе
Алфавит клавиатурных символов ПЭВМ
IBM (русифицированная
клавиатура)
Источник представляет сообщение в алфавите, который
называется первичным,
далее это сообщение попадает в устройство, преобразующее и представляющее его во
вторичном алфавите.
Код
– правило, описывающее соответствие знаков (или их сочетаний) первичного
алфавита знаком (их сочетаниями) вторичного алфавита.
Кодирование
– перевод информации, представленной сообщением в первичном алфавите, в
последовательность кодов.
Декодирование
– операция обратная кодированию.
Кодер –
устройство, обеспечивающее выполнение операции кодирования.
Декодер –
устройство, производящее декодирование.
Операции кодирования и декодирования называются обратимыми, если их
последовательное применение обеспечит возврат к исходной информации без
каких-либо ее потерь.
Математическая постановка задачи кодирования:
А – первичный алфавит. Состоит из N знаков со средней
информацией на знак IА .
В – вторичный алфавит из Мзнаков со средней информацией на знак IВ.
Сообщение в первичном алфавите содержит n знаков, а
закодированное – m знаков.
Is(A) – информация в исходном сообщении, If(B)
– информация в закодированном сообщении.
n* IА ≤m* IB (заменили произведением числа знаков на среднее
информационное содержание знака).
m/n –характеризует среднее число знаков вторичного
алфавита, который используетсядля
кодирования одного знака первичного. Обозначим его К (А, В)
К (А, В)≥ I (A) / I (B)Обычно К (А, В) >1
Кmin (А, В)= I (A) / I (B) – минимальная длинна кода
Равномерное алфавитное кодирование.
Представление чисел в компьютере
Компьютерный алфавит С включает буквы латинского алфавита –
52 шт.
Букв русского (прописные и строчные) – 66 шт.
Цифры 0…9 –10
шт.
Знаки математических операций, препинания, спецсимволы – 20
штук
Итого: 148
К (С, 2) ≥ log2 148 ≥ 7,21,
так как длина кода – целое число, следовательно,
К (С,2) = 8бит = 1байт.
Именно такой способ
кодирования принят в компьютерных системах. Один байт соответствует количеству
информации в одном знаке алфавита при их равновероятном распределении. Это
объемный способ измерения информации.
Присвоение символу конкретного двоичного кода фиксируется в
кодовой таблице, где устанавливается соответствие между символами и их
порядковыми номерами.
Таблицы кодировки
Таблица, в которой устанавливается однозначное соответствие
между символами и их порядковыми номерами, называется таблицей кодировки.
Для разных типов ЭВМ используют различные таблицы
кодировки:
ANSI
- (American National Standards Institute)
ASCII - (American
Standard Cod for Information Interchange)
Рисунок
4 –
Код обмена информации ASCII
Первоначально – 7 бит:
N=27=128 символов;
0…31 – всевозможные управляющиесимволы;
32…127 – видимые на экране символы;
Сейчас – 8 бит, N=28 =256 символов.
Символы со 128…255 – национальные алфавиты, псевдографика.
Системы счисления
Система счисления - это способ наименования и
изображения чисел с помощью цифр, то есть символов, имеющих определенные
количественные значения.
Система счисления подразделяются на
унарные,
позиционные и
непозиционные.
Таблица. Примеры систем счисления
Основание
Система счисления
Знаки
2
Двоичная
0,1
3
Троичная
0,1.2
4
Четвертичная
0,1,2,3
5
Пятеричная
0,1,2,3,4
8
Восьмеричная
0,1,2,3,4,5,6,7
10
Десятичная
0,1,2,3,4,5,6,7,8,9
12
Двенадцатеричная
0,1,2,3,4,5,б,7,8,9,А,В
16
Шестнадцатеричная
0,1,2,3,4,5,6,7,8,9,A,B,C,D,E,F
В непозиционных
системах счисления каждая цифра имеет одно и тоже значение независимо от
положения в записи числа (значение знака не зависит от того места, которое он
занимает числе).
Непозиционной системой счисления является самая простая
система с одним символом (палочкой). Для изображения какого-либо числа в этой
системе надо записать количество палочек, равное данному числу.
Примером непозиционной системы счисления является римская
система, в которой в качестве цифр используются латинские буквы.
I
V
X
L
C
D
M
1
5
10
50
100
500
1000
Запись чисел в непозиционной системе счисления
осуществляется по следующим правилам:
если цифра слева меньше, чем цифра справа, то левая цифра
вычитается из правой
где нижние индексы – определяют месторасположение цифры в
числе n и s- количества разрядов
для записи целой и дробной части числа соответственно.
Примеры:
Десятичная система
23,4310= 2*101 + З*100 +
4*10-1 + З*10-2
69210 = 6* 102 + 9*101 + 2
Двоичная система
11012= 1*23 + 1*22+0*21+
1*20
Двоичная система
341,58 =3*82+ 4*81 +1*80
+5*8-1
Шестнадцатеричная система
A1F416 = A*162 + 1*161 +
F*160 + 4*16-1
Максимальное целое число, которое может быть представлено в
n разрядах .
Минимальное значащее число (не равное 0), которое можно
записать в s разрядах дробной части
.
Всего можно записать
разрядных чисел
Диапазон значащих чиселN в системе счисления с основаниемP при наличииn
разрядов в целой части и s разрядов в дробной части (без учета знака числа)
будет: ,
Двоичная система счисления - позиционная система счисления
с основанием 2, цифры 0 и 1.
Преимущества:
Чем меньше значений существует в системе, тем проще
изготовить отдельные элементы.
Чем меньше количество состояний у элемента, тем выше
помехоустойчивость и скорость работы.
Простота создания таблиц сложения и умножения.
Восемь бит дают 256 различных комбинаций включенных и
выключенных состояний.
Двоичная система счисления - позиционная система счисления
с основанием 8, цифры от 0 до 7.
Таблица сложения для восьмеричной системы счисления
+
0
1
2
3
4
5
6
7
0
0
1
2
3
4
5
6
7
1
1
2
3
4
5
6
7
10
2
2
3
4
5
6
7
10
11
3
3
4
5
6
7
10
11
12
4
4
5
6
7
10
11
12
13
5
5
6
7
10
11
12
13
14
6
6
7
10
11
12
13
14
15
7
7
10
11
12
13
14
15
16
Таблица умножения для восьмеричной системы счисления
*
0
1
2
3
4
5
6
7
0
0
0
0
0
0
0
0
0
1
0
1
2
3
4
5
6
7
2
0
2
4
6
10
12
14
16
3
0
3
6
11
14
17
22
25
4
0
4
10
14
20
24
30
34
5
0
5
12
17
24
31
36
43
6
0
6
14
22
30
36
44
52
7
0
7
16
25
34
43
52
61
Двоичное, десятичное и шестнадцатеричное представления
10
2
8
16
0
0000
1
0001
2
0010
3
0011
4
0100
5
0101
6
0110
7
0111
8
1000
9
1001
10
1010
12
A
11
1011
13
B
12
1100
14
C
13
1101
15
D
14
1110
16
E
15
1111
17
F
Перевод целых чисел из одной системы счисления в другую
Правило 1.
Перевод числа x из системы счисления основанием P в систему счисления с
основанием Q заключается в последовательном нахождении остатков от деления числа
x на основание Q, при этом процесс продолжается до тех пор, пока частное от
деления не будет меньше основания Q. Все вычисления выполняются в системе
счисления с основанием P, т.е. основание Q должно также быть выражено в системе
счисления с основанием P.
Остатки от деления должны быть выражены цифрами системы
счисления с основанием Q.Представление искомого числа в системе счисления с основанием
Q получается
выписыванием последнего частного и остатков от деления в обратном порядке.
Правило 2.
Перевод числа x из системы счисления основанием P в систему счисления с
основанием Q осуществляется путем представления числа х по степеням основания P.
Все вычисления выполняются в системе счисления с основанием Q, т. е. основание P
и цифры исходного числа должны также быть выражены в системе счисления с
основанием Q.
На практике такой порядок перевода чисел используется при
переводе десятичную систему счисления.
23Е16 = ?10 = 2*162+3*161+
Е*160 = 57410
Правило 3.
Перевод чисел из восьмеричной системы счисления в двоичную и наоборот
переводится по Триадам.
Двоичный код
Восьмеричная цифра
Десятичный эквивалент
000
0
0
001
1
1
010
2
2
011
3
3
100
4
4
101
5
5
110
6
6
111
7
7
10768 = 001000111
1102
Правило 4.Перевод чисел из шестнадцатеричной системы счисления в двоичную и
наоборот переводится по тетрадам.
23E16
= 0010001111012
Пример: Перевести число 75 из десятичной системы в
двоичную, восьмеричную и шестнадцатеричную
Ответ: 7510 = 1 001 0112 = 1138
= 4B16.
Перевод дробных чисел из одной системы счисления в другую
Как правило, это происходит через промежуточный перевод в
десятичную систему:
Шаг1.
Если основание СС - p, простая дробь содержит n цифр и bk
– цифры дроби (1 ≤ k ≤ n, 0 ≤ bk ≤ p-1), то она может быть
представлена в видесуммы:
O,Yp
=∑ bkp-k
0,0112
=0*2-1+1*2-2+1*2-3=0,37510
Шаг
2.
Умножить исходную дробь в десятичной СС на p, выделить
целую часть – она будет первой цифрой новой дроби, отбросить дробную часть;
Для оставшейся дробной части операцию умножения с
выделением целой и дробной частей повторять, пока в дробной части не останется
0, или не будет достигнута желаемая точность. Появляющиеся при этом целые будут
цифрами новой дроби;
Записать дробь в виде последовательности цифр после ноля с
разделителем в порядке их появления в п.1 и 2.
Пример
0,37510→ O,Y2
0, 375*2 = 0,750
0, 75*2= 1,50
0, 5*2=
1,0
0,37510= 0,0112
Формы представления чисел
Естественная форма.
С фиксированной точкой все числа изображаются в виде последовательности цифр с
постоянным для всех чисел положением запятой, отделяющей целую часть от дробной.
0,25; -10,44; +0,9781
Пример:
Диапазон чисел (N)
в системе счисления с основанием Р при наличии
m разрядов в целой
части и S разрядов в
дробной (без учета знака числа) будет:
P-S
≤ N ≤Рm
- P-S
Прир=2,
m=10 и S=60,015 ≤ N ≤ 1024.
Если в результате операции получится число, выходящее за
допустимый диапазон, происходит переполнение разрядной сетки и дальнейшее
вычисления теряют смысл.
С плавающей точкой.Число Х10 называется нормализованным, если оно представлено в
виде
Х10 =±М10*10±К ,
где М10 – мантисса, 0,1≤ М10< 1, К –
порядок, целое положительно десятичное число.
Пример: -123410= -0,1234*104, 0,00310=0,3*10-2
При нормализации выполняется деление числа на 4
составляющих: знак числа, мантисса, знак порядка, порядок.
Для произвольной системы счисления.
Хр =± Мр*P±К ,Р-1 ≤ М< 1
Представление чисел в ЭВМ
Способы представления чисел:
целые положительные числа (без знака)
целые со знаком
вещественные нормализованные числа.
Целые числа без
знака обычно занимают в памяти один или два байта и принимают:
в однобайтовом формате значения от 000000002 до
111111112,
в двухбайтовом формате — от 00000000000000002 до
11111111111111112.
Диапазоны значений целых чисел без знака
Формат числа в байтах
Диапазон
Запись с порядком
Обычная запись
1
0 ... 28–1
0 ... 255
2
0 ... 216–1
0 ... 65535
Целые числа со
знаком обычно занимают в памяти компьютера один, два или четыре байта, при
этом самый левый (старший) разряд содержит информацию о знаке числа. Знак “плюс”
кодируется нулем, а “минус” — единицей.
Диапазоны значений целых чисел без знака
Формат числа в байтах
Диапазон
Запись с порядком
Обычная запись
1
-27 ... 27–1
-128 ... 127
2
-215 ... 215–1
-32768 ... 32767
4
-231…231-1
-2147483648 ... 2147483647
Пример
7210=10010002
однобайтовый формат
7
6
5
4
3
2
1
0
0
1
0
0
1
0
0
0
двубайтовый формат
15
14
13
12
11
10
9
8
7
6
5
4
3
2
1
0
0
0
0
0
0
0
0
0
0
1
0
0
1
0
0
0
число 65535 в двубайтовом формате
15
14
13
12
11
10
9
8
7
6
5
4
3
2
1
0
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
Целые числа со знаком представляются в
прямом, обратном и
дополнительном кодах.
Положительные числа в прямом, обратном и дополнительном
кодах изображаются одинаково - двоичными кодами с цифрой 0 в знаковом
разряде
Прямой код
В знаковый разряд помещается цифра знака, а в разряды
цифровой части числа — двоичный код его абсолютной величины.
Прямой код числа: 1
7
6
5
4
3
2
1
0
0
0
0
0
0
0
0
1
Прямой код числа: -127
7
6
5
4
3
2
1
0
1
1
1
1
1
1
1
1
,
где n-разрядность кода, aзн – значение знакового
разряда.
Пример: если разрядность кода равна 4, то
1101=(-1)1[1x20+0x21+1x22]=-5
Обратный код
Получается инвертированием всех цифр двоичного кода
абсолютной величины числа, включая разряд знака: нули заменяются единицами, а
единицы – нулями.
Пример:
число: -1, модуль 0
0000001, обратный код 1 1111110
число: -127, модуль
0 1111111 , обратный код 1 0000000
где n-разрядность машинного слова, aзн=0 для положительных
чисел, aзн=1 для отрицательных чисел.
1010 = 1*(-23+1)+[0x20+1x21+0x22] = -7+2=-5
Дополнительный код
Получается образованием обратного кода с последующим
прибавлением единицы к его младшему разряду
число: -1 = обратный код 1 1111110
число: -127 =
обратный код 1 0000000
Дополнительный код числа: -1
7
6
5
4
3
2
1
0
1
1
1
1
1
1
1
1
Дополнительный код числа: -127
7
6
5
4
3
2
1
0
1
0
0
0
0
0
0
1
Обычно отрицательные десятичные числа при вводе в машину
автоматически преобразуются в обратный или дополнительный двоичный код и в таком
виде хранятся, перемещаются и участвуют в операциях. При выводе таких чисел из
машины происходит обратное преобразование в отрицательные десятичные числа.
Алгоритм перевода отрицательных чисел в положительные
I вариант.
Переписать исходную
последовательность битов числа справа налево до
первой единицы, включая ее. Остальные биты
инвертировать.
Представление в двоичном дополнительном коде в случае
3-битного кодирования чисел.
Набор битов
Значение
011
3
010
2
001
1
000
0
111
-1
110
-2
101
-3
100
-4
Для дополнительного кода справедливо следующее соотношение:
где n-разрядность машинного слова, aзн=0 для положительных
чисел, aзн =1 для отрицательных чисел.
Пример:
1101 = 1*(-23)+[1x20+1x21+0x22]=-8+3=-5
Операции над целыми числами
Сложение.
Вычитание. В большинстве случаев операция вычитания не
используется, вместо нее производится сложение обратных или дополнительных кодов
уменьшаемого и вычитаемого.
Умножение
Целочисленное деление и нахождение остатка от деления
Сложение обратных кодов
А и В положительные
А положительное, B отрицательное и по абсолютной величине
больше, чем А
А положительное, B отрицательное и по абсолютной величине
меньше, чем А
А и B отрицательные
При сложении может возникнуть ситуация, когда старшие
разряды результата операции не помещаются в отведенной для него области памяти.
Такая ситуация называется переполнением разрядной сетки формата числа. Случай
переполнения возможен и для обратных и для дополнительных кодов.
Сложение дополнительных кодов
А и В положительные
А положительное, B отрицательное и по абсолютной величине
больше, чем А
А положительное, B отрицательное и по абсолютной величине
меньше, чем А
А и B отрицательные
Формат представления вещественных чисел
При хранении числа с плавающей точкой отводятся разряды для
мантиссы, порядка, знака числа и знака порядка:
Чем больше разрядов отводится под запись мантиссы, тем выше
точность представления числа.
Чем больше разрядов занимает порядок, тем шире диапазон от
наименьшего отличного от нуля числа до наибольшего числа, представимого в машине
при заданном формате.
Пример записи чисел в нормализованном виде в
четырехбайтовом формате с семью разрядами для записи порядка.
Число 6.2510 = 110.012 = +0,11001•2+11.
Пример записи чисел в нормализованном виде в
четырехбайтовом формате с семью разрядами для записи порядка.
Число –0.12510 = –0.0012 = –0.1*2–10
(отрицательный порядок записывается в дополнительном коде).
Характеристики форматов вещественных чисел
Форматы вещественных чисел
Размер в байтах
Примерный диапазон
абсолютных значений
Количество значащих
десятичных цифр
Одинарный
4
10–45 … 1038
7 или 8
Вещественный
6
10–39 … 1038
11 или 12
Двойной
8
10–324 … 10308
15 или 16
Расширенный
10
10–4932 … 104932
19 или 20
Форма представления чисел с плавающей точкой позволяет
записывать числа с высокой точностью и из весьма широкого диапазона.
Арифметические операции с вещественными числами
Сложение .
Δk=|k1-k2|
если k1>k2, то
k=k1
иначе k=k2
если 10-1<=M<1, то вывод результата в виде M×10k,иначе
предварительная нормализация
Пример.
X1=0.87654 * 101, X2=0.94567*102.
Пусть под запись мантиссы отводится 5 разрядов.
Деление производится по правилу – мантиссы делятся (делимое
на делитель), а порядки вычитаются (порядок делителя из порядка делимого). Если
нужно, то полученное число нормализуется