Что нужно знать:
все символы кодируются одинаковым числом бит (алфавитный подход)
чаще всего используют кодировки, в которых на символ отводится 8 бит (8-битные) или 16 бит (16-битные)
при измерении количества информации принимается, что в одном байте 8 бит, а в одном килобайте (1 Кбайт) – 1024 байта, в мегабайте (1 Мбайт) – 1024 Кбайта
после знака препинания внутри (не в конце!) текста ставится пробел
чтобы найти информационный объем текста I, нужно умножить количество символов Kна информационный вес одного символа a: I=K*a
Пример 1. Два текста содержат одинаковое количество символов. Первый текст записан на русском языке, а второй на языке племени нагури, алфавит которого состоит из 16 символов. Чей текст несет большее количество информации?
Решение:
I = К * а (информационный объем текста равен произведению числа символов на информационный вес одного символа).
Т.к. оба текста имеют одинаковое число символов (К), то разница зависит от информативности одного символа алфавита (а).
2а1 = 32, т.е. а1 = 5 бит,
|
|
2а2 = 16, т.е. а2 = 4 бит.
I1 = К * 5 бит, I2 = К * 4 бит.
Ответ: текст, записанный на русском языке в 5/4 раза несет больше информации.
Пример 2. Объем сообщения, содержащего 2048 символов, составил 1/512 часть Мб. Определить мощность алфавита.
Решение.
I = 1/512 * 1024 * 1024 * 8 = 16384 бит – перевели в биты информационный объем сообщения.
а = I / К = 16384 /2048 =8 бит – приходится на один символ алфавита.
28 = 256 символов — мощность использованного алфавита.
Пример 3. Автоматическое устройство осуществило перекодировку информационного сообщения на русском языке, первоначально записанного в 16-битном коде Unicode, в 8-битную кодировку КОИ-8. При этом информационное сообщение уменьшилось на 800 бит. Какова длина сообщения в символах?
Решение:
Изменение кодировки с 16 бит на 8 бит, равно 16 — 8 = 8 бит. Следовательно информационный объем каждого символа сообщения уменьшился на 8 бит. Так как объем информационного сообщения уменьшился на 800 бит, следовательно количество символов в сообщение равно 800/8=100.
Ответ: Длина сообщения – 100 символов.
Пример 4. Автоматическое устройство осуществило перекодировку информационного сообщения на русском языке, первоначально записанного в 16–битном коде Unicode, в 8–битную кодировку Windows–1251, при этом информационный объем сообщения составил 60 байт. Определите информационный объем сообщения до перекодировки.
Решение:
По условиям задачи информационный объем сообщения после кодировки составил 60 байт = 480 бит, следовательно количество символов в сообщении = 480/8 = 60. До перекодировки сообщение кодировалось 16-битным кодом, следовательно, информационный объем сообщения до перекодировки = 60 * 16 = 960 бит.
|
|
Ответ: информационный объем сообщения до перекодировки 960 бит.
Пример 5. Сколько потребуется памяти под хранение 2 страниц с текстом, если на каждой странице по 50 строк, в каждой строке по 60 символов? (кодировка CP1251)
Решение.
Находим общее количество символов:
50*60 = 300 символов на одной странице.
300*2 = 600 символов всего в тексте.
В кодировке CP1251 каждый символ кодируется одним байтом.
Ответ: 600 байт.
Контрольные вопросы и задания
1. Закодируйте с помощью таблицы CP1251 слово «информация».
2. Почему иногда на экране монитора вместо текстовой информации можно видеть ÿÿÿÿ и т.п.
3. Автоматическое устройство осуществило перекодировку информационного сообщения длиной 48 символов, первоначально записанного в 7–битном коде ASCII, в 16–битную кодировку Unicode. При этом информационное сообщение увеличилось на …
4. 2. Автоматическое устройство осуществило перекодировку информационного сообщения, первоначально записанного в 7-битном коде ASCII, в 16-битную кодировку Unicode. При этом информационное сообщение увеличилось на 108 бит. Какова длина сообщения в символах?
5. Определить объем памяти в Кбайтах, занимаемый текстом из 60 страниц по 512 символов на каждой странице. (кодировка ASCII)
6. Сообщение занимает 3 страницы и содержит 7950 байтов информации. Сколько строк на странице, если символов в каждой строке 25 и использована кодировка Unicode?
7. Определить максимальное количество страниц текста, содержащего по 80 символов в каждой строке и 64 строки на странице, которое может содержать файл, сохраненный на гибком магнитном диске объемом 10 Кб (кодировка ASCII)