X-PDF

Решение задач на кодирование текстовой информации

Поделиться статьей

Что нужно знать:

Ÿ все символы кодируются одинаковым числом бит (алфавитный подход)

Ÿ чаще всего используют кодировки, в которых на символ отводится 8 бит (8-битные) или 16 бит (16-битные)

Ÿ при измерении количества информации принимается, что в одном байте 8 бит, а в одном килобайте (1 Кбайт) – 1024 байта, в мегабайте (1 Мбайт) – 1024 Кбайта

Ÿ после знака препинания внутри (не в конце!) текста ставится пробел

Ÿ чтобы найти информационный объем текста I, нужно умножить количество символов Kна информационный вес одного символа a: I=K*a

Пример 1. Два текста содержат одинаковое количество символов. Первый текст записан на русском языке, а второй на языке племени нагури, алфавит которого состоит из 16 символов. Чей текст несет большее количество информации?

Решение:
I = К * а (информационный объем текста равен произведению числа символов на информационный вес одного символа).
Т.к. оба текста имеют одинаковое число символов (К), то разница зависит от информативности одного символа алфавита (а).
2а1 = 32, т.е. а1 = 5 бит,

2а2 = 16, т.е. а2 = 4 бит.

I1 = К * 5 бит, I2 = К * 4 бит.

Ответ: текст, записанный на русском языке в 5/4 раза несет больше информации.

Пример 2. Объем сообщения, содержащего 2048 символов, составил 1/512 часть Мб. Определить мощность алфавита.

Решение.
I = 1/512 * 1024 * 1024 * 8 = 16384 бит – перевели в биты информационный объем сообщения.

а = I / К = 16384 /2048 =8 бит – приходится на один символ алфавита.
28 = 256 символов — мощность использованного алфавита.

Пример 3. Автоматическое устройство осуществило перекодировку информационного сообщения на русском языке, первоначально записанного в 16-битном коде Unicode, в 8-битную кодировку КОИ-8. При этом информационное сообщение уменьшилось на 800 бит. Какова длина сообщения в символах?

Решение:
Изменение кодировки с 16 бит на 8 бит, равно 16 — 8 = 8 бит. Следовательно информационный объем каждого символа сообщения уменьшился на 8 бит. Так как объем информационного сообщения уменьшился на 800 бит, следовательно количество символов в сообщение равно 800/8=100.

Ответ: Длина сообщения – 100 символов.

Пример 4. Автоматическое устройство осуществило перекодировку информационного сообщения на русском языке, первоначально записанного в 16–битном коде Unicode, в 8–битную кодировку Windows–1251, при этом информационный объем сообщения составил 60 байт. Определите информационный объем сообщения до перекодировки.

Представленная информация была полезной?
ДА
60.87%
НЕТ
39.13%
Проголосовало: 1536

Решение:
По условиям задачи информационный объем сообщения после кодировки составил 60 байт = 480 бит, следовательно количество символов в сообщении = 480/8 = 60. До перекодировки сообщение кодировалось 16-битным кодом, следовательно, информационный объем сообщения до перекодировки = 60 * 16 = 960 бит.

Ответ: информационный объем сообщения до перекодировки 960 бит.

Пример 5. Сколько потребуется памяти под хранение 2 страниц с текстом, если на каждой странице по 50 строк, в каждой строке по 60 символов? (кодировка CP1251)

Решение.

Находим общее количество символов:

50*60 = 300 символов на одной странице.

300*2 = 600 символов всего в тексте.

В кодировке CP1251 каждый символ кодируется одним байтом.

Ответ: 600 байт.

Контрольные вопросы и задания

1. Закодируйте с помощью таблицы CP1251 слово «информация».

2. Почему иногда на экране монитора вместо текстовой информации можно видеть ÿÿÿÿ и т.п.

3. Автоматическое устройство осуществило перекодировку информационного сообщения длиной 48 символов, первоначально записанного в 7–битном коде ASCII, в 16–битную кодировку Unicode. При этом информационное сообщение увеличилось на …

4. 2. Автоматическое устройство осуществило перекодировку информационного сообщения, первоначально записанного в 7-битном коде ASCII, в 16-битную кодировку Unicode. При этом информационное сообщение увеличилось на 108 бит. Какова длина сообщения в символах?

5. Определить объем памяти в Кбайтах, занимаемый текстом из 60 страниц по 512 символов на каждой странице. (кодировка ASCII)

6. Сообщение занимает 3 страницы и содержит 7950 байтов информации. Сколько строк на странице, если символов в каждой строке 25 и использована кодировка Unicode?

7. Определить максимальное количество страниц текста, содержащего по 80 символов в каждой строке и 64 строки на странице, которое может содержать файл, сохраненный на гибком магнитном диске объемом 10 Кб (кодировка ASCII)


Поделиться статьей
Автор статьи
Анастасия
Анастасия
Задать вопрос
Эксперт
Представленная информация была полезной?
ДА
60.87%
НЕТ
39.13%
Проголосовало: 1536

или напишите нам прямо сейчас:

Написать в WhatsApp Написать в Telegram

ЯТТС-Рекомендации по написанию отчета по учебной и производственной практики-Гостинечное дело

Поделиться статьей

Поделиться статьейПоделиться статьей Автор статьи Анастасия Задать вопрос Эксперт Представленная информация была полезной? ДА 60.87% НЕТ 39.13% Проголосовало: 1536


Поделиться статьей

ЮУрГУ-вопросы

Поделиться статьей

Поделиться статьейПоделиться статьей Автор статьи Анастасия Задать вопрос Эксперт Представленная информация была полезной? ДА 60.87% НЕТ 39.13% Проголосовало: 1536


Поделиться статьей

ЮУГУ-Отчет_ПП-Машины непрерывного транспорта

Поделиться статьей

Поделиться статьейПоделиться статьей Автор статьи Анастасия Задать вопрос Эксперт Представленная информация была полезной? ДА 60.87% НЕТ 39.13% Проголосовало: 1536


Поделиться статьей

ЮУГУ- Курсовой проект по электронике

Поделиться статьей

Поделиться статьейПоделиться статьей Автор статьи Анастасия Задать вопрос Эксперт Представленная информация была полезной? ДА 60.87% НЕТ 39.13% Проголосовало: 1536


Поделиться статьей

ЮУГУ-ВКР-Обеспечение требований охраны труда на рабочем месте слесаря-ремонтника 5 разряда

Поделиться статьей

Поделиться статьейПоделиться статьей Автор статьи Анастасия Задать вопрос Эксперт Представленная информация была полезной? ДА 60.87% НЕТ 39.13% Проголосовало: 1536


Поделиться статьей

или напишите нам прямо сейчас:

Написать в WhatsApp Написать в Telegram
Заявка
на расчет