X-PDF

Решение задач на кодирование текстовой информации

Поделиться статьей

Что нужно знать:

Ÿ все символы кодируются одинаковым числом бит (алфавитный подход)

Ÿ чаще всего используют кодировки, в которых на символ отводится 8 бит (8-битные) или 16 бит (16-битные)

Ÿ при измерении количества информации принимается, что в одном байте 8 бит, а в одном килобайте (1 Кбайт) – 1024 байта, в мегабайте (1 Мбайт) – 1024 Кбайта

Ÿ после знака препинания внутри (не в конце!) текста ставится пробел

Ÿ чтобы найти информационный объем текста I, нужно умножить количество символов Kна информационный вес одного символа a: I=K*a

Пример 1. Два текста содержат одинаковое количество символов. Первый текст записан на русском языке, а второй на языке племени нагури, алфавит которого состоит из 16 символов. Чей текст несет большее количество информации?

Решение:
I = К * а (информационный объем текста равен произведению числа символов на информационный вес одного символа).
Т.к. оба текста имеют одинаковое число символов (К), то разница зависит от информативности одного символа алфавита (а).
2а1 = 32, т.е. а1 = 5 бит,

2а2 = 16, т.е. а2 = 4 бит.

I1 = К * 5 бит, I2 = К * 4 бит.

Ответ: текст, записанный на русском языке в 5/4 раза несет больше информации.

Пример 2. Объем сообщения, содержащего 2048 символов, составил 1/512 часть Мб. Определить мощность алфавита.

Решение.
I = 1/512 * 1024 * 1024 * 8 = 16384 бит – перевели в биты информационный объем сообщения.

а = I / К = 16384 /2048 =8 бит – приходится на один символ алфавита.
28 = 256 символов — мощность использованного алфавита.

Пример 3. Автоматическое устройство осуществило перекодировку информационного сообщения на русском языке, первоначально записанного в 16-битном коде Unicode, в 8-битную кодировку КОИ-8. При этом информационное сообщение уменьшилось на 800 бит. Какова длина сообщения в символах?

Решение:
Изменение кодировки с 16 бит на 8 бит, равно 16 — 8 = 8 бит. Следовательно информационный объем каждого символа сообщения уменьшился на 8 бит. Так как объем информационного сообщения уменьшился на 800 бит, следовательно количество символов в сообщение равно 800/8=100.

Ответ: Длина сообщения – 100 символов.

Пример 4. Автоматическое устройство осуществило перекодировку информационного сообщения на русском языке, первоначально записанного в 16–битном коде Unicode, в 8–битную кодировку Windows–1251, при этом информационный объем сообщения составил 60 байт. Определите информационный объем сообщения до перекодировки.

Представленная информация была полезной?
ДА
58.72%
НЕТ
41.28%
Проголосовало: 1066

Решение:
По условиям задачи информационный объем сообщения после кодировки составил 60 байт = 480 бит, следовательно количество символов в сообщении = 480/8 = 60. До перекодировки сообщение кодировалось 16-битным кодом, следовательно, информационный объем сообщения до перекодировки = 60 * 16 = 960 бит.

Ответ: информационный объем сообщения до перекодировки 960 бит.

Пример 5. Сколько потребуется памяти под хранение 2 страниц с текстом, если на каждой странице по 50 строк, в каждой строке по 60 символов? (кодировка CP1251)

Решение.

Находим общее количество символов:

50*60 = 300 символов на одной странице.

300*2 = 600 символов всего в тексте.

В кодировке CP1251 каждый символ кодируется одним байтом.

Ответ: 600 байт.

Контрольные вопросы и задания

1. Закодируйте с помощью таблицы CP1251 слово «информация».

2. Почему иногда на экране монитора вместо текстовой информации можно видеть ÿÿÿÿ и т.п.

3. Автоматическое устройство осуществило перекодировку информационного сообщения длиной 48 символов, первоначально записанного в 7–битном коде ASCII, в 16–битную кодировку Unicode. При этом информационное сообщение увеличилось на …

4. 2. Автоматическое устройство осуществило перекодировку информационного сообщения, первоначально записанного в 7-битном коде ASCII, в 16-битную кодировку Unicode. При этом информационное сообщение увеличилось на 108 бит. Какова длина сообщения в символах?

5. Определить объем памяти в Кбайтах, занимаемый текстом из 60 страниц по 512 символов на каждой странице. (кодировка ASCII)

6. Сообщение занимает 3 страницы и содержит 7950 байтов информации. Сколько строк на странице, если символов в каждой строке 25 и использована кодировка Unicode?

7. Определить максимальное количество страниц текста, содержащего по 80 символов в каждой строке и 64 строки на странице, которое может содержать файл, сохраненный на гибком магнитном диске объемом 10 Кб (кодировка ASCII)


Поделиться статьей
Автор статьи
Анастасия
Анастасия
Задать вопрос
Эксперт
Представленная информация была полезной?
ДА
58.72%
НЕТ
41.28%
Проголосовало: 1066

или напишите нам прямо сейчас:

Написать в WhatsApp Написать в Telegram

ОБРАЗЦЫ ВОПРОСОВ ДЛЯ ТУРНИРА ЧГК

Поделиться статьей

Поделиться статьей(Выдержка из Чемпионата Днепропетровской области по «Что? Где? Когда?» среди юношей (09.11.2008) Редакторы: Оксана Балазанова, Александр Чижов) [Указания ведущим:


Поделиться статьей

ЛИТЕЙНЫЕ ДЕФЕКТЫ

Поделиться статьей

Поделиться статьейЛитейные дефекты — понятие относительное. Строго говоря, де­фект отливки следует рассматривать лишь как отступление от заданных требований. Например, одни


Поделиться статьей

Введение. Псковская Судная грамота – крупнейший памятник феодального права эпохи феодальной раздробленности на Руси

Поделиться статьей

Поделиться статьей1. Псковская Судная грамота – крупнейший памятник феодального права эпохи феодальной раздробленности на Руси. Специфика периода феодальной раздробленности –


Поделиться статьей

Нравственные проблемы современной биологии

Поделиться статьей

Поделиться статьейЭтические проблемы современной науки являются чрезвычайно актуальными и значимыми. В связи с экспоненциальным ростом той силы, которая попадает в


Поделиться статьей

Семейство Первоцветные — Primulaceae

Поделиться статьей

Поделиться статьейВключает 30 родов, около 1000 видов. Распространение: горные и умеренные области Северного полушария . многие виды произрастают в горах


Поделиться статьей

Вопрос 1. Понятие цены, функции и виды. Порядок ценообразования

Поделиться статьей

Поделиться статьейЦенообразование является важнейшим рычагом экономического управления. Цена как экономическая категория отражает общественно необходимые затраты на производство и реализацию туристского


Поделиться статьей

или напишите нам прямо сейчас:

Написать в WhatsApp Написать в Telegram
Заявка
на расчет