кодом называется двоичное слово фиксированной длины

Кодирование информации

Определение:

Кодирование информации (англ. information coding) — отображение данных на кодовые слова.

Обычно в процессе кодирования информация преобразуется из формы, удобной для непосредственного использования, в форму, удобную для передачи, хранения или автоматической обработки. В более узком смысле кодированием информации называют представление информации в виде кода. Средством кодирования служит таблица соответствия знаковых систем, которая устанавливает взаимно однозначное соответствие между знаками или группами знаков двух различных знаковых систем.

Содержание

Код [ править ]

Виды кодов [ править ]

Все вышеперечисленные коды являются однозначно декодируемыми — для такого кода любое слово, составленное из кодовых слов, можно декодировать только единственным способом.

Примеры кодов [ править ]

Однозначно декодируемый код [ править ]

Определение:

Однозначно декодируемый код (англ. uniquely decodable code) — код, в котором любое слово составленное из кодовых слов можно декодировать только единственным способом.

Пусть есть код заданный следующей кодовой таблицей:

[math]a_1 \rightarrow b_1[/math]

[math]a_2 \rightarrow b_2[/math]

[math]a_k \rightarrow b_k[/math]

Код является однозначно декодируемым, только тогда, когда для любых строк, составленных из кодовых слов, вида:

Всегда выполняются равенства:

Заметим, что если среди кодовых слов будут одинаковые, то однозначно декодировать этот код мы уже не сможем.

Префиксный код [ править ]

Определение:

Префиксный код (англ. prefix code) — код, в котором никакое кодовое слово не является префиксом какого-то другого кодового слова.

Предпочтение префиксным кодам отдается из-за того, что они упрощают декодирование. Поскольку никакое кодовое слово не выступает в роли префикса другого, кодовое слово, с которого начинается файл, определяется однозначно, как и все последующие кодовые слова.

Пример кодирования [ править ]

Закодируем строку [math]abacaba[/math] :

Такой код можно однозначно разбить на слова:

[math]00\ 01\ 00\ 1\ 00\ 01\ 00[/math]

Преимущества префиксных кодов [ править ]

Недостатки префиксных кодов [ править ]

Пример неудачного декодирования [ править ]

Предположим, что последовательность [math]abacaba[/math] из примера передалась неверно и стала:

[math]c^<**>(abacaba) = 0001001\ 1\ 00100[/math]

Разобьем ее согласно словарю:

[math] 00\ 01\ 00\ 1\ 1\ 00\ 1\ 00[/math]

[math]a\quad b\quad a\ c\ c\quad a\ c\ a[/math]

Полученная строка совпадает только в битах, которые находились до ошибочного, поэтому декодирование неравномерного кода, содержащего ошибки, может дать абсолютно неверные результаты.

Не префиксный однозначно декодируемый код [ править ]

Как уже было сказано, префиксный код всегда однозначно декодируем. Обратное в общем случае неверно:

Мы можем ее однозначно декодировать, так как знаем, что слева от двойки и справа от тройки всегда стоит единица.

После декодирования получаем: [math]abbca[/math]

Источник

Информатика. 7 класс

Конспект урока

Кодирование информации. Двоичный код

Перечень вопросов, рассматриваемых в теме:

Дискретизация информации – процесс преобразования информации из непрерывной формы представления в дискретную. Чтобы представить информацию в дискретной форме, её следует выразить с помощью символов какого-нибудь естественного или формального языка.

Алфавит языка – конечный набор отличных друг от друга символов, используемых для представления информации. Мощность алфавита – это количество входящих в него символов.

Алфавит, содержащий два символа, называется двоичным алфавитом. Представление информации с помощью двоичного алфавита называют двоичным кодированием. Двоичное кодирование универсально, так как с его помощью может быть представлена любая информация.

1. Босова Л. Л. Информатика: 7 класс. // Босова Л. Л., Босова А. Ю. – М.: БИНОМ, 2017. – 226 с.

Теоретический материал для самостоятельного изучения

Для решения своих задач человеку часто приходится преобразовывать имеющуюся информацию из одной формы представления в другую. Например, при чтении вслух происходит преобразование информации из дискретной (текстовой) формы в непрерывную (звук). Во время диктанта на уроке русского языка, наоборот, происходит преобразование информации из непрерывной формы (голос учителя) в дискретную (записи учеников).

Информация, представленная в дискретной форме, значительно проще для передачи, хранения или автоматической обработки. Поэтому в компьютерной технике большое внимание уделяется методам преобразования информации из непрерывной формы в дискретную.

Дискретизация информации – процесс преобразования информации из непрерывной формы представления в дискретную.

Рассмотрим суть процесса дискретизации информации на примере.

На метеорологических станциях имеются самопишущие приборы для непрерывной записи атмосферного давления. Результатом их работы являются барограммы – кривые, показывающие, как изменялось давление в течение длительных промежутков времени. Одна из таких кривых, вычерченная прибором в течение семи часов проведения наблюдений, показана на рисунке 1.

На основании полученной информации можно построить таблицу, содержащую показания прибора в начале измерений и на конец каждого часа наблюдений.

Полученная таблица даёт не совсем полную картину того, как изменялось давление за время наблюдений: например, не указано самое большое значение давления, имевшее место в течение четвёртого часа наблюдений. Но если занести в таблицу значения давления, наблюдаемые каждые полчаса или 15 минут, то новая таблица будет давать более полное представление о том, как изменялось давление.

Таким образом, информацию, представленную в непрерывной форме (барограмму, кривую), мы с некоторой потерей точности преобразовали в дискретную форму (таблицу).

В дальнейшем вы познакомитесь со способами дискретного представления звуковой и графической информации.

В общем случае, чтобы представить информацию в дискретной форме, её следует выразить с помощью символов какого-нибудь естественного или формального языка. Таких языков тысячи. Каждый язык имеет свой алфавит.

Алфавит – конечный набор отличных друг от друга символов (знаков), используемых для представления информации. Мощность алфавита – это количество входящих в него символов (знаков).

Алфавит, содержащий два символа, называется двоичным алфавитом (рис. 3). Представление информации с помощью двоичного алфавита называют двоичным кодированием. Закодировав таким способом информацию, мы получим её двоичный код.

Рассмотрим в качестве символов двоичного алфавита цифры 0 и 1. Покажем, что любой алфавит можно заменить двоичным алфавитом. Прежде всего, присвоим каждому символу рассматриваемого алфавита порядковый номер. Номер представим с помощью двоичного алфавита. Полученный двоичный код будем считать кодом исходного символа.

Если мощность исходного алфавита больше двух, то для кодирования символа этого алфавита потребуется не один, а несколько двоичных символов. Другими словами, порядковому номеру каждого символа исходного алфавита будет поставлена в соответствие цепочка (последовательность) из нескольких двоичных символов. Правило получения двоичных кодов для символов алфавита мощностью больше двух можно представить схемой на рисунке.

Двоичные символы (0,1) здесь берутся в заданном алфавитном порядке и размещаются слева направо. Двоичные коды (цепочки символов) читаются сверху вниз. Все цепочки (кодовые комбинации) из двух двоичных символов позволяют представить четыре различных символа произвольного алфавита:

Цепочки из трёх двоичных символов получаются дополнением двухразрядных двоичных кодов справа символом 0 или 1. В итоге кодовых комбинаций из трёх двоичных символов получается 8 – вдвое больше, чем из двух двоичных символов:

Соответственно, четырёхразрядный двоичный код позволяет получить 16 кодовых комбинаций, пятиразрядный – 32, шестиразрядный – 64 и т. д.

Длину двоичной цепочки – количество символов в двоичном коде – называют разрядностью двоичного кода.

Обратите внимание, что:

32 = 2 ∙ 2 ∙ 2 ∙ 2 ∙ 2 и т. д.

Здесь количество кодовых комбинаций представляет собой произведение некоторого количества одинаковых множителей, равного разрядности двоичного кода.

Если количество кодовых комбинаций обозначить буквой N, а разрядность двоичного кода – буквой i, то выявленная закономерность в общем виде будет записана так:

В математике такие произведения записывают в виде:

Запись 2 i читают так: «2 в i-й степени».

Задача. Вождь племени Мульти поручил своему министру разработать двоичный код и перевести в него всю важную информацию. Двоичный код какой разрядности потребуется, если алфавит, используемый племенем Мульти, содержит 16 символов? Выпишите все кодовые комбинации.

Чтобы выписать все кодовые комбинации из четырёх 0 и 1, воспользуемся схемой на рис. 1.13: 0000, 0001, 0010, 0011, 0100, 0101, 0110, 0111, 1000, 1001, 1010, 1011, 1100, 1101, 1110, 1111.

Универсальность двоичного кодирования

В начале нашей беседы вы узнали, что информация, представленная в непрерывной форме, может быть выражена с помощью символов некоторого естественного или формального языка. В свою очередь, символы произвольного алфавита могут быть преобразованы в двоичный код. Таким образом, с помощью двоичного кода может быть представлена любая информация на естественных и формальных языках, а также изображения и звуки (рис. 6). Это и означает универсальность двоичного кодирования.

Двоичные коды широко используются в компьютерной технике, требуя только двух состояний электронной схемы – «включено» (это соответствует цифре 1) и «выключено» (это соответствует цифре 0).

Простота технической реализации – главное достоинство двоичного кодирования. Недостаток двоичного кодирования – большая длина получаемого кода.

Равномерные и неравномерные коды

Различают равномерные и неравномерные коды. Равномерные коды в кодовых комбинациях содержат одинаковое число символов, неравномерные – разное.

Выше мы рассмотрели равномерные двоичные коды.

Примером неравномерного кода может служить азбука Морзе, в которой для каждой буквы и цифры определена последовательность коротких и длинных сигналов. Так, букве Е соответствует короткий сигнал («точка»), а букве Ш – четыре длинных сигнала (четыре «тире»). Неравномерное кодирование позволяет повысить скорость передачи сообщений за счёт того, что наиболее часто встречающиеся в передаваемой информации символы имеют самые короткие кодовые комбинации.

Разбор решения заданий тренировочного модуля

№1.Тип задания: ввод с клавиатуры пропущенных элементов в тексте

Переведите десятичное число 273 в двоичную систему счисления.

Воспользуемся алгоритмом перевода целых чисел из системы с основанием p в систему с основанием q:

1. Основание новой системы счисления выразить цифрами исходной системы счисления и все последующие действия производить в исходной системе счисления.

2. Последовательно выполнять деление данного числа и получаемых целых частных на основание новой системы счисления до тех пор, пока не получим частное, меньшее делителя.

3. Полученные остатки, являющиеся цифрами числа в новой системе счисления, привести в соответствие с алфавитом новой системы счисления.

4. Составить число в новой системе счисления, записывая его, начиная с последнего остатка.

Ответ: 273₁₀= 100010001.

№2. Тип задания: единичный / множественный выбор.

Четыре буквы латинского алфавита закодированы кодами различной длины:

Источник

Итоговый тест по информатике 8 класс

Итоговый годовой тест за курс 8 класса с ответами. Состоит из блока А, включающего 20 вопросов с выбором одного вариата ответа, блока B, состоящего из 5 вопросов. Рассмотрены основные темы курса по программе Угриновича Н.Д.

1 вариант

Блок А.

При выполнении заданий этой части из четырёх предложенных вам вариантов выберите один верный.

А1. Сведения об объектах окружающего нас мира это:

А2. Информацию, изложенную на доступном для получателя языке называют:

А3. Наибольший объем информации человек получает при помощи:

А4. Двоичный код каждого символа при кодировании текстовой информации (в кодах ASCII) занимает в памяти персонального компьютера:

А5. Измерение температуры представляет собой

А6. Что такое 1 байт?

А7. Алфавит азбуки Морзе состоит:

А8. Считая, что каждый символ кодируется одним байтом, определите, чему равен информационный объем следующего высказывания Жан-Жака Руссо:
Тысячи путей ведут к заблуждению, к истине – только один.

А9. В кодировке Unicode на каждый символ отводится два байта. Определите информационный объем слова из двадцати четырех символов в этой кодировке.

А10. Метеорологическая станция ведет наблюдение за влажностью воздуха. Результатом одного измерения является целое число от 0 до 100 процентов, которое записывается при помощи минимально возможного количества бит. Станция сделала 80 измерений. Определите информационный объем результатов наблюдений.

А11. Архитектура компьютера — это

А12. Устройство ввода информации с листа бумаги называется:

А13. Какое устройство ПК предназначено для вывода информации?

А14. Постоянное запоминающее устройство служит для хранения:

А15. Драйвер — это

А16. Операционные системы входят в состав:

А17. Что такое компьютерный вирус?

А18. Большинство антивирусных программ выявляют вирусы по

А19. Что делает невозможным подключение компьютера к глобальной сети:

А20. Учебник по математике содержит информацию следующих видов:

Блок В.

B1. Установите соответствие между видами информации процессов и реализующими их действиями.

1) Звуковая	(а) Косой взгляд
2) Зрительная	(б) Запах духов
3) Тактильная	(в) Поглаживание кошки
4) Обоняние	(г) Раскат грома
5) Вкусовая	(д) Поедание конфеты

Ответ: 1г), 2а), 3в), 4б), 5д)

В2. Декодируй слова с помощью кода Цезаря.

1) НЬЩЭ	а) Азбука
2) БИВФЛБ	в) Текст
3) БМХБГЙУ	б) Класс
4) ЛМБТТ	г) Алфавит
5) УЁЛТУ	д) Мышь

Ответ: 1д), 2а), 3г), 4б), 5в)

В3. Что из перечисленного ниже относится к устройствам вывода информации с компьютера? В ответе укажите буквы.

В4. При определении соответствия для всех элементов 1-го столбца, обозначенных цифрой, указывается один элемент 2-го столбца, обозначенный буквой. При этом один элемент 2-го столбца может соответствовать нескольким элементам 1-го столбца (для заданий множественного соответствия) или не соответствовать ни одному из элементов 1-го столбца (для заданий однозначного соответствия).

Назначение	Устройство
1. Устройство ввода	а) монитор
2. Устройства вывода	б) принтер
в) дискета
г) сканер
д) дигитайзер

В5. Какое количество бит содержит слово «информатика». В ответе записать только число.

2 вариант

Блок А.

При выполнении заданий этой части из четырёх предложенных вам вариантов выберите один верный.

А1. Предмет информатики-это:

А2. Информацию, отражающую истинное положение вещей, называют

А3. Информация по способу ее восприятия подразделяется на:

А4. Двоичный код каждого символа при кодировании текстовой информации (в кодах Unicode) занимает в памяти персонального компьютера:

А5. Шантаж с использованием компрометирующих материалов есть процесс

А6. За минимальную единицу измерения количества информации принят:

А7. В какой системе счисления работает компьютер?

А8. Считая, что каждый символ кодируется одним байтом, определите, чему равен информационный объем следующего высказывания Алексея Толстого: Не ошибается тот, кто ничего не делает, хотя это и есть его основная ошибка.

А9. Считая, что каждый символ кодируется 16-ю битами, оцените информационный объем следующей пушкинской фразы в кодировке Unicode: Привычка свыше нам дана: Замена счастию она.

А10. В велокроссе участвуют 678 спортсменов. Специальное устройство регистрирует прохождение каждым из участников промежуточного финиша, записывая его номер с использованием минимально возможного количества бит, одинакового для каждого спортсмена. Каков информационный объем сообщения, записанного устройством, после того как промежуточный финиш прошли 200 велосипедистов?

А11. Корпуса персональных компьютеров бывают:

А12. Сканеры бывают:

А13. Принтеры не могут быть:

А14. Перед отключением компьютера информацию можно сохранить

А15. Программа — это:

А16. Операционная система:

А17. Какие файлы заражают макро-вирусы?

А18. На чем основано действие антивирусной программы?

А19. Устройство, производящее преобразование аналоговых сигналов в цифровые и обратно, называется:

А20. К числу основных преимуществ работы с текстом в текстовом редакторе (в сравнении с пишущей машинкой) следует назвать:

Блок В.

B1. Установите соответствие между видами информации процессов и реализующими их действиями.

1) БУКВА	а) ХПСНБ
2) ФОРМА	в) ВФЛГБ
3) БЛЕСК	б) ЧЙХСБ
4) ЦИФРА	г) ГПСПО
5) ВОРОН	д) ВМЁТЛ

Ответ: 1г, 2б, 3а, 4в, 5д

В3. Что из перечисленного ниже относится к устройствам ввода информации с компьютера? В ответе укажите буквы.

Назначение	Устройство
1. Устройство ввода	а) дисплей
2. Устройства вывода	б) принтер
в) жесткий диск
г) сканер
д) клавиатура

В5. Какое количество байт содержит слово «информация». В ответе записать только число.

3 вариант

Блок А.

При выполнении заданий этой части из четырёх предложенных вам вариантов выберите один верный.

А1.Одно из фундаментальных понятий информатики — это:

А2. Информацию, не зависящую от личного мнения или суждения, называют:

А3. Визуальную информацию несёт:

А4. На каком языке представлена информация, обрабатываемая компьютером?

А5. Перевод текста с английского языка на русский можно назвать:

А6. Расставьте знаки в следующей цепочке: 20 байт… 1000бит… 1Мбайт…1024Кбайт… 1Гбайт

B1. Установите соответствие между видами информации процессов и реализующими их действиями.

1) Звуковая	а) Слушать музыку
2) Зрительная	б) Запах дыма
3) Тактильная	в) Греть руки у костра
4) Обоняние	г) Читать книгу
5) Вкусовая	д) Есть мороженое

Ответ: 1а, 2г, 3в, 4б, 5д

В2. Закодируй слова с помощью кода Цезаря.

1) МАЧТА	а) ЛПЩЛБ
2) ВОЛОС	в) НБШУБ
3) КОШКА	б) ПУГЁУ
4) БУКЕТ	г) ВФЛЁУ
5) ОТВЕТ	д) ГПМПТ

Ответ: 1в, 2д, 3а, 4г, 5б

В3. Что из перечисленного ниже относится к носителям информации? В ответе укажите буквы.

Память	Устройство
1. Внутренняя память	а) Флеш-карта
2 Внешняя память	б) Винчестер
в) Дискета
г) Оперативная память
д) Магнитная лента
е) Постоянное запоминающее устройство

В5. Какое количество байт содержит слово «сообщение». В ответе записать только число.

4 вариант

Блок А.

При выполнении заданий этой части из четырёх предложенных вам вариантов выберите один верный.

А1. Поиск, сбор, хранение,преобразование,использование информации — это предмет изучения:

А2. Информацию, существенную и важную в настоящий момент, называют:

А3. Тактильную информацию человек получает посредством:

А4. Кодом называется:

А5. Видеозапись школьного праздника осуществляется для

А6. Чему равны 5 килобайтов?

А7. Что обозначают в ЭВМ нулём или единицей при записи двоичного кода?

А8. Считая, что каждый символ кодируется одним байтом, оцените информационный объем следующего предложения из пушкинского четверостишия:
Певец-Давид был ростом мал, Но повалил же Голиафа!

А9. Считая, что каждый символ кодируется 16-ю битами, оцените информационный объем следующего предложения:
Блажен, кто верует, тепло ему на свете!

А10. Шахматная доска состоит 8 столбцов и 8 строк. Какое минимальное количество бит потребуется для кодирования координат одного шахматного поля?

А11. Минимальный состав персонального компьютера…

А12. Какое из перечисленных устройств ввода относится к классу манипуляторов:

А13. Принтеры бывают :

А14. Для хранения программ, требующихся для запуска и тестирования компьютера при его включении, необходимо:

А15. Графическим редактором называется программа, предназначенная для …создания

А16. В операционной системе Windows собственное имя файла не может содержать символ

А17.По какому обязательному признаку название «вирус» было отнесено к компьютерным программам?

А18. Антивирусные программы – это

А19. Глобальная сеть

А20. Редактирование текста представляет собой:

Блок В.

B1. Установите соответствие между видами информации процессов и реализующими их действиями.

1) Звуковая	а) Трогать воду
2) Зрительная	б) Шум дождя
3) Тактильная	в) Запах пищи
4) Обоняние	г) Видеть салют
5) Вкусовая	д) Пить чай

Ответ: 1б, 2г, 3а, 4в, 5д

В2. Закодируй слова с помощью кода Цезаря.

1) РОКОТ	а) ЩБРЛБ
2) ШАПКА	в) ВПЛБМ
3) БОКАЛ	б) ЛМБТТ
4) КЛАСС	г) СПЛПУ
5) СТОЛБ	д) ТУПМВ

Ответ: 1г, 2а, 3в, 4б, 5д

В3. Что из перечисленного ниже относится к внутренней памяти? В ответе укажите буквы.

В4. Установить соответствие

Сеть	Описание
1. Локальная сеть	a) объединение компьютеров, расположенных на большом расстоянии друг от друга
2. Региональная сеть	б) объединение локальных сетей в пределах одной корпорации для решения общих задач
3. Корпоративная сеть	в) объединение компьютеров в пределах одного города, области, страны
4. Глобальная сеть	г) объединение компьютеров, расположенных на небольшом расстоянии друг от друга

В5. Какое количество байт содержит слово «коммуникация». В ответе записать только число.

Источник