кодом называется двоичное слово фиксированной длины

Кодирование информации

Определение:
Кодирование информации (англ. information coding) — отображение данных на кодовые слова.

Обычно в процессе кодирования информация преобразуется из формы, удобной для непосредственного использования, в форму, удобную для передачи, хранения или автоматической обработки. В более узком смысле кодированием информации называют представление информации в виде кода. Средством кодирования служит таблица соответствия знаковых систем, которая устанавливает взаимно однозначное соответствие между знаками или группами знаков двух различных знаковых систем.

Содержание

Код [ править ]

Виды кодов [ править ]

Все вышеперечисленные коды являются однозначно декодируемыми — для такого кода любое слово, составленное из кодовых слов, можно декодировать только единственным способом.

Примеры кодов [ править ]

Однозначно декодируемый код [ править ]

Определение:
Однозначно декодируемый код (англ. uniquely decodable code) — код, в котором любое слово составленное из кодовых слов можно декодировать только единственным способом.

Пусть есть код заданный следующей кодовой таблицей:

[math]a_1 \rightarrow b_1[/math]

[math]a_2 \rightarrow b_2[/math]

[math]a_k \rightarrow b_k[/math]

Код является однозначно декодируемым, только тогда, когда для любых строк, составленных из кодовых слов, вида:

Всегда выполняются равенства:

Заметим, что если среди кодовых слов будут одинаковые, то однозначно декодировать этот код мы уже не сможем.

Префиксный код [ править ]

Определение:
Префиксный код (англ. prefix code) — код, в котором никакое кодовое слово не является префиксом какого-то другого кодового слова.

Предпочтение префиксным кодам отдается из-за того, что они упрощают декодирование. Поскольку никакое кодовое слово не выступает в роли префикса другого, кодовое слово, с которого начинается файл, определяется однозначно, как и все последующие кодовые слова.

Пример кодирования [ править ]

Закодируем строку [math]abacaba[/math] :

Такой код можно однозначно разбить на слова:

[math]00\ 01\ 00\ 1\ 00\ 01\ 00[/math]

Преимущества префиксных кодов [ править ]

Недостатки префиксных кодов [ править ]

Пример неудачного декодирования [ править ]

Предположим, что последовательность [math]abacaba[/math] из примера передалась неверно и стала:

[math]c^<**>(abacaba) = 0001001\ 1\ 00100[/math]

Разобьем ее согласно словарю:

[math] 00\ 01\ 00\ 1\ 1\ 00\ 1\ 00[/math]

[math]a\quad b\quad a\ c\ c\quad a\ c\ a[/math]

Полученная строка совпадает только в битах, которые находились до ошибочного, поэтому декодирование неравномерного кода, содержащего ошибки, может дать абсолютно неверные результаты.

Не префиксный однозначно декодируемый код [ править ]

Как уже было сказано, префиксный код всегда однозначно декодируем. Обратное в общем случае неверно:

Мы можем ее однозначно декодировать, так как знаем, что слева от двойки и справа от тройки всегда стоит единица.

После декодирования получаем: [math]abbca[/math]

Источник

Информатика. 7 класс

Конспект урока

Кодирование информации. Двоичный код

Перечень вопросов, рассматриваемых в теме:

Дискретизация информации – процесс преобразования информации из непрерывной формы представления в дискретную. Чтобы представить информацию в дискретной форме, её следует выразить с помощью символов какого-нибудь естественного или формального языка.

Алфавит языка – конечный набор отличных друг от друга символов, используемых для представления информации. Мощность алфавита – это количество входящих в него символов.

Алфавит, содержащий два символа, называется двоичным алфавитом. Представление информации с помощью двоичного алфавита называют двоичным кодированием. Двоичное кодирование универсально, так как с его помощью может быть представлена любая информация.

1. Босова Л. Л. Информатика: 7 класс. // Босова Л. Л., Босова А. Ю. – М.: БИНОМ, 2017. – 226 с.

Теоретический материал для самостоятельного изучения

Для решения своих задач человеку часто приходится преобразовывать имеющуюся информацию из одной формы представления в другую. Например, при чтении вслух происходит преобразование информации из дискретной (текстовой) формы в непрерывную (звук). Во время диктанта на уроке русского языка, наоборот, происходит преобразование информации из непрерывной формы (голос учителя) в дискретную (записи учеников).

Информация, представленная в дискретной форме, значительно проще для передачи, хранения или автоматической обработки. Поэтому в компьютерной технике большое внимание уделяется методам преобразования информации из непрерывной формы в дискретную.

Дискретизация информации – процесс преобразования информации из непрерывной формы представления в дискретную.

Рассмотрим суть процесса дискретизации информации на примере.

На метеорологических станциях имеются самопишущие приборы для непрерывной записи атмосферного давления. Результатом их работы являются барограммы – кривые, показывающие, как изменялось давление в течение длительных промежутков времени. Одна из таких кривых, вычерченная прибором в течение семи часов проведения наблюдений, показана на рисунке 1.

На основании полученной информации можно построить таблицу, содержащую показания прибора в начале измерений и на конец каждого часа наблюдений.

кодом называется двоичное слово фиксированной длины

Полученная таблица даёт не совсем полную картину того, как изменялось давление за время наблюдений: например, не указано самое большое значение давления, имевшее место в течение четвёртого часа наблюдений. Но если занести в таблицу значения давления, наблюдаемые каждые полчаса или 15 минут, то новая таблица будет давать более полное представление о том, как изменялось давление.

Таким образом, информацию, представленную в непрерывной форме (барограмму, кривую), мы с некоторой потерей точности преобразовали в дискретную форму (таблицу).

В дальнейшем вы познакомитесь со способами дискретного представления звуковой и графической информации.

В общем случае, чтобы представить информацию в дискретной форме, её следует выразить с помощью символов какого-нибудь естественного или формального языка. Таких языков тысячи. Каждый язык имеет свой алфавит.

Алфавит – конечный набор отличных друг от друга символов (знаков), используемых для представления информации. Мощность алфавита – это количество входящих в него символов (знаков).

Алфавит, содержащий два символа, называется двоичным алфавитом (рис. 3). Представление информации с помощью двоичного алфавита называют двоичным кодированием. Закодировав таким способом информацию, мы получим её двоичный код.

Рассмотрим в качестве символов двоичного алфавита цифры 0 и 1. Покажем, что любой алфавит можно заменить двоичным алфавитом. Прежде всего, присвоим каждому символу рассматриваемого алфавита порядковый номер. Номер представим с помощью двоичного алфавита. Полученный двоичный код будем считать кодом исходного символа.

кодом называется двоичное слово фиксированной длины

Если мощность исходного алфавита больше двух, то для кодирования символа этого алфавита потребуется не один, а несколько двоичных символов. Другими словами, порядковому номеру каждого символа исходного алфавита будет поставлена в соответствие цепочка (последовательность) из нескольких двоичных символов. Правило получения двоичных кодов для символов алфавита мощностью больше двух можно представить схемой на рисунке.

кодом называется двоичное слово фиксированной длины

Двоичные символы (0,1) здесь берутся в заданном алфавитном порядке и размещаются слева направо. Двоичные коды (цепочки символов) читаются сверху вниз. Все цепочки (кодовые комбинации) из двух двоичных символов позволяют представить четыре различных символа произвольного алфавита:

кодом называется двоичное слово фиксированной длины

Цепочки из трёх двоичных символов получаются дополнением двухразрядных двоичных кодов справа символом 0 или 1. В итоге кодовых комбинаций из трёх двоичных символов получается 8 – вдвое больше, чем из двух двоичных символов:

кодом называется двоичное слово фиксированной длины

Соответственно, четырёхразрядный двоичный код позволяет получить 16 кодовых комбинаций, пятиразрядный – 32, шестиразрядный – 64 и т. д.

Длину двоичной цепочки – количество символов в двоичном коде – называют разрядностью двоичного кода.

кодом называется двоичное слово фиксированной длины

Обратите внимание, что:

32 = 2 ∙ 2 ∙ 2 ∙ 2 ∙ 2 и т. д.

Здесь количество кодовых комбинаций представляет собой произведение некоторого количества одинаковых множителей, равного разрядности двоичного кода.

Если количество кодовых комбинаций обозначить буквой N, а разрядность двоичного кода – буквой i, то выявленная закономерность в общем виде будет записана так:

кодом называется двоичное слово фиксированной длины

В математике такие произведения записывают в виде:

Запись 2 i читают так: «2 в i-й степени».

Задача. Вождь племени Мульти поручил своему министру разработать двоичный код и перевести в него всю важную информацию. Двоичный код какой разрядности потребуется, если алфавит, используемый племенем Мульти, содержит 16 символов? Выпишите все кодовые комбинации.

Чтобы выписать все кодовые комбинации из четырёх 0 и 1, воспользуемся схемой на рис. 1.13: 0000, 0001, 0010, 0011, 0100, 0101, 0110, 0111, 1000, 1001, 1010, 1011, 1100, 1101, 1110, 1111.

Универсальность двоичного кодирования

В начале нашей беседы вы узнали, что информация, представленная в непрерывной форме, может быть выражена с помощью символов некоторого естественного или формального языка. В свою очередь, символы произвольного алфавита могут быть преобразованы в двоичный код. Таким образом, с помощью двоичного кода может быть представлена любая информация на естественных и формальных языках, а также изображения и звуки (рис. 6). Это и означает универсальность двоичного кодирования.

кодом называется двоичное слово фиксированной длины

Двоичные коды широко используются в компьютерной технике, требуя только двух состояний электронной схемы – «включено» (это соответствует цифре 1) и «выключено» (это соответствует цифре 0).

Простота технической реализации – главное достоинство двоичного кодирования. Недостаток двоичного кодирования – большая длина получаемого кода.

Равномерные и неравномерные коды

Различают равномерные и неравномерные коды. Равномерные коды в кодовых комбинациях содержат одинаковое число символов, неравномерные – разное.

Выше мы рассмотрели равномерные двоичные коды.

Примером неравномерного кода может служить азбука Морзе, в которой для каждой буквы и цифры определена последовательность коротких и длинных сигналов. Так, букве Е соответствует короткий сигнал («точка»), а букве Ш – четыре длинных сигнала (четыре «тире»). Неравномерное кодирование позволяет повысить скорость передачи сообщений за счёт того, что наиболее часто встречающиеся в передаваемой информации символы имеют самые короткие кодовые комбинации.

Разбор решения заданий тренировочного модуля

№1.Тип задания: ввод с клавиатуры пропущенных элементов в тексте

Переведите десятичное число 273 в двоичную систему счисления.

Воспользуемся алгоритмом перевода целых чисел из системы с основанием p в систему с основанием q:

1. Основание новой системы счисления выразить цифрами исходной системы счисления и все последующие действия производить в исходной системе счисления.

2. Последовательно выполнять деление данного числа и получаемых целых частных на основание новой системы счисления до тех пор, пока не получим частное, меньшее делителя.

3. Полученные остатки, являющиеся цифрами числа в новой системе счисления, привести в соответствие с алфавитом новой системы счисления.

4. Составить число в новой системе счисления, записывая его, начиная с последнего остатка.

кодом называется двоичное слово фиксированной длины

Ответ: 27310= 100010001.

№2. Тип задания: единичный / множественный выбор.

Четыре буквы латинского алфавита закодированы кодами различной длины:

Источник

Итоговый тест по информатике 8 класс

Итоговый годовой тест за курс 8 класса с ответами. Состоит из блока А, включающего 20 вопросов с выбором одного вариата ответа, блока B, состоящего из 5 вопросов. Рассмотрены основные темы курса по программе Угриновича Н.Д.

1 вариант

Блок А.

При выполнении заданий этой части из четырёх предложенных вам вариантов выберите один верный.

А1. Сведения об объектах окружающего нас мира это:

А2. Информацию, изложенную на доступном для получателя языке называют:

А3. Наибольший объем информации человек получает при помощи:

А4. Двоичный код каждого символа при кодировании текстовой информации (в кодах ASCII) занимает в памяти персонального компьютера:

А5. Измерение температуры представляет собой

А6. Что такое 1 байт?

А7. Алфавит азбуки Морзе состоит:

А8. Считая, что каждый символ кодируется одним байтом, определите, чему равен информационный объем следующего высказывания Жан-Жака Руссо:
Тысячи путей ведут к заблуждению, к истине – только один.

А9. В кодировке Unicode на каждый символ отводится два байта. Определите информационный объем слова из двадцати четырех символов в этой кодировке.

А10. Метеорологическая станция ведет наблюдение за влажностью воздуха. Результатом одного измерения является целое число от 0 до 100 процентов, которое записывается при помощи минимально возможного количества бит. Станция сделала 80 измерений. Определите информационный объем результатов наблюдений.

А11. Архитектура компьютера — это

А12. Устройство ввода информации с листа бумаги называется:

А13. Какое устройство ПК предназначено для вывода информации?

А14. Постоянное запоминающее устройство служит для хранения:

А15. Драйвер — это

А16. Операционные системы входят в состав:

А17. Что такое компьютерный вирус?

А18. Большинство антивирусных программ выявляют вирусы по

А19. Что делает невозможным подключение компьютера к глобальной сети:

А20. Учебник по математике содержит информацию следующих видов:

Блок В.

B1. Установите соответствие между видами информации процессов и реализующими их действиями.

1) Звуковая(а) Косой взгляд
2) Зрительная(б) Запах духов
3) Тактильная(в) Поглаживание кошки
4) Обоняние(г) Раскат грома
5) Вкусовая(д) Поедание конфеты

Ответ: 1г), 2а), 3в), 4б), 5д)

В2. Декодируй слова с помощью кода Цезаря.

1) НЬЩЭа) Азбука
2) БИВФЛБв) Текст
3) БМХБГЙУб) Класс
4) ЛМБТТг) Алфавит
5) УЁЛТУд) Мышь

Ответ: 1д), 2а), 3г), 4б), 5в)

В3. Что из перечисленного ниже относится к устройствам вывода информации с компьютера? В ответе укажите буквы.

В4. При определении соответствия для всех элементов 1-го столбца, обозначенных цифрой, указывается один элемент 2-го столбца, обозначенный буквой. При этом один элемент 2-го столбца может соответствовать нескольким элементам 1-го столбца (для заданий множественного соответствия) или не соответствовать ни одному из элементов 1-го столбца (для заданий однозначного соответствия).

НазначениеУстройство
1. Устройство вводаа) монитор
2. Устройства выводаб) принтер
в) дискета
г) сканер
д) дигитайзер

В5. Какое количество бит содержит слово «информатика». В ответе записать только число.

2 вариант

Блок А.

При выполнении заданий этой части из четырёх предложенных вам вариантов выберите один верный.

А1. Предмет информатики-это:

А2. Информацию, отражающую истинное положение вещей, называют

А3. Информация по способу ее восприятия подразделяется на:

А4. Двоичный код каждого символа при кодировании текстовой информации (в кодах Unicode) занимает в памяти персонального компьютера:

А5. Шантаж с использованием компрометирующих материалов есть процесс

А6. За минимальную единицу измерения количества информации принят:

А7. В какой системе счисления работает компьютер?

А8. Считая, что каждый символ кодируется одним байтом, определите, чему равен информационный объем следующего высказывания Алексея Толстого: Не ошибается тот, кто ничего не делает, хотя это и есть его основная ошибка.

А9. Считая, что каждый символ кодируется 16-ю битами, оцените информационный объем следующей пушкинской фразы в кодировке Unicode: Привычка свыше нам дана: Замена счастию она.

А10. В велокроссе участвуют 678 спортсменов. Специальное устройство регистрирует прохождение каждым из участников промежуточного финиша, записывая его номер с использованием минимально возможного количества бит, одинакового для каждого спортсмена. Каков информационный объем сообщения, записанного устройством, после того как промежуточный финиш прошли 200 велосипедистов?

А11. Корпуса персональных компьютеров бывают:

А12. Сканеры бывают:

А13. Принтеры не могут быть:

А14. Перед отключением компьютера информацию можно сохранить

А15. Программа — это:

А16. Операционная система:

А17. Какие файлы заражают макро-вирусы?

А18. На чем основано действие антивирусной программы?

А19. Устройство, производящее преобразование аналоговых сигналов в цифровые и обратно, называется:

А20. К числу основных преимуществ работы с текстом в текстовом редакторе (в сравнении с пишущей машинкой) следует назвать:

Блок В.

B1. Установите соответствие между видами информации процессов и реализующими их действиями.

1) БУКВАа) ХПСНБ
2) ФОРМАв) ВФЛГБ
3) БЛЕСКб) ЧЙХСБ
4) ЦИФРАг) ГПСПО
5) ВОРОНд) ВМЁТЛ

Ответ: 1г, 2б, 3а, 4в, 5д

В3. Что из перечисленного ниже относится к устройствам ввода информации с компьютера? В ответе укажите буквы.

В4. При определении соответствия для всех элементов 1-го столбца, обозначенных цифрой, указывается один элемент 2-го столбца, обозначенный буквой. При этом один элемент 2-го столбца может соответствовать нескольким элементам 1-го столбца (для заданий множественного соответствия) или не соответствовать ни одному из элементов 1-го столбца (для заданий однозначного соответствия).

НазначениеУстройство
1. Устройство вводаа) дисплей
2. Устройства выводаб) принтер
в) жесткий диск
г) сканер
д) клавиатура

В5. Какое количество байт содержит слово «информация». В ответе записать только число.

3 вариант

Блок А.

При выполнении заданий этой части из четырёх предложенных вам вариантов выберите один верный.

А1.Одно из фундаментальных понятий информатики — это:

А2. Информацию, не зависящую от личного мнения или суждения, называют:

А3. Визуальную информацию несёт:

А4. На каком языке представлена информация, обрабатываемая компьютером?

А5. Перевод текста с английского языка на русский можно назвать:

А6. Расставьте знаки в следующей цепочке: 20 байт… 1000бит… 1Мбайт…1024Кбайт… 1Гбайт

B1. Установите соответствие между видами информации процессов и реализующими их действиями.

1) Звуковаяа) Слушать музыку
2) Зрительнаяб) Запах дыма
3) Тактильнаяв) Греть руки у костра
4) Обоняниег) Читать книгу
5) Вкусоваяд) Есть мороженое

Ответ: 1а, 2г, 3в, 4б, 5д

В2. Закодируй слова с помощью кода Цезаря.

1) МАЧТАа) ЛПЩЛБ
2) ВОЛОСв) НБШУБ
3) КОШКАб) ПУГЁУ
4) БУКЕТг) ВФЛЁУ
5) ОТВЕТд) ГПМПТ

Ответ: 1в, 2д, 3а, 4г, 5б

В3. Что из перечисленного ниже относится к носителям информации? В ответе укажите буквы.

В4. При определении соответствия для всех элементов 1-го столбца, обозначенных цифрой, указывается один элемент 2-го столбца, обозначенный буквой. При этом один элемент 2-го столбца может соответствовать нескольким элементам 1-го столбца (для заданий множественного соответствия) или не соответствовать ни одному из элементов 1-го столбца (для заданий однозначного соответствия).

ПамятьУстройство
1. Внутренняя памятьа) Флеш-карта
2 Внешняя памятьб) Винчестер
в) Дискета
г) Оперативная память
д) Магнитная лента
е) Постоянное запоминающее устройство

В5. Какое количество байт содержит слово «сообщение». В ответе записать только число.

4 вариант

Блок А.

При выполнении заданий этой части из четырёх предложенных вам вариантов выберите один верный.

А1. Поиск, сбор, хранение,преобразование,использование информации — это предмет изучения:

А2. Информацию, существенную и важную в настоящий момент, называют:

А3. Тактильную информацию человек получает посредством:

А4. Кодом называется:

А5. Видеозапись школьного праздника осуществляется для

А6. Чему равны 5 килобайтов?

А7. Что обозначают в ЭВМ нулём или единицей при записи двоичного кода?

А8. Считая, что каждый символ кодируется одним байтом, оцените информационный объем следующего предложения из пушкинского четверостишия:
Певец-Давид был ростом мал, Но повалил же Голиафа!

А9. Считая, что каждый символ кодируется 16-ю битами, оцените информационный объем следующего предложения:
Блажен, кто верует, тепло ему на свете!

А10. Шахматная доска состоит 8 столбцов и 8 строк. Какое минимальное количество бит потребуется для кодирования координат одного шахматного поля?

А11. Минимальный состав персонального компьютера…

А12. Какое из перечисленных устройств ввода относится к классу манипуляторов:

А13. Принтеры бывают :

А14. Для хранения программ, требующихся для запуска и тестирования компьютера при его включении, необходимо:

А15. Графическим редактором называется программа, предназначенная для …создания

А16. В операционной системе Windows собственное имя файла не может содержать символ

А17.По какому обязательному признаку название «вирус» было отнесено к компьютерным программам?

А18. Антивирусные программы – это

А19. Глобальная сеть

А20. Редактирование текста представляет собой:

Блок В.

B1. Установите соответствие между видами информации процессов и реализующими их действиями.

1) Звуковаяа) Трогать воду
2) Зрительнаяб) Шум дождя
3) Тактильнаяв) Запах пищи
4) Обоняниег) Видеть салют
5) Вкусоваяд) Пить чай

Ответ: 1б, 2г, 3а, 4в, 5д

В2. Закодируй слова с помощью кода Цезаря.

1) РОКОТа) ЩБРЛБ
2) ШАПКАв) ВПЛБМ
3) БОКАЛб) ЛМБТТ
4) КЛАССг) СПЛПУ
5) СТОЛБд) ТУПМВ

Ответ: 1г, 2а, 3в, 4б, 5д

В3. Что из перечисленного ниже относится к внутренней памяти? В ответе укажите буквы.

В4. Установить соответствие

СетьОписание
1. Локальная сетьa) объединение компьютеров, расположенных на большом расстоянии друг от друга
2. Региональная сетьб) объединение локальных сетей в пределах одной корпорации для решения общих задач
3. Корпоративная сетьв) объединение компьютеров в пределах одного города, области, страны
4. Глобальная сетьг) объединение компьютеров, расположенных на небольшом расстоянии друг от друга

В5. Какое количество байт содержит слово «коммуникация». В ответе записать только число.

Источник

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *