кодом называется двоичное слово фиксированной длины
Кодирование информации
Определение: |
Кодирование информации (англ. information coding) — отображение данных на кодовые слова. |
Обычно в процессе кодирования информация преобразуется из формы, удобной для непосредственного использования, в форму, удобную для передачи, хранения или автоматической обработки. В более узком смысле кодированием информации называют представление информации в виде кода. Средством кодирования служит таблица соответствия знаковых систем, которая устанавливает взаимно однозначное соответствие между знаками или группами знаков двух различных знаковых систем.
Содержание
Код [ править ]
Виды кодов [ править ]
Все вышеперечисленные коды являются однозначно декодируемыми — для такого кода любое слово, составленное из кодовых слов, можно декодировать только единственным способом.
Примеры кодов [ править ]
Однозначно декодируемый код [ править ]
Определение: |
Однозначно декодируемый код (англ. uniquely decodable code) — код, в котором любое слово составленное из кодовых слов можно декодировать только единственным способом. |
Пусть есть код заданный следующей кодовой таблицей:
[math]a_1 \rightarrow b_1[/math]
[math]a_2 \rightarrow b_2[/math]
[math]a_k \rightarrow b_k[/math]
Код является однозначно декодируемым, только тогда, когда для любых строк, составленных из кодовых слов, вида:
Всегда выполняются равенства:
Заметим, что если среди кодовых слов будут одинаковые, то однозначно декодировать этот код мы уже не сможем.
Префиксный код [ править ]
Определение: |
Префиксный код (англ. prefix code) — код, в котором никакое кодовое слово не является префиксом какого-то другого кодового слова. |
Предпочтение префиксным кодам отдается из-за того, что они упрощают декодирование. Поскольку никакое кодовое слово не выступает в роли префикса другого, кодовое слово, с которого начинается файл, определяется однозначно, как и все последующие кодовые слова.
Пример кодирования [ править ]
Закодируем строку [math]abacaba[/math] :
Такой код можно однозначно разбить на слова:
[math]00\ 01\ 00\ 1\ 00\ 01\ 00[/math]
Преимущества префиксных кодов [ править ]
Недостатки префиксных кодов [ править ]
Пример неудачного декодирования [ править ]
Предположим, что последовательность [math]abacaba[/math] из примера передалась неверно и стала:
[math]c^<**>(abacaba) = 0001001\ 1\ 00100[/math]
Разобьем ее согласно словарю:
[math] 00\ 01\ 00\ 1\ 1\ 00\ 1\ 00[/math]
[math]a\quad b\quad a\ c\ c\quad a\ c\ a[/math]
Полученная строка совпадает только в битах, которые находились до ошибочного, поэтому декодирование неравномерного кода, содержащего ошибки, может дать абсолютно неверные результаты.
Не префиксный однозначно декодируемый код [ править ]
Как уже было сказано, префиксный код всегда однозначно декодируем. Обратное в общем случае неверно:
Мы можем ее однозначно декодировать, так как знаем, что слева от двойки и справа от тройки всегда стоит единица.
После декодирования получаем: [math]abbca[/math]
Информатика. 7 класс
Конспект урока
Кодирование информации. Двоичный код
Перечень вопросов, рассматриваемых в теме:
Дискретизация информации – процесс преобразования информации из непрерывной формы представления в дискретную. Чтобы представить информацию в дискретной форме, её следует выразить с помощью символов какого-нибудь естественного или формального языка.
Алфавит языка – конечный набор отличных друг от друга символов, используемых для представления информации. Мощность алфавита – это количество входящих в него символов.
Алфавит, содержащий два символа, называется двоичным алфавитом. Представление информации с помощью двоичного алфавита называют двоичным кодированием. Двоичное кодирование универсально, так как с его помощью может быть представлена любая информация.
1. Босова Л. Л. Информатика: 7 класс. // Босова Л. Л., Босова А. Ю. – М.: БИНОМ, 2017. – 226 с.
Теоретический материал для самостоятельного изучения
Для решения своих задач человеку часто приходится преобразовывать имеющуюся информацию из одной формы представления в другую. Например, при чтении вслух происходит преобразование информации из дискретной (текстовой) формы в непрерывную (звук). Во время диктанта на уроке русского языка, наоборот, происходит преобразование информации из непрерывной формы (голос учителя) в дискретную (записи учеников).
Информация, представленная в дискретной форме, значительно проще для передачи, хранения или автоматической обработки. Поэтому в компьютерной технике большое внимание уделяется методам преобразования информации из непрерывной формы в дискретную.
Дискретизация информации – процесс преобразования информации из непрерывной формы представления в дискретную.
Рассмотрим суть процесса дискретизации информации на примере.
На метеорологических станциях имеются самопишущие приборы для непрерывной записи атмосферного давления. Результатом их работы являются барограммы – кривые, показывающие, как изменялось давление в течение длительных промежутков времени. Одна из таких кривых, вычерченная прибором в течение семи часов проведения наблюдений, показана на рисунке 1.
На основании полученной информации можно построить таблицу, содержащую показания прибора в начале измерений и на конец каждого часа наблюдений.
Полученная таблица даёт не совсем полную картину того, как изменялось давление за время наблюдений: например, не указано самое большое значение давления, имевшее место в течение четвёртого часа наблюдений. Но если занести в таблицу значения давления, наблюдаемые каждые полчаса или 15 минут, то новая таблица будет давать более полное представление о том, как изменялось давление.
Таким образом, информацию, представленную в непрерывной форме (барограмму, кривую), мы с некоторой потерей точности преобразовали в дискретную форму (таблицу).
В дальнейшем вы познакомитесь со способами дискретного представления звуковой и графической информации.
В общем случае, чтобы представить информацию в дискретной форме, её следует выразить с помощью символов какого-нибудь естественного или формального языка. Таких языков тысячи. Каждый язык имеет свой алфавит.
Алфавит – конечный набор отличных друг от друга символов (знаков), используемых для представления информации. Мощность алфавита – это количество входящих в него символов (знаков).
Алфавит, содержащий два символа, называется двоичным алфавитом (рис. 3). Представление информации с помощью двоичного алфавита называют двоичным кодированием. Закодировав таким способом информацию, мы получим её двоичный код.
Рассмотрим в качестве символов двоичного алфавита цифры 0 и 1. Покажем, что любой алфавит можно заменить двоичным алфавитом. Прежде всего, присвоим каждому символу рассматриваемого алфавита порядковый номер. Номер представим с помощью двоичного алфавита. Полученный двоичный код будем считать кодом исходного символа.
Если мощность исходного алфавита больше двух, то для кодирования символа этого алфавита потребуется не один, а несколько двоичных символов. Другими словами, порядковому номеру каждого символа исходного алфавита будет поставлена в соответствие цепочка (последовательность) из нескольких двоичных символов. Правило получения двоичных кодов для символов алфавита мощностью больше двух можно представить схемой на рисунке.
Двоичные символы (0,1) здесь берутся в заданном алфавитном порядке и размещаются слева направо. Двоичные коды (цепочки символов) читаются сверху вниз. Все цепочки (кодовые комбинации) из двух двоичных символов позволяют представить четыре различных символа произвольного алфавита:
Цепочки из трёх двоичных символов получаются дополнением двухразрядных двоичных кодов справа символом 0 или 1. В итоге кодовых комбинаций из трёх двоичных символов получается 8 – вдвое больше, чем из двух двоичных символов:
Соответственно, четырёхразрядный двоичный код позволяет получить 16 кодовых комбинаций, пятиразрядный – 32, шестиразрядный – 64 и т. д.
Длину двоичной цепочки – количество символов в двоичном коде – называют разрядностью двоичного кода.
Обратите внимание, что:
32 = 2 ∙ 2 ∙ 2 ∙ 2 ∙ 2 и т. д.
Здесь количество кодовых комбинаций представляет собой произведение некоторого количества одинаковых множителей, равного разрядности двоичного кода.
Если количество кодовых комбинаций обозначить буквой N, а разрядность двоичного кода – буквой i, то выявленная закономерность в общем виде будет записана так:
В математике такие произведения записывают в виде:
Запись 2 i читают так: «2 в i-й степени».
Задача. Вождь племени Мульти поручил своему министру разработать двоичный код и перевести в него всю важную информацию. Двоичный код какой разрядности потребуется, если алфавит, используемый племенем Мульти, содержит 16 символов? Выпишите все кодовые комбинации.
Чтобы выписать все кодовые комбинации из четырёх 0 и 1, воспользуемся схемой на рис. 1.13: 0000, 0001, 0010, 0011, 0100, 0101, 0110, 0111, 1000, 1001, 1010, 1011, 1100, 1101, 1110, 1111.
Универсальность двоичного кодирования
В начале нашей беседы вы узнали, что информация, представленная в непрерывной форме, может быть выражена с помощью символов некоторого естественного или формального языка. В свою очередь, символы произвольного алфавита могут быть преобразованы в двоичный код. Таким образом, с помощью двоичного кода может быть представлена любая информация на естественных и формальных языках, а также изображения и звуки (рис. 6). Это и означает универсальность двоичного кодирования.
Двоичные коды широко используются в компьютерной технике, требуя только двух состояний электронной схемы – «включено» (это соответствует цифре 1) и «выключено» (это соответствует цифре 0).
Простота технической реализации – главное достоинство двоичного кодирования. Недостаток двоичного кодирования – большая длина получаемого кода.
Равномерные и неравномерные коды
Различают равномерные и неравномерные коды. Равномерные коды в кодовых комбинациях содержат одинаковое число символов, неравномерные – разное.
Выше мы рассмотрели равномерные двоичные коды.
Примером неравномерного кода может служить азбука Морзе, в которой для каждой буквы и цифры определена последовательность коротких и длинных сигналов. Так, букве Е соответствует короткий сигнал («точка»), а букве Ш – четыре длинных сигнала (четыре «тире»). Неравномерное кодирование позволяет повысить скорость передачи сообщений за счёт того, что наиболее часто встречающиеся в передаваемой информации символы имеют самые короткие кодовые комбинации.
Разбор решения заданий тренировочного модуля
№1.Тип задания: ввод с клавиатуры пропущенных элементов в тексте
Переведите десятичное число 273 в двоичную систему счисления.
Воспользуемся алгоритмом перевода целых чисел из системы с основанием p в систему с основанием q:
1. Основание новой системы счисления выразить цифрами исходной системы счисления и все последующие действия производить в исходной системе счисления.
2. Последовательно выполнять деление данного числа и получаемых целых частных на основание новой системы счисления до тех пор, пока не получим частное, меньшее делителя.
3. Полученные остатки, являющиеся цифрами числа в новой системе счисления, привести в соответствие с алфавитом новой системы счисления.
4. Составить число в новой системе счисления, записывая его, начиная с последнего остатка.
Ответ: 27310= 100010001.
№2. Тип задания: единичный / множественный выбор.
Четыре буквы латинского алфавита закодированы кодами различной длины:
Итоговый тест по информатике 8 класс
Итоговый годовой тест за курс 8 класса с ответами. Состоит из блока А, включающего 20 вопросов с выбором одного вариата ответа, блока B, состоящего из 5 вопросов. Рассмотрены основные темы курса по программе Угриновича Н.Д.
1 вариант
Блок А.
При выполнении заданий этой части из четырёх предложенных вам вариантов выберите один верный.
А1. Сведения об объектах окружающего нас мира это:
А2. Информацию, изложенную на доступном для получателя языке называют:
А3. Наибольший объем информации человек получает при помощи:
А4. Двоичный код каждого символа при кодировании текстовой информации (в кодах ASCII) занимает в памяти персонального компьютера:
А5. Измерение температуры представляет собой
А6. Что такое 1 байт?
А7. Алфавит азбуки Морзе состоит:
А8. Считая, что каждый символ кодируется одним байтом, определите, чему равен информационный объем следующего высказывания Жан-Жака Руссо:
Тысячи путей ведут к заблуждению, к истине – только один.
А9. В кодировке Unicode на каждый символ отводится два байта. Определите информационный объем слова из двадцати четырех символов в этой кодировке.
А10. Метеорологическая станция ведет наблюдение за влажностью воздуха. Результатом одного измерения является целое число от 0 до 100 процентов, которое записывается при помощи минимально возможного количества бит. Станция сделала 80 измерений. Определите информационный объем результатов наблюдений.
А11. Архитектура компьютера — это
А12. Устройство ввода информации с листа бумаги называется:
А13. Какое устройство ПК предназначено для вывода информации?
А14. Постоянное запоминающее устройство служит для хранения:
А15. Драйвер — это
А16. Операционные системы входят в состав:
А17. Что такое компьютерный вирус?
А18. Большинство антивирусных программ выявляют вирусы по
А19. Что делает невозможным подключение компьютера к глобальной сети:
А20. Учебник по математике содержит информацию следующих видов:
Блок В.
B1. Установите соответствие между видами информации процессов и реализующими их действиями.
1) Звуковая | (а) Косой взгляд |
2) Зрительная | (б) Запах духов |
3) Тактильная | (в) Поглаживание кошки |
4) Обоняние | (г) Раскат грома |
5) Вкусовая | (д) Поедание конфеты |
Ответ: 1г), 2а), 3в), 4б), 5д)
В2. Декодируй слова с помощью кода Цезаря.
1) НЬЩЭ | а) Азбука |
2) БИВФЛБ | в) Текст |
3) БМХБГЙУ | б) Класс |
4) ЛМБТТ | г) Алфавит |
5) УЁЛТУ | д) Мышь |
Ответ: 1д), 2а), 3г), 4б), 5в)
В3. Что из перечисленного ниже относится к устройствам вывода информации с компьютера? В ответе укажите буквы.
В4. При определении соответствия для всех элементов 1-го столбца, обозначенных цифрой, указывается один элемент 2-го столбца, обозначенный буквой. При этом один элемент 2-го столбца может соответствовать нескольким элементам 1-го столбца (для заданий множественного соответствия) или не соответствовать ни одному из элементов 1-го столбца (для заданий однозначного соответствия).
Назначение | Устройство |
1. Устройство ввода | а) монитор |
2. Устройства вывода | б) принтер |
в) дискета | |
г) сканер | |
д) дигитайзер |
В5. Какое количество бит содержит слово «информатика». В ответе записать только число.
2 вариант
Блок А.
При выполнении заданий этой части из четырёх предложенных вам вариантов выберите один верный.
А1. Предмет информатики-это:
А2. Информацию, отражающую истинное положение вещей, называют
А3. Информация по способу ее восприятия подразделяется на:
А4. Двоичный код каждого символа при кодировании текстовой информации (в кодах Unicode) занимает в памяти персонального компьютера:
А5. Шантаж с использованием компрометирующих материалов есть процесс
А6. За минимальную единицу измерения количества информации принят:
А7. В какой системе счисления работает компьютер?
А8. Считая, что каждый символ кодируется одним байтом, определите, чему равен информационный объем следующего высказывания Алексея Толстого: Не ошибается тот, кто ничего не делает, хотя это и есть его основная ошибка.
А9. Считая, что каждый символ кодируется 16-ю битами, оцените информационный объем следующей пушкинской фразы в кодировке Unicode: Привычка свыше нам дана: Замена счастию она.
А10. В велокроссе участвуют 678 спортсменов. Специальное устройство регистрирует прохождение каждым из участников промежуточного финиша, записывая его номер с использованием минимально возможного количества бит, одинакового для каждого спортсмена. Каков информационный объем сообщения, записанного устройством, после того как промежуточный финиш прошли 200 велосипедистов?
А11. Корпуса персональных компьютеров бывают:
А12. Сканеры бывают:
А13. Принтеры не могут быть:
А14. Перед отключением компьютера информацию можно сохранить
А15. Программа — это:
А16. Операционная система:
А17. Какие файлы заражают макро-вирусы?
А18. На чем основано действие антивирусной программы?
А19. Устройство, производящее преобразование аналоговых сигналов в цифровые и обратно, называется:
А20. К числу основных преимуществ работы с текстом в текстовом редакторе (в сравнении с пишущей машинкой) следует назвать:
Блок В.
B1. Установите соответствие между видами информации процессов и реализующими их действиями.
1) БУКВА | а) ХПСНБ |
2) ФОРМА | в) ВФЛГБ |
3) БЛЕСК | б) ЧЙХСБ |
4) ЦИФРА | г) ГПСПО |
5) ВОРОН | д) ВМЁТЛ |
Ответ: 1г, 2б, 3а, 4в, 5д
В3. Что из перечисленного ниже относится к устройствам ввода информации с компьютера? В ответе укажите буквы.
В4. При определении соответствия для всех элементов 1-го столбца, обозначенных цифрой, указывается один элемент 2-го столбца, обозначенный буквой. При этом один элемент 2-го столбца может соответствовать нескольким элементам 1-го столбца (для заданий множественного соответствия) или не соответствовать ни одному из элементов 1-го столбца (для заданий однозначного соответствия).
Назначение | Устройство |
1. Устройство ввода | а) дисплей |
2. Устройства вывода | б) принтер |
в) жесткий диск | |
г) сканер | |
д) клавиатура |
В5. Какое количество байт содержит слово «информация». В ответе записать только число.
3 вариант
Блок А.
При выполнении заданий этой части из четырёх предложенных вам вариантов выберите один верный.
А1.Одно из фундаментальных понятий информатики — это:
А2. Информацию, не зависящую от личного мнения или суждения, называют:
А3. Визуальную информацию несёт:
А4. На каком языке представлена информация, обрабатываемая компьютером?
А5. Перевод текста с английского языка на русский можно назвать:
А6. Расставьте знаки в следующей цепочке: 20 байт… 1000бит… 1Мбайт…1024Кбайт… 1Гбайт
B1. Установите соответствие между видами информации процессов и реализующими их действиями.
1) Звуковая | а) Слушать музыку |
2) Зрительная | б) Запах дыма |
3) Тактильная | в) Греть руки у костра |
4) Обоняние | г) Читать книгу |
5) Вкусовая | д) Есть мороженое |
Ответ: 1а, 2г, 3в, 4б, 5д
В2. Закодируй слова с помощью кода Цезаря.
1) МАЧТА | а) ЛПЩЛБ |
2) ВОЛОС | в) НБШУБ |
3) КОШКА | б) ПУГЁУ |
4) БУКЕТ | г) ВФЛЁУ |
5) ОТВЕТ | д) ГПМПТ |
Ответ: 1в, 2д, 3а, 4г, 5б
В3. Что из перечисленного ниже относится к носителям информации? В ответе укажите буквы.
В4. При определении соответствия для всех элементов 1-го столбца, обозначенных цифрой, указывается один элемент 2-го столбца, обозначенный буквой. При этом один элемент 2-го столбца может соответствовать нескольким элементам 1-го столбца (для заданий множественного соответствия) или не соответствовать ни одному из элементов 1-го столбца (для заданий однозначного соответствия).
Память | Устройство |
1. Внутренняя память | а) Флеш-карта |
2 Внешняя память | б) Винчестер |
в) Дискета | |
г) Оперативная память | |
д) Магнитная лента | |
е) Постоянное запоминающее устройство |
В5. Какое количество байт содержит слово «сообщение». В ответе записать только число.
4 вариант
Блок А.
При выполнении заданий этой части из четырёх предложенных вам вариантов выберите один верный.
А1. Поиск, сбор, хранение,преобразование,использование информации — это предмет изучения:
А2. Информацию, существенную и важную в настоящий момент, называют:
А3. Тактильную информацию человек получает посредством:
А4. Кодом называется:
А5. Видеозапись школьного праздника осуществляется для
А6. Чему равны 5 килобайтов?
А7. Что обозначают в ЭВМ нулём или единицей при записи двоичного кода?
А8. Считая, что каждый символ кодируется одним байтом, оцените информационный объем следующего предложения из пушкинского четверостишия:
Певец-Давид был ростом мал, Но повалил же Голиафа!
А9. Считая, что каждый символ кодируется 16-ю битами, оцените информационный объем следующего предложения:
Блажен, кто верует, тепло ему на свете!
А10. Шахматная доска состоит 8 столбцов и 8 строк. Какое минимальное количество бит потребуется для кодирования координат одного шахматного поля?
А11. Минимальный состав персонального компьютера…
А12. Какое из перечисленных устройств ввода относится к классу манипуляторов:
А13. Принтеры бывают :
А14. Для хранения программ, требующихся для запуска и тестирования компьютера при его включении, необходимо:
А15. Графическим редактором называется программа, предназначенная для …создания
А16. В операционной системе Windows собственное имя файла не может содержать символ
А17.По какому обязательному признаку название «вирус» было отнесено к компьютерным программам?
А18. Антивирусные программы – это
А19. Глобальная сеть
А20. Редактирование текста представляет собой:
Блок В.
B1. Установите соответствие между видами информации процессов и реализующими их действиями.
1) Звуковая | а) Трогать воду |
2) Зрительная | б) Шум дождя |
3) Тактильная | в) Запах пищи |
4) Обоняние | г) Видеть салют |
5) Вкусовая | д) Пить чай |
Ответ: 1б, 2г, 3а, 4в, 5д
В2. Закодируй слова с помощью кода Цезаря.
1) РОКОТ | а) ЩБРЛБ |
2) ШАПКА | в) ВПЛБМ |
3) БОКАЛ | б) ЛМБТТ |
4) КЛАСС | г) СПЛПУ |
5) СТОЛБ | д) ТУПМВ |
Ответ: 1г, 2а, 3в, 4б, 5д
В3. Что из перечисленного ниже относится к внутренней памяти? В ответе укажите буквы.
В4. Установить соответствие
Сеть | Описание |
1. Локальная сеть | a) объединение компьютеров, расположенных на большом расстоянии друг от друга |
2. Региональная сеть | б) объединение локальных сетей в пределах одной корпорации для решения общих задач |
3. Корпоративная сеть | в) объединение компьютеров в пределах одного города, области, страны |
4. Глобальная сеть | г) объединение компьютеров, расположенных на небольшом расстоянии друг от друга |
В5. Какое количество байт содержит слово «коммуникация». В ответе записать только число.