chvuz.ru

Алфавитный подход к определению количества информации (8 класс)

Урок информатики в 8 классе по теме

Урок информатики (8 класс)

Тема:  Алфавитный подход к определению количества информации

(Слайд 1)

Цели:

Образовательные:

Развивающие:

Воспитательные:

(Слайд 2)

Тип урока: комбинированный.

Формы работы учащихся: фронтальная, индивидуальная

Оборудование и технические средства:

План урока

I.Организационный момент – 1 мин.

II.Актуализация знаний – 5 мин.

III.Сообщение темы и целей урока – 1 мин.

IV.Изучение нового материала – 10 мин.

V.Закрепление – 9 мин.

  1. Самоконтроль по изученной теме – 15 мин.

VII.Подведение итогов урока – 2 мин.

VIII.Домашнее задание – 2 мин.

Ход урока

I. Организационный момент.

II.    Актуализация знаний

Задание 1.   Определите неопределенность: (Слайд 3)

а)   Вы спрашиваете у друга: «Ты пойдешь завтра играть в футбол?»

б)   Вы подъехали к светофору.

в)   Синоптик будет сообщать направление ветра.

Задание 2. (Слайд 4)

Задание 3. (Слайд 5)

1)Сколько бит информации получено из сообщения «Маша живет на третьем этаже», если в доме 16 этажей.

2)Сколько различных карточек лежало в стопке, если сообщение о вытащенной картинке несет 3 бита информации.

Задание 4. (Слайд 6)

Решение задания 1 (Часть 1) в формате ГИА.

Ученик набирает сочинение по литературе на компьютере, используя кодировку KOI-8. Определите какой объём памяти займёт следующая фраза:

Пушкин – это наше всё!

Каждый символ в кодировке KOI-8 занимает 8 бит памяти.

Ответ: 22 байта

III.  Сообщение темы и целей урока

IV. Изучение нового материала

Алфавитный подход к измерению информации позволяет опре­делить количество информации, заключенной в тексте. Множество символов, используемых при записи текста, называется алфавитом. Поскольку в тексте могут встречаться знаки препинания, цифры, скобки и даже пробелы между словами, то их тоже включают в алфавит.

Полное количество символов в алфавите называется мощностью алфавита и обозначается буквой N.

Количество информации, со­держащееся в символьном сообщении, определяется по формуле:

Xk=K·I,

где

К — количество символов в тексте,

I — информационный вес одного символа, который находится из уравнения

2I = N,

где N -мощность используемого алфавита.

Чем больше алфавит знаковой системы, тем большее количество информации несет каждый знак.

Пример.

Один символ алфавита мощно­стью 128 символов (27) несет 7 бит информации.

V.  Закрепление

Задача 1.

Сообщение, записанное буквами из 16-символьного алфавита, содержит 50 символов. Какой объем информации оно несет?

Задача 2.

Для представления числовых данных используют 16-ричный алфавит, включающий знаки математических действий. Сколь­ко битов информации содержит выражение 64 ? 5 = 320?

Задача 3.

Определите количество информации в книге, которая содержит 200 страниц. На каждой странице 50 строк, в каждой строке 60 символов. Запишите ответ в наиболее подходящих единицах.

VI.Самоконтроль по изученной теме

Учащиеся выполняют тест на ПК, используя ресурс

http://school-collection.edu.ru/catalog/res/a12b2b83-f353-4b69-88b8-b7eb29dfd642/?sort=order&interface=themcol&class=50&subject=19&rubric_id[]=75344&rubric_id[]=75298

VII.  Подведение итогов урока.

Учащимся раздаются карточки с заданиями, взятыми на портале

 http://school-collection.edu.ru

Ссылка на ресурс:

http://school-collection.edu.ru/catalog/res/b5e8b1f0-8b97-4e5d-988e-31c57f1720f2/view/

1. Алфавит племени Мульти состоит из 32 букв. Какое количество информации несёт одна буква этого алфавита?

2. Сообщение, записанное буквами из 16-символьного алфавита, содержит 50 символов. Какой объём информации оно несёт?

3. Сколько символов содержит сообщение, записанное с помощью 16-ти символьного алфавита, если его объём составил 1/16 часть Мегабайта?

4. Сколько килобайтов составит сообщение из 384 символов16-ти символьного алфавита?

5. Два сообщения содержат одинаковое количество символов. Количество информации в первом тексте в 1,5 раза больше, чем во втором.

Сколько символов содержат алфавиты, с помощью которых записаны сообщения, если известно, что число символов в каждом алфавите не превышает 10 и на каждый символ приходится целое число битов?

Гиперссылка на ресурс, обеспечивающий доступ к ЭОР

1.http://school-collection.edu.ru/catalog/res/a12b2b83-f353-4b69-88b8-b7eb29dfd642/?sort=order&interface=themcol&class=50&subject=19&rubric_id[]=75344&rubric_id[]=75298

2.

(Слайд 1)

Цели:

Образовательные:

Развивающие:

Воспитательные:

(Слайд 2)

Тип урока: комбинированный.

Формы работы учащихся: фронтальная, индивидуальная

Оборудование и технические средства:

План урока

  1. Организационный момент – 1 мин.

  2. Актуализация знаний – 5 мин.

  3. Сообщение темы и целей урока – 1 мин.

  4. Изучение нового материала – 10 мин.

  5. Закрепление – 9 мин.

  6. Самоконтроль по изученной теме – 15 мин.

  7. Подведение итогов урока – 2 мин.

  8. Домашнее задание – 2 мин.

Ход урока

II. Актуализация знаний

Задание 1. Определите неопределенность:(Слайд 3)

а) Вы спрашиваете у друга: «Ты пойдешь завтра играть в футбол?» (Ответ: 2)

б) Вы подъехали к светофору. (Ответ: 3)

в) Синоптик будет сообщать направление ветра. (Ответ: 8)

Задание 2. (Слайд 4)

Задание 3. (Слайд 5)

  1. Сколько бит информации получено из сообщения «Маша живет на третьем этаже», если в доме 16 этажей. (Ответ: 4)

  2. Сколько различных карточек лежало в стопке, если сообщение о вытащенной картинке несет 3 бита информации. (Ответ: 8)

Задание 4. (Слайд 6)

Решение задания 1 (Часть 1) в формате ГИА.

Ученик набирает сочинение по литературе на компьютере, используя кодировку KOI-8. Определите какой объём памяти займёт следующая фраза:

Пушкин это наше всё!

Каждый символ в кодировке KOI-8 занимает 8 бит памяти.

(Ответ: 22 байта)

III. Сообщение темы и целей урока

IV. Изучение нового материала

Алфавитный подход к измерению информации позволяет опре­делить количество информации, заключенной в тексте. Множество символов, используемых при записи текста, называется алфавитом. Поскольку в тексте могут встречаться знаки препинания, цифры, скобки и даже пробелы между словами, то их тоже включают в алфавит.

Полное количество символов в алфавите называется мощностью алфавита и обозначается буквой N.
Количество информации, со­держащееся в символьном сообщении, определяется по формуле:

Xk=K·I,

где

К — количество символов в тексте,

I — информационный вес одного символа, который находится из уравнения

2I = N,

где N -мощность используемого алфавита.

(Слайд 7)

Чем больше алфавит знаковой системы, тем большее количество информации несет каждый знак.

Пример.

Один символ алфавита мощно­стью 128 символов (27) несет 7 бит информации.

V. Закрепление

Задача 1. (Слайд 8)

Сообщение, записанное буквами из 16-символьного алфавита, содержит 50 символов. Какой объем информации оно несет? (Ответ: 25 байт)

Задача 2. (Слайд 9)

Для представления числовых данных используют 16-ричный алфавит, включающий знаки математических действий. Сколь­ко битов информации содержит выражение 64 ∙ 5 = 320? (Ответ: 32 бита)

Задача 3. (Слайд 10)

Пользователь компьютера может вводить в минуту 100 знаков. Мощность алфавита, используемого в компьютере, равна 256. Какое количество информации в байтах может ввести пользователь в компьютер за 1 минуту? (Ответ: 100 байт)

  1. Самоконтроль по изученной теме

Учащиеся выполняют тест на ПК, используя ресурс Единой коллекции цифровых образовательных ресурсов

http://school-collection.edu.ru/catalog/res/a12b2b83-f353-4b69-88b8-b7eb29dfd642/ ?sort= order&interface=themcol&class=50&subject=19&rubric_id[]=75344&rubric_id[]=75298

VII. Подведение итогов урока.

Учащимся раздаются карточки с заданиями, взятыми на портале единой коллекции цифровых образовательных ресурсов

http://school-collection.edu.ru

Ссылка на ресурс:

http://school-collection.edu.ru/catalog/res/b5e8b1f0-8b97-4e5d-988e-31c57f1720f2/view/

1. Алфавит племени Мульти состоит из 32 букв. Какое количество информации несёт одна буква этого алфавита?
2. Сообщение, записанное буквами из 16-символьного алфавита, содержит 50 символов. Какой объём информации оно несёт?
3. Сколько символов содержит сообщение, записанное с помощью 16-ти символьного алфавита, если его объём составил 1/16 часть Мегабайта?
4. Сколько килобайтов составит сообщение из 384 символов16-ти символьного алфавита?
5. Два сообщения содержат одинаковое количество символов. Количество информации в первом тексте в 1,5 раза больше, чем во втором. Сколько символов содержат алфавиты, с помощью которых записаны сообщения, если известно, что число символов в каждом алфавите не превышает 10 и на каждый символ приходится целое число битов?

Гиперссылка на ресурс, обеспечивающий доступ к ЭОР

  1. http://school-collection.edu.ru/catalog/res/a12b2b83-f353-4b69-88b8-b7eb29dfd642/?sort= order&interface=themcol&class=50&subject=19&rubric_id[]=75344&rubric_id[]=75298

  2. http://school-collection.edu.ru/catalog/res/b5e8b1f0-8b97-4e5d-988e-31c57f1720f2/view/

Источник: https://kopilkaurokov.ru/informatika/uroki/urok-informatiki-v-8-klassie-po-tiemie-alfavitnyi-podkhod-k-opriedielieniiu-kolichiestva-informatsii

Алфавитный подход к измерению информации. 8-й класс

Разделы: Информатика

Предмет: Информатика.

Класс: 8.

Цели урока:

План урока:

Этапы урока Время (мин.) Приемы и методы
1. Организационный момент 3 Сообщение учителя
2. Актуализация и систематизация знаний 5 Фронтальный опрос
3. Изучение нового материала 15 Сообщение учителя, записи на доске и в тетрадях, лекция в сопровождении презентации
4. Закрепление нового материала 18 Решение задач
5. Домашнее задание 2 Запись в дневниках или в тетрадях
6. Итог урока 2 Сообщение учителя

Тип урока: комбинированный.

Оборудование: доска, интерактивная доска, компьютер, мультимедийный проектор, рабочие места учеников (персональный компьютер).

Оформление доски:

  1. дата, тема урока,
  2. основные этапы урока:
    • алфавитный подход к измерению информации;
    • алфавит, мощность алфавита;
    • информационная емкость знака;
    • информационный объем текста.
  3. домашнее задание § 1.1.3, стр.30, задание 1.8, 1.9. стр.32.
  4. формулы       

Материал к уроку:

  1. Приложение 1, карточки практической работы «Алфавитный подход к измерению информации»;
  2. Приложение 2, презентация «Алфавитный подход к измерению информации»;
  3. Приложение 3, список задач (доп. материал в помощь учителю).
  4. Приложение 4, решение задач 1-3.

Список используемой литературы:

  1. Информатика. 8 класс: поурочные планы по учебнику Н.Д. Угриновича/ авт.-сост. А.М. Горностаева.- Волгоград: Учитель, 2008.
  2. Крылов С.С. ЕГЭ. Информатика. Тематическая рабочая тетрадь ФИПИ/ С.С. Крылов, Д.М.Ушаков. – М.: Издательство «Экзамен», 2010.
  3. Семакин И.Г. Информатика и ИКТ: учебник для 8 класса / И.Г. Семакин, Л.А. Залогова, С.В. Русаков, Л.В. Шестакова. – М.: БИНОМ. Лаборатория знаний, 2010.
  4. Угринович Н.Д. Информатика и ИКТ: учебник для 8 класса/ Н.Д. Угринович. – 2-е изд., испр. – М.: БИНОМ. Лаборатория знаний, 2009.

Ход урока

(в сопровождении презентации «Алфавитный подход к измерению информации» см. Приложение 2)

I. Организационный момент.

слайды 1-2

Приветствие, сообщение темы и  цели урока, отметить присутствующих на уроке.

II. Актуализация и систематизация знаний.

(в скобках ответ на вопрос)

Фронтальный опрос учащихся. слайды 3-6

  1. Какая формула связывает между собой количество возможных информационных сообщений и количество информации, которое несет полученное сообщение? (N=2i , где N –  количество возможных информационных сообщений, i – количество информации, которое несет полученное сообщение)
  2. Каковы единицы измерения информации? (бит, байт, килобайт и т.д.)
  3. Что такое бит? (бит – это количество информации, содержащееся в информационном сообщении, уменьшающем неопределенность знания в два раза)
  4. Чему равен 1 байт? (1 байт = 8 битов = 23 битов);
  5. Переведите:
    2 Мбайта = _______ Кбайт (2048 Кбайт)
    16 бит = __________ байт (2 байта)
    4 байта = _________ бит (32 бита)

Существует несколько подходов к измерению информации. На этом уроке мы рассмотрим, только один, который называется алфавитным подходом к определению количества информации.

III. Изучение нового материала.

слайды 7-13

При алфавитном подходе к определению количества информации отвлекаются от содержания  (смысла) информации и рассматривают информационное сообщение как последовательность знаков определенной знаковой системы.

Под алфавитом некоторого языка мы будем понимать набор букв, знаков препинания, цифр, скобок, пробел и других символов, используемых в тексте.

Мощностью алфавита называется полное число символов алфавита. Мощность алфавита обозначается буквой N.

Например:

При алфавитном подходе считается, что каждый символ текста имеет информационную емкость. Информационная емкость знака зависит от мощности алфавита.

Например необходимо передать информационное сообщение по каналу передачи информации от отправителя к получателю.

Алфавит, с помощью которого записано сообщение состоит из N знаков. В простейшем случае, когда длина кода сообщения составляет один знак, отправитель может послать одно из N возможных сообщений, которое будет нести количество информации i. Тогда в формуле

N – количество знаков в алфавите знаковой системы i – количество информации, которое несет каждый знак 

Например, из формулы можно определить количество информации, которое несет знак в двоичной знаковой системе

Информационная емкость знака двоичной знаковой системы составляет 1 бит.

Задание (устно): определить какое количество информации несет буква русского алфавита.

Решение:

Буква русского алфавита несет 5 битов информации.

Количество информации в сообщении.

Сообщение состоит из последовательности знаков, каждый из которых несет определенное количество информации.

Количество информации в сообщении можно посчитать, умножив количество информации, которое несет один знак на количество знаков в сообщении.
, где Ic – количество информации в сообщении i – количество информации, которое несет один знакk – количество знаков в сообщении

Решим несколько задач.

При решении задач можно использовать калькулятор на компьютере. Объяснить учащимся, как запускать программу Калькулятор.

Чтобы решить задачу, записываем, ДАНО, НАЙТИ, РЕШЕНИЕ, ОТВЕТ.

Учитель разбирает вместе с учащимися решение задач (см. Приложение 4), по желанию учащиеся выходят к доске.

Задача 1. (слайды 14-15) Информационный объем сообщения – 7,5 Кбайт. Известно, что данное сообщение содержит 7680 символов. Какова мощность алфавита.

Задача 2. (слайды 16-17) Для записи сообщения использовался 32-символьный алфавит. Каждая страница содержит 30 строк. Все сообщение содержит 8775 байт информации и занимает 6 страниц. Сколько символов в строке?

Задача 3. (слайды 18-19) Какое количество информации содержит сообщение 1010101111012?

IV. Закрепление нового материала.

слайд 20

Выполнение практической работы учащимися (решение задач самостоятельно). (см. Приложение 1)

При решении задач учащиеся могут использовать калькулятор на компьютере.

В помощь учителю предлагается дополнительный список задач для дополнительных заданий или зданий на дом более сильным учащимся. (см. Приложение 3)

Практическая работа «Алфавитный подход к измерению информации» 1. Текст составлен с использованием алфавита мощностью 64 символа и содержит 100 символов. Каков информационный объем текста. (ответ Ic= 600 бит) 2. Информационный объем текста, подготовленного с помощью компьютера, равен 3,5 Кбайт. Сколько символов содержит этот текст? (ответ k = 3584 символов) 3. Объем сообщения, содержащего 2048 символов, составил 1/512 часть Мбайта. Какова мощность  алфавита, с помощью которого записано сообщение?(ответ N = 256 символов)

V. Домашнее задание.

слайд 21

Записать домашнее задание в дневник или тетрадь.

учебник Информатика и ИКТ. Базовый курс: Учебник для 8 класса/ Н.Д. Угринович.

§ 1.1.3, стр.30, задание для самостоятельного выполнения 1.8, 1.9. стр.32.

VI. Итог урока.

слайд  22

Подведение итога урока. Ответить на вопросы учителя (в скобках ответ на вопрос).

  1. Что называется алфавитным подходом? (это способ измерения информационного объема текста, не связанного с его содержанием)
  2. Что такое мощность алфавита? (полное число символов алфавита)
  3. Как определяется информационный объем текста при использовании алфавитного подхода? (, Ic – количество информации в сообщении, i – количество информации которое несет один знак, k – количество знаков в сообщении)

Выставление оценок за урок.

29.06.2011

Источник: https://xn--i1abbnckbmcl9fb.xn--p1ai/%D1%81%D1%82%D0%B0%D1%82%D1%8C%D0%B8/600432/

Алфавитный подход к оценке количества информации. Формула Хартли

Содержательный подход к оценке количества информации, который мы рассматривали ранее, измеряет ее количество, как уменьшение неопределенности наших знаний.

Однако любое техническое устройство не способно воспринимать непосредственно содержание информации, оно лишь понимает наличие или отсутствие электрических сигналов. Вследствие чего в вычислительной технике вынуждены использовать другой подход к оценке количества информации, который называется алфавитным.

Принцип алфавитного подхода к оценке количества информации

Алфавитный подход строится на принципе, утверждающем, что любое сообщение можно представить в виде кодов с помощью конечной последовательности символов, содержащейся в любом алфавите.

Носители информации содержат любые последовательности символов, которые могут храниться, передаваться и обрабатываться как с помощью человека, так и с помощью технических устройств, в частности компьютера. Этот подход описал А.Н.

Колмогоров, согласно которому, информативность, заключающаяся в последовательности символов, не может зависеть от содержания самого сообщения, а может определяться лишь минимальным количеством символов, необходимых для ее кодирования.

Подобный подход к оценке количества информации носит объективный характер, так как не зависит от получателя, принимающего сообщения. Смысл же сообщений может учитываться только на этапе выбора алфавита кодирования либо не учитываться совсем.

Ничего непонятно?

Попробуй обратиться за помощью к преподавателям

В основу принципа этого подхода лег подсчет числа символов в сообщении, таким образом, важна только длина сообщения и совсем не учитывается его содержание. Однако на длину сообщения может влиять мощность алфавита используемого языка.

Самый простой способ разобраться в этом — рассмотреть пример любого текста, написанного на каком-нибудь языке. Для нас, конечно же, удобным будет текст на русском языке.

Мощность алфавита и информационная емкость. Формула Хартли

Все множество символов, из которых состоит язык, можно традиционно назвать алфавитом. Как правило, под алфавитом понимаются только буквы, но кроме них при написании текстов используются знаки препинания, цифры, скобки, пробелы, их тоже, в свою очередь, можно включить в алфавит.

Таким образом, алфавит — это множество символов, используемых при записи текста.

Мощность (размер) алфавита — это полное количество символов в алфавите.

Мощность алфавита обозначается буквой $N$.

Например:

При алфавитном подходе считают, что каждый символ текста несет в себе определенную информационную емкость, которая, в свою очередь, зависит от мощности алфавита.

Алфавит, с помощью которого записывается сообщение, состоит из $N$ знаков. В самом простом случае при длине кода сообщения, равной одному знаку, отправитель может послать одно из $N$ возможных сообщений, которое будет нести количество информации, равное $I$, согласно формуле:

$N = 2I$ ,

где $N$ — количество знаков в алфавите знаковой системы,

$I$ — количество информации, которое несет каждый знак.

Данную формулу вывел Р. Хартли, который в $20$-е годы прошлого столетия заложил основы теории информации, в которой определялась мера количества информации при решении некоторых задач.

Хартли утверждал, что на количество информации, содержащейся в сообщении, может влиять фактор неожиданности, который, в свою очередь, зависит от вероятности получения сообщения. Если эта вероятность получения сообщения высокая, а неожиданность при этом низкая, то сообщение будет содержать мало полезной для человека информации.

Замечание 1

Однако при создании своей формулы Р.Хартли полностью исключил фактор неожиданности. Формула Хартли работает только в том случае, когда появление символов равновероятно и они статистически независимы.

Например, с помощью приведенной формулы можно определить количество информации, которое несет знак в двоичной системе счисления:

Рисунок 1.

Информационная емкость знака двоичной системы составляет 1 бит.

Пример 1

Необходимо определить информационную емкость буквы русского алфавита (без учета буквы «ё»).

Решение:

Представим себе, что текст к нам поступает последовательно, по одному знаку, словно бумажная лента, выползающая из телеграфного аппарата. Предположим, что каждый символ, который появляется на ленте, с равной вероятностью может быть любым символом алфавита. В действительности это не совсем так, но для упрощения примем такое предположение.

В каждой очередной позиции текста может появиться любой из $N$ символов. Тогда, согласно известной нам формуле, каждый такой символ несет количество информации равное $I$ бит, которое можно определить из решения уравнения:

Рисунок 2.

Информационная емкость буквы русского алфавита составляет $5$ бит информации.

Таким образом, формула определения $N$ связывает между собой количество возможных событий и количество информации, которое содержит в себе полученное сообщение. В рассматриваемой выше задаче $N$ — это количество знаков в русском алфавите, а $I$ — количество информации, которое несёт одна буква.

Сообщение состоит из последовательности знаков, каждый из которых несет определенное количество информации.

Количество информации в сообщении можно определить, используя формулу:

$I_c = K \cdot I$,

где $I_c$ — количество информации, содержащееся в сообщении;

$I$ — количество информации, которое несет один знак (информационная емкость);

$K$ — количество знаков в сообщении.

Рассмотрим пример решения задачи

Пример 2

Необходимо определить какое количество информации содержит слово «Привет», если считать, что алфавит состоит из $32$ букв (без учета буквы «ё»)?

Решение. Чтобы решить задачу, для начала определим количество знаков в сообщении и мощность используемого алфавита.

Количество знаков в сообщении: $K= 6$,

а мощность данного алфавита: $N = 32$.

Необходимо определить какое количество информации содержит слово «Привет».

Для этого необходимо умножить количество информации, которое несет один знак ($I$), на количество знаков в сообщении ($K$), т.е. воспользоваться формулой: $I_c = K \cdot I$.

Однако мы не сможем воспользоваться этой формулой, поскольку нам не известно какое количество информации несет один знак ($I$).

Для решения задачи воспользуемся формулой Хартли. Сообщение записано с помощью алфавита, мощность которого равна $32$, т.е. $N = 32$.

Решив уравнение, используя формулу $N = 2I$, мы получили, что количество информации $I = 5$ бит. Зная количество информации, которое содержит в себе один знак нашего алфавита, и количество знаков в сообщении, можно определить, какое количество информации содержит наше сообщение.

Итак: $I_c = K \cdot I = 6 \cdot 5 = 30$ бит.

При измерении информации удобным является использование размера алфавита $N$, равного целой степени двойки. К примеру, если $N=16$, то это означает, что каждый символ несет $4$ бита информации, так как $24= 16$.

Единицы измерения информации

Ограничений максимального размера алфавита теоретически не существует. Однако существует алфавит, который можно назвать достаточным. Он используется при работе с компьютером. Мощность этого алфавита — $256$ символов. Он включает в себя практически все необходимые символы: латинские и русские буквы, цифры, знаки арифметических операций, всевозможные скобки, знаки препинания.

Поскольку $256 = 28$, то отсюда следует, что $1$ символ этого алфавита содержит $8$ бит информации. Эта величина лежит в основе использования вычислительной технике и носит название — байт.

$1$ байт = $8$ бит

Используя данный алфавит, который еще называется таблицей ASCII-кодов, можно легко подсчитать объем информации в тексте. В данном случае $1$ символ алфавита содержит в себе $1$ байт информации, поэтому необходимо просто определить количество символов, то число, которое получим в результате, и будет выражать информационный объем текста в байтах.

Допустим небольшая книга, распечатанная на принтере, содержит $50$ страниц, при этом на каждой странице расположено $50$ строк, в каждой строке — $60$ символов.

Проведем несложный расчет и получим, что страница содержит:

$50 \cdot 60 = 3000$ байт информации.

Объем же информации, содержащейся в книге:

$3000 \cdot 50 = 150 \ 000$ байт.

Любая система единиц измерения содержит основные единицы и производные от них.

При измерении больших объемов информации на практике широко используются следующие производные от байта единицы, которые приведены в таблице:

Рисунок 3.

Источник: https://spravochnick.ru/informatika/kodirovanie_informacii/alfavitnyy_podhod_k_ocenke_kolichestva_informacii_formula_hartli/

Измерение информацииАлфавитный подход

Алфавитный подход используется для измерения количества информации в тексте, представленном в виде последовательности символов некоторого алфавита. Такой подход не связан с содержанием текста.

Количество информации в этом случае называется информационным объемом текста, который пропорционален размеру текста — количеству символов, составляющих текст.

Иногда данный подход к измерению информации называют объемным подходом.

Каждый символ текста несет определенное количество информации. Его называют информационным весом символа. Поэтому информационный объем текста равен сумме информационных весов всех символов, составляющих текст.

Здесь предполагается, что текст — это последовательная цепочка пронумерованных символов. В формуле (1) i1обозначает информационный вес первого символа текста, i2—информационный вес второго символа текста и т.д.; K —размер текста, т.е. полное число символов в тексте.

Все множество различных символов, используемых для записи текстов, называется алфавитом. Размер алфавита — целое число, которое называетсямощностью алфавита. Следует иметь в виду, что в алфавит входят не только буквы определенного языка, но все другие символы, которые могут использоваться в тексте: цифры, знаки препинания, различные скобки, пробел и пр.

Определение информационных весов символов может происходить в двух приближениях:

1) в предположении равной вероятности (одинаковой частоты встречаемости) любого символа в тексте;

2) с учетом разной вероятности (разной частоты встречаемости) различных символов в тексте.

Приближение равной вероятности символов в тексте

Если допустить, что все символы алфавита в любом тексте появляются с одинаковой частотой, то информационный вес всех символов будет одинаковым. Пусть N — мощность алфавита.

Тогда доля любого символа в тексте составляет 1/N-ю часть текста. По определению вероятности (см. “Измерение информации.

Содержательный подход” ) эта величина равна вероятности появления символа в каждой позиции текста:

p = 1/N

Согласно формуле К.Шеннона (см. “Измерение информации. Содержательный подход” ), количество информации, которое несет символ, вычисляется следующим образом:
i

= log2(1/p) = log2N (бит)                                            (2)

Следовательно, информационный вес символа (i) и мощность алфавита (N) связаны между собой по формуле Хартли (см. “Измерение информации. Содержательный подход” )

2i = N.

Зная информационный вес одного символа (i) и размер текста, выраженный количеством символов (K), можно вычислить информационный объем текста по формуле:

I

= K · i                                                                 (3)

Эта формула есть частный вариант формулы (1), в случае, когда все символы имеют одинаковый информационный вес.

Из формулы (2) следует, что при N = 2 (двоичный алфавит) информационный вес одного символа равен 1 биту.

С позиции алфавитного подхода к измерению информации 1 бит это информационный вес символа из двоичного алфавита.

Более крупной единицей измерения информации является байт.

1 байт это информационный вес символа из алфавита мощностью 256.

Поскольку 256 = 28, то из формулы Хартли следует связь между битом и байтом:

2i = 256 = 28

Отсюда: i = 8 бит = 1 байт

Для представления текстов, хранимых и обрабатываемых в компьютере, чаще всего используется алфавит мощностью 256 символов. Следовательно,
1 символ такого текста “весит” 1 байт.

Помимо бита и байта, для измерения информации применяются и более крупные единицы:

1 Кб (килобайт) = 210 байт = 1024 байта,

1 Мб (мегабайт) = 210 Кб = 1024 Кб,

1 Гб (гигабайт) = 210 Мб = 1024 Мб.

Приближение разной вероятности встречаемости символов в тексте

В этом приближении учитывается, что в реальном тексте разные символы встречаются с разной частотой. Отсюда следует, что вероятности появления разных символов в определенной позиции текста различны и, следовательно, различаются их информационные веса.

Статистический анализ русских текстов показывает, что частота появления буквы “о” составляет 0,09. Это значит, что на каждые 100 символов буква “о” в среднем встречается 9 раз. Это же число обозначает вероятность появления буквы “о” в определенной позиции текста: po = 0,09.Отсюда следует, что информационный вес буквы “о” в русском тексте равен:

Самой редкой в текстах буквой является буква “ф”. Ее частота равна 0,002. Отсюда:

Отсюда следует качественный вывод: информационный вес редких букв больше, чем вес часто встречающихся букв.

Как же вычислить информационный объем текста с учетом разных информационных весов символов алфавита? Делается это по следующей формуле:

Здесь N — размер (мощность) алфавита; nj — число повторений символа номер j в тексте; ij — информационный вес символа номер j.

Методические рекомендации

Алфавитный подход в курсе информатики основой школы

В курсе информатики в основной школе знакомство учащихся с алфавитным подходом к измерению информации чаще всего происходит в контексте компьютерного представления информации. Основное утверждение звучит так:

Количество информации измеряется размером двоичного кода, с помощью которого эта информация представлена

Поскольку любые виды информации представляются в компьютерной памяти в форме двоичного кода, то это определение универсально. Оно справедливо для символьной, числовой, графической и звуковой информации.

Один знак

(разряд) двоичного кода несет 1 бит информации.

При объяснении способа измерения информационного объема текста в базовом курсе информатики данный вопрос раскрывается через следующую последовательность понятий: алфавит размер двоичного кода символа информационный объем текста.

Логика рассуждений разворачивается от частных примеров к получению общего правила. Пусть в алфавите некоторого языка имеется всего 4 символа. Обозначим их:, , , .

Эти символы можно закодировать с помощью четырех двухразрядных двоичных кодов: — 00, — 01, — 10, — 11. Здесь использованы все варианты размещений из двух символов по два, число которых равно 22 = 4.

Отсюда делается вывод: информационный вес символа из 4-символьного алфавита равен двум битам.

Следующий частный случай — 8-символьный алфавит, каждый символ которого можно закодировать 3-разрядным двоичным кодом, поскольку число размещений из двух знаков группами по 3 равно 23 = 8. Следовательно, информационный вес символа из 8-символьного алфавита равен 3 битам. И т.д.

Обобщая частные примеры, получаем общее правило: с помощью b-разрядного двоичного кода можно закодировать алфавит, состоящий из N = 2b — символов.

Пример 1. Для записи текста используются только строчные буквы русского алфавита и “пробел” для разделения слов. Какой информационный объем имеет текст, состоящий из 2000 символов (одна печатная страница)?

Решение. В русском алфавите 33 буквы. Сократив его на две буквы (например, “ё” и “й”) и введя символ пробела, получаем очень удобное число символов — 32. Используя приближение равной вероятности символов, запишем формулу Хартли:

2i =32 = 25

Отсюда: i = 5 бит — информационный вес каждого символа русского алфавита. Тогда информационный объем всего текста равен:

I = 2000 · 5 = 10 000бит

Пример 2. Вычислить информационный объем текста размером в 2000 символов, в записи которого использован алфавит компьютерного представления текстов мощностью 256.

Решение. В данном алфавите информационный вес каждого символа равен 1 байту (8 бит). Следовательно, информационный объем текста равен 2000 байт.

В практических заданиях по данной теме важно отрабатывать навыки учеников в пересчете количества информации в разные единицы: биты — байты — килобайты — мегабайты — гигабайты. Если пересчитать информационный объем текста из примера 2 в килобайты, то получим:

2000 байт = 2000/1024 1,9531 Кб

Пример 3. Объем сообщения, содержащего 2048 символов, составил 1/512 часть мегабайта. Каков размер алфавита, с помощью которого записано сообщение?

Решение. Переведем информационный объем сообщения из мегабайтов в биты. Для этого данную величину умножим дважды на 1024 (получим байты) и один раз — на 8:

I = 1/512 · 1024 · 1024 · 8 = 16 384 бита.

Поскольку такой объем информации несут 1024 символа (К), то на один символ приходится:

i = I/K = 16 384/1024 = 16 бит.

Отсюда следует, что размер (мощность) использованного алфавита равен 216 = 65 536 символов.

Объемный подход в курсе информатики в старших классах

Изучая информатику в 10–11-х классах на базовом общеобразовательном уровне, можно оставить знания учащихся об объемном подходе к измерению информации на том же уровне, что описан выше, т.е. в контексте объема двоичного компьютерного кода.

При изучении информатики на профильном уровне объемный подход следует рассматривать с более общих математических позиций, с использованием представлений о частотности символов в тексте, о вероятностях и связи вероятностей с информационными весами символов.

Знание этих вопросов оказывается важным для более глубокого понимания различия в использовании равномерного и неравномерного двоичного кодирования (см. “Кодирование информации” ), для понимания некоторых приемов сжатия данных (см. “Сжатие данных” ) и алгоритмов криптографии (см. “Криптография” ).

Пример 4. В алфавите племени МУМУ всего 4 буквы (А, У, М, К), один знак препинания (точка) и для разделения слов используется пробел. Подсчитали, что в популярном романе “Мумука” содержится всего 10 000 знаков, из них: букв А — 4000, букв У — 1000, букв М — 2000, букв К — 1500, точек — 500, пробелов — 1000. Какой объем информации содержит книга?

Решение. Поскольку объем книги достаточно большой, то можно допустить, что вычисленная по ней частота встречаемости в тексте каждого из символов алфавита характерна для любого текста на языке МУМУ. Подсчитаем частоту встречаемости каждого символа во всем тексте книги (т.е. вероятность) и информационные веса символов

Общий объем информации в книге вычислим как сумму произведений информационного веса каждого символа на число повторений этого символа в книге:

Источник: https://xn----7sbbfb7a7aej.xn--p1ai/informatika_kabinet/inf_prozes/inf_prozes_05.html