Інформація про новину
  • Переглядів: 3771
  • Дата: 4-04-2021, 23:53
4-04-2021, 23:53

5. Вимірювання інформації

Категорія: Інформатика





Попередня сторінка:  4. Кодування символів
Наступна сторінка:   6. Кодування графічних даних

5.1.

ЯК ВИМІРЯТИ ІНФОРМАЦІЮ

Подібно до того, як вимірюють вагу, довжину або час, можна вимірювати й інформацію. Про те, як це зробити і які одиниці вимірювання при цьому використовують, дізнаємося далі.

Якщо не видаляти зайві знімки та відео зі свого смартфону, його пам'ять рано чи пізно вичерпається. А якщо, користуючись «повільним» інтер-нет-підключенням, переглядати онлайнове відео, воно буде «гальмувати». Щоб уникнути таких ситуацій, слід ураховувати, який обсяг інформації бере участь в інформаційному процесі.

Під інформацією як правило розуміють щось корисне і зрозуміле користувачеві. Виходить, що текстовий файл, який містить 100 літер «А» або пробілів і займає на диску певний простір, не несе інформації. Отже, до вимірювання інформації мають існувати принаймні два підходи — такий, що враховує зміст повідомлення, і такий, що дає змогу оцінити обсяг його даних.

Окрім цього, потрібно ввести еталонну одиницю, подібно до того, як для вимірювання маси введено еталонну одиницю кілограм, для вимірювання довжини — метр.

Найменшою одиницею вимірювання інформації є 1 біт, який, як нам вже відомо, може приймати значення 0 або 1.

Наступною за величиною одиницею є 1 байт — він дорівнює 8 бітів, або 23 біт.

На схемі нижче також представлені й інші одиниці вимірювання:

5.2.

ЗМІСТОВИЙ ПІДХІД

Основою змістового підходу до вимірювання інформації є зміст інформаційного повідомлення. Згідно з цим підходом, кількість інформації розглядається як ступінь зменшення невизначеності знань у результаті отримання повідомлення.

Розглянемо процес підкидання монети. Вона може впасти на один із двох боків («орел» чи «решка»), отже, перед її підкиданням невизначеність дорівнює 2. Невизначеність перед підкиданням грального кубика дорівнює 6 (у кубика шість граней), невизначеність того, скільки балів можна отримати за відповідь на уроці, становить 12 (за дванадцятибаль-ної системи оцінювання).

Невизначеність знання про результат певної події дорівнює кількості можливих результатів цієї події.

Закодуємо повідомлення про можливі результати деяких із описаних вище подій з допомогою двійкового коду. Згадаємо методи кодування символів, а саме, той факт, що двійковий код із довжиною n дає можливість закодувати 2n варіантів. Таким чином, для кодування варіантів падіння

монети достатньо одного двійкового розряду. Тобто для того, щоб дізнатися, якою стороною впала монета, достатньо один раз задати запитання з приводу цього. І отримати одну відповідь: «так» чи «ні».

Згідно із змістовим підходом таке повідомлення містить 1 біт інформації.

Для кодування варіантів випадання значень у разі підкидання кубика двох розрядів не вистачить, їх буде 3. Чому? Найближче до 6 число, що є степенем числа 2, — це 8, а 8 = 23.Отже, показник степеня 3 і визначає кількість бітів інформації, яку одержує людина після підкидання кубика.

Для кодування оцінки, яку одержує учень на уроці, знадобиться 4 розряди. 12 — число, менше за 16. А 16 є найближчим до 12 числом, що є степенем числа 2, тобто 16 = 24. Отже, показник степеня 4 і визначає кількість бітів інформації, яку одержує учень після оголошення оцінки.

Розглянемо ряд практичних задач, у яких застосовано змістовий підхід до вимірювання інформації.

Задача 1. У коробці лежать 24 олівці різного кольору. Скільки інформації несе повідомлення про те, що з коробки дістали синій олівець?

Розв’язання

Перед тим, як витягти олівець, невизначеність становила 24, оскільки усі олівці різного кольору.

Найближчим більшим за число 24 числом, що є степенем числа 2, є число 32.

Показник степеня дорівнює 5, отже повідомлення несе 5 біт інформації.

Відповідь: 5 бітів.

Задача 2. Визначити, скільки бітів інформації несе повідомлення «Концерт відбудеться 25 жовтня».

Розв’язання

Оскільки в повідомленні вказано дату одного із днів року, то невизначеність перед повідомленням становила 365. Найближчим більшим числом, що є степенем числа 2, є число 512.

365 < 512 = 29.

Показник степеня дорівнює 9, отже, повідомлення несе 9 бітів інформації.

Відповідь: 9 біт.

5.3.

АЛФАВІТНИЙ ПІДХІД

Ще один підхід до вимірювання інформації — алфавітний. З допомогою алфавітного підходу можна виміряти кількість інформації в тексті, поданому будь-якою мовою. Водночас не враховуються такі її властивості, як корисність, актуальність або повнота. Кількість інформації не пов’язана зі змістом тексту, а залежить від інформаційної ваги символу в алфавіті.

Обсяг інформації (V) визначається як кількість (k) символів у повідомленні, помножена на інформаційну вагу символа (b). Тобто V = k ■ b.

Алфавіт — це весь набір букв, символів пунктуації та інших символів і знаків (включаючи пробіли), що застосовуються в тексті. Загальна кількість символів алфавіту визначає його потужність.

Інформаційна вага символу та потужність алфавіту пов’язані між собою такою формулою: N = 2b, де N — потужність алфавіту, b — інформаційна вага символу.

Так, наприклад, потужність алфавіту української мови — 33 символи. Відповідно, потужність алфавіту десяткової системи числення — 10 символів, що представлені цифрами від 0 до 9.

Найменшу потужність (рівну 1) має алфавіт із двома символами (2 = 21).

Саме такий алфавіт, двійковий, застосовується в комп’ютері.

Інформаційна вага символу двійкового алфавіту прийнята за одиницю інформації, і називається ця одиниця також бітом. Як і в разі змістового підходу, від неї утворюються більші одиниці (байт, кілобайт тощо).

Якщо алфавіт містить 256 символів, наприклад, таблиця кодів ASCII, то b — інформаційна вага одного його символу становитиме 8 бітів (28 = 256). Згадайте принципи кодування тексту: саме за такої довжини двійкового коду можна закодувати всі символи зазначеного алфавіту.

Розглянемо задачі на вимірювання інформації з використанням алфавітного підходу.

Задача 3. Текст, що має довжину 104 символи, записаний з використанням алфавіту потужністю 64 символи. Який інформаційний обсяг тексту в байтах?

Задача 4. Інформаційний обсяг набраного на комп’ютері тексту становить 1 Кбайт. Скільки символів містить цей текст, якщо інформаційна вага символу становить 4 біти?

Задача 5. Привітання учасникам олімпіади від марсіан записано за допомогою всіх символів марсіанського алфавіту: ТЕВИРП!КИ! Визначити вагу повідомлення в бітах.

Розв’язання

Спочатку підрахуємо, скільки символів містить марсіанський алфавіт. Як бачимо, у вислові є 8 різних символів: ТЕВИРП!К.

8 = 23. Отже, вага символу становить 3 біти.

Усього у повідомленні 10 символів, відповідно вага усього повідомлення 3 • 10 = 30 бітів.

Відповідь: 30 бітів.

Контрольні запитання та завдання

1. Які підходи використовують для вимірювання інформації?

2. Які одиниці вимірювання інформації ви знаєте?

3*. Поясніть принцип змістового підходу вимірювання інформації.

4. Що таке інформаційна вага символу в алфавіті?

5. Що таке алфавіт?

6. Як вимірюється кількість інформації текстового повідомлення?

Питання для роздумів

1*. Марійка задумала число від 1 до 100. Яку найменшу кількість спроб має зробити Андрій, щоб відгадати число, яке задумала Марійка?

2*. Повідомлення про те, що Івасик живе на 12 поверсі, несе 4 біти інформації. Скільки поверхів у будинку?

3. Текст, що має довжину 100 символів, записаний із використанням алфавіту потужністю 64 символи. Який інформаційний обсяг тексту в байтах?

4. Інформаційний обсяг набраного на комп’ютері тексту становить 3,5 Кбайтів. Скільки символів містить цей текст? Врахуйте, що інформаційна вага символу становить 8 бітів.

Завдання для досліджень

1*. Дізнайтеся про інші способи вимірювання інформації. Поясніть їхній принцип.

 

 

Це матеріал з підручника Інформатика 8 клас Казанцева, Стеценко (2021)

 




Попередня сторінка:  4. Кодування символів
Наступна сторінка:   6. Кодування графічних даних



^