Інформація про новину
  • Переглядів: 2518
  • Дата: 1-03-2021, 19:19
1-03-2021, 19:19

2. Двійкове кодування

Категорія: Інформатика





Попередня сторінка:  1. Кодування та декодування повідомлен...
Наступна сторінка:   3. Кодування графічних даних

Пригадаймо, що дані — це повідомлення, в яких однотипну інформацію подано у формі, зручній для опрацювання, зазвичай за допомогою технічних засобів. Комп’ютер — універсальний пристрій для опрацювання даних різних типів. Розглянемо, як він сприймає дані.

Поняття двійкового кодування

Звичні вам числа називають десятковими, тому що для їх запису використовують 10 цифр: 0, 1, 2,..., 9. Дані в комп’ютері подаються електричними, світловими або магнітними сигналами, що набувають тільки двох значень: 0 — вимкнено (немає струму, розмагнічено) або 1 — увімкнено (є струм, намагнічено)

Будь-які дані, що опрацьовує комп’ютер (числові, текстові, звукові, графічні тощо) кодують за допомогою лише двох знаків — нуля й одиниці. Такий спосіб кодування називають двійковим.

Саме двійкове кодування реалізоване в електронних пристроях.

Кодування символів

За допомогою одноцифрового двійкового коду можна закодувати два різні символи Тому для кодування символів у комп’ютері застосовують багатоцифро-ві двійкові коди. У таких кодах цифру 0 або 1 називають бітом (скор. від англ. binary dig it — двійкова цифра).

Розглянемо таблицю: код кожного символу складається з кількох нулів або одиниць, записаних поспіль

За кількістю бітів n, відведених для кодування одного символу, легко визначити число символів K, які можна закодувати:

8-бітовий код придатний для кодування до 28 = 256 різних символів, а 16-бітовий — 216 = 65 536 символів.

Усі використовувані в текстах символи для зручності кодування (декодування) зводять у таблиці кодів, де поряд із двійковим кодом або замість нього іноді записують десятковий код.

7-бітовий код ASCII

ASCII (American Standard Code for Information Interchange — американський стандартний код для обміну інформацією) є однією з найдавніших і найпоширеніших таблиць кодів. Її першу редакцію опубліковано 1963 року.

У цій таблиці десяткові числа від 0 до 31 є керувальними кодами, а решта — від 32 до 127 — кодують символи: великі й малі літери латинського алфавіту, розділові знаки, знаки математичних операцій тощо. Код 32 відповідає символу пропуск, код 33 — знаку оклику і т. д.

Щоб побачити на екрані символи сучасної версії таблиці ASCI I, слід запустити таку програму мовою Python:

8-бітовий код KOI8-U

Для кодування літер інших (переважно кириличних) алфавітів таблицю ASCII доповнюють до 256 символів. Для цього до 7-бітових кодів ASCII додають на початку 0, а для нових символів застосовують ці ж коди, але з додаванням 1. Так, для літер українського алфавіту використовують таблицю кодів KOI8-U (Код Обміну Інформації 8-біто-вий Український). Розглянемо фрагмент таблиці кодів KOI8-U:

Так, мала літера а українського алфавіту в таблиці кодів KOI8-U має десятковий код 193, що відповідає двійковому: 11000001.

Стандарт Юнікод

Із розвитком і поширенням комп’ютерів виникла потреба в кодуванні значно більшої кількості символів, ніж дозволяють 8-бітові коди. Тому в сучасних текстових документах здебільшого використовується сімейство кодів, описаних у стандарті Юнікод (Unicode — уніфіковане кодування). Завдяки збільшеній довжині коду символу код UTF-8 дозволяє закодувати 1 112 064 різних символів.

Одиниці вимірювання довжини двійкового коду

Обсяг даних вимірюється довжиною двійкового коду.

Послідовність із 8 двійкових розрядів (бітів) називають байтом. Наприклад, 10101101.

За 8-бітового кодування тексту кожен символ кодується одним байтом. Розділові знаки та пропуски також є символами, що мають свої коди.

Текст «Марійка грає в шахи. » складається з 20 символів із урахуванням пробілів і розділових знаків. Тому за 8-бітового кодування цей текст має обсяг 20 байтів.

На практиці зручніше користуватися більшими одиницями вимірювання: кілобайт (Кбайт), мегабайт (Мбайт), гігабайт (Гбайт), тера-байт (Тбайт) та ін. В інформатиці префікси кіло, мега, гіга, тера мають дещо інший зміст, ніж в інших науках

На початку ХХІ ст. введено стандарт іменування одиниць вимірювання обсягів даних: Кібібайт, Мебібайт, Гібібайт тощо. Але сьогодні ці назви практично не використовують

Нехай сторінка книжки в електронному вигляді містить 56 рядків по 64 символи в кожному рядку. Обчислимо обсяг даних (довжину двійкового коду) на сторінці. Маємо: 56 • 64 = 3584 (байти).

Щоб обчислити приблизний обсяг текстових даних у книжці, слід кількість символів на сторінці помножити на кількість сторінок. Розрахуємо обсяг даних у книжці, яка має 256 подібних сторінок: 3584 • 256 = 917 504 (байти) = 896 (Кбайтів) = 0,875 (Мбайта).

Не потрібно ототожнювати довжину двійкового коду текстового повідомлення з обсягом інформації, який воно містить.

Двійковий код літери Р має довжину 1 байт. Сама ця літера, намальована на дорожньому знаку, несе змістовне повідомлення для водія: поряд зі знаком є облаштоване місце для стоянки.

Тепер ви знаєте, в яких одиницях і в який спосіб можна вимірювати обсяг текстових даних. Із вимірюванням обсягів інших видів даних, якими оперує комп’ютер, ви ознайомитеся далі.

Питання для самоперевірки

1. Як кодуються дані в комп’ютері?

2. Чому в комп’ютері використовують двійкове кодування?

3. Яким чином кодуються символи в комп’ютері?

4. Що таке біт; байт?

5. У яких одиницях вимірюють довжину двійкового коду?

6. Скільки байтів містить 1 Кбайт; 1 Мбайт?

Вправа 2

1. Знайдіть в інтернеті таблицю кодів символів ASCII. Користую

чись нею, розкодуйте повідомлення:

1001000 1100101 1101100 1101100 1101111 0100001.

2. Змініть програму з прикладу 1 так, щоб поряд із символами

виводились їх числові коди. Запишіть її у файл Вправа 2-2 і перевірте роботу

3. Визначте, вміст скількох книжок (приклад 3) в електронному

вигляді можна зберегти на флеш-носії обсягом 32 Гбайти.

4. Визначте приблизний обсяг текстових даних на сторінці цього

підручника

Комп’ютерне тестування

Виконайте тестове завдання 2 із автоматичною

перевіркою результату

 

Це матеріал з підручника Інформатика 8 клас Бондаренко (2021)

 




Попередня сторінка:  1. Кодування та декодування повідомлен...
Наступна сторінка:   3. Кодування графічних даних



^