Попередня сторінка: 1. Кодування та декодування повідомлен...
Наступна сторінка: 3. Кодування графічних даних
Пригадаймо, що дані — це повідомлення, в яких однотипну інформацію подано у формі, зручній для опрацювання, зазвичай за допомогою технічних засобів. Комп’ютер — універсальний пристрій для опрацювання даних різних типів. Розглянемо, як він сприймає дані.
Поняття двійкового кодування
Звичні вам числа називають десятковими, тому що для їх запису використовують 10 цифр: 0, 1, 2,..., 9. Дані в комп’ютері подаються електричними, світловими або магнітними сигналами, що набувають тільки двох значень: 0 — вимкнено (немає струму, розмагнічено) або 1 — увімкнено (є струм, намагнічено)
Будь-які дані, що опрацьовує комп’ютер (числові, текстові, звукові, графічні тощо) кодують за допомогою лише двох знаків — нуля й одиниці. Такий спосіб кодування називають двійковим.
Саме двійкове кодування реалізоване в електронних пристроях.
Кодування символів
За допомогою одноцифрового двійкового коду можна закодувати два різні символи Тому для кодування символів у комп’ютері застосовують багатоцифро-ві двійкові коди. У таких кодах цифру 0 або 1 називають бітом (скор. від англ. binary dig it — двійкова цифра).
Розглянемо таблицю: код кожного символу складається з кількох нулів або одиниць, записаних поспіль
За кількістю бітів n, відведених для кодування одного символу, легко визначити число символів K, які можна закодувати:
8-бітовий код придатний для кодування до 28 = 256 різних символів, а 16-бітовий — 216 = 65 536 символів.
Усі використовувані в текстах символи для зручності кодування (декодування) зводять у таблиці кодів, де поряд із двійковим кодом або замість нього іноді записують десятковий код.
7-бітовий код ASCII
ASCII (American Standard Code for Information Interchange — американський стандартний код для обміну інформацією) є однією з найдавніших і найпоширеніших таблиць кодів. Її першу редакцію опубліковано 1963 року.
У цій таблиці десяткові числа від 0 до 31 є керувальними кодами, а решта — від 32 до 127 — кодують символи: великі й малі літери латинського алфавіту, розділові знаки, знаки математичних операцій тощо. Код 32 відповідає символу пропуск, код 33 — знаку оклику і т. д.
Щоб побачити на екрані символи сучасної версії таблиці ASCI I, слід запустити таку програму мовою Python:
8-бітовий код KOI8-U
Для кодування літер інших (переважно кириличних) алфавітів таблицю ASCII доповнюють до 256 символів. Для цього до 7-бітових кодів ASCII додають на початку 0, а для нових символів застосовують ці ж коди, але з додаванням 1. Так, для літер українського алфавіту використовують таблицю кодів KOI8-U (Код Обміну Інформації 8-біто-вий Український). Розглянемо фрагмент таблиці кодів KOI8-U:
Так, мала літера а українського алфавіту в таблиці кодів KOI8-U має десятковий код 193, що відповідає двійковому: 11000001.
Стандарт Юнікод
Із розвитком і поширенням комп’ютерів виникла потреба в кодуванні значно більшої кількості символів, ніж дозволяють 8-бітові коди. Тому в сучасних текстових документах здебільшого використовується сімейство кодів, описаних у стандарті Юнікод (Unicode — уніфіковане кодування). Завдяки збільшеній довжині коду символу код UTF-8 дозволяє закодувати 1 112 064 різних символів.
Одиниці вимірювання довжини двійкового коду
Обсяг даних вимірюється довжиною двійкового коду.
Послідовність із 8 двійкових розрядів (бітів) називають байтом. Наприклад, 10101101.
За 8-бітового кодування тексту кожен символ кодується одним байтом. Розділові знаки та пропуски також є символами, що мають свої коди.
Текст «Марійка грає в шахи. » складається з 20 символів із урахуванням пробілів і розділових знаків. Тому за 8-бітового кодування цей текст має обсяг 20 байтів.
На практиці зручніше користуватися більшими одиницями вимірювання: кілобайт (Кбайт), мегабайт (Мбайт), гігабайт (Гбайт), тера-байт (Тбайт) та ін. В інформатиці префікси кіло, мега, гіга, тера мають дещо інший зміст, ніж в інших науках
На початку ХХІ ст. введено стандарт іменування одиниць вимірювання обсягів даних: Кібібайт, Мебібайт, Гібібайт тощо. Але сьогодні ці назви практично не використовують
Нехай сторінка книжки в електронному вигляді містить 56 рядків по 64 символи в кожному рядку. Обчислимо обсяг даних (довжину двійкового коду) на сторінці. Маємо: 56 • 64 = 3584 (байти).
Щоб обчислити приблизний обсяг текстових даних у книжці, слід кількість символів на сторінці помножити на кількість сторінок. Розрахуємо обсяг даних у книжці, яка має 256 подібних сторінок: 3584 • 256 = 917 504 (байти) = 896 (Кбайтів) = 0,875 (Мбайта).
Не потрібно ототожнювати довжину двійкового коду текстового повідомлення з обсягом інформації, який воно містить.
Двійковий код літери Р має довжину 1 байт. Сама ця літера, намальована на дорожньому знаку, несе змістовне повідомлення для водія: поряд зі знаком є облаштоване місце для стоянки.
Тепер ви знаєте, в яких одиницях і в який спосіб можна вимірювати обсяг текстових даних. Із вимірюванням обсягів інших видів даних, якими оперує комп’ютер, ви ознайомитеся далі.
Питання для самоперевірки
1. Як кодуються дані в комп’ютері?
2. Чому в комп’ютері використовують двійкове кодування?
3. Яким чином кодуються символи в комп’ютері?
4. Що таке біт; байт?
5. У яких одиницях вимірюють довжину двійкового коду?
6. Скільки байтів містить 1 Кбайт; 1 Мбайт?
Вправа 2
1. Знайдіть в інтернеті таблицю кодів символів ASCII. Користую
чись нею, розкодуйте повідомлення:
1001000 1100101 1101100 1101100 1101111 0100001.
2. Змініть програму з прикладу 1 так, щоб поряд із символами
виводились їх числові коди. Запишіть її у файл Вправа 2-2 і перевірте роботу
3. Визначте, вміст скількох книжок (приклад 3) в електронному
вигляді можна зберегти на флеш-носії обсягом 32 Гбайти.
4. Визначте приблизний обсяг текстових даних на сторінці цього
підручника
Комп’ютерне тестування
Виконайте тестове завдання 2 із автоматичною
перевіркою результату
Це матеріал з підручника Інформатика 8 клас Бондаренко (2021)
Наступна сторінка: 3. Кодування графічних даних