Попередня сторінка: 17. Опрацювання, зберігання та розміщен...
Наступна сторінка: Розділ 2. Апаратне забезпеченню комп’...
Розділ 1. Кодування даних
У цьому розділі ви дізнаєтеся про:
- опрацювання даних як інформаційний процес;
- кодування та декодування повідомлень;
- кодування текстових і графічних даних;
- таблиці кодів символів;
- колірні моделі;
- двійкове кодування;
- одиниці вимірювання довжини двійкового коду.
Зміст
1.1. Опрацювання даних як інформаційний процес. Кодування та декодування повідомлень
1.2. Кодування текстових і графічних даних
1.3. Двійкове кодування
Практична робота № 1. «Розв’язування задач на визначення довжини двійкового коду повідомлень»
1.1. Опрацювання даних як інформаційний процес. Кодування та декодування повідомлень
1. Які інформаційні процеси ви знаєте? У чому сутність процесу опрацювання повідомлень?
2. Які існують способи подання повідомлень?
3. Що таке дані? Наведіть приклади даних.
Опрацювання даних як інформаційний процес
У сучасному суспіньстві багато професій пов’язано з опрацюванням даних, поданих словами, числами, графічними зображеннями тощо. Бухгалтери здійснюють нарахування заробітної платні, спираючись на дані про обсяги виконаних робіт. Лікарі ставлять діагноз пацієнтам на основі результатів різних аналізів. Синоптики складають прогноз погоди, аналізуючи дані метеостанцій про рух повітряних мас. Астрономи розраховують траєкторії руху космічних об’єктів за результатами спостережень за їх положенням. Художник створює ілюстрації до книжки, ознайомившися з її змістом (мал. 1.1). Виконують опрацювання даних і учні/учениці, коли розв’язують задачі, пишуть твори, будують графіки функцій тощо.
Як ви вже знаєте, опрацювання даних - це процес отримання нових даних з наявних.
Так, якщо розв’язують математичну задачу, то з наявних (початкових, вхідних) даних умови задачі отримують нові (вихідні) дані - розв’язок задачі. Для визначення переможців легкоатлетичного забігу дані опрацьовують, розміщуючи прізвища учасників/учасниць забігу в списку відповідно до часу подолання ними дистанції від найменшого до найбільшого значення часу. А під час побудови діаграми в табличному процесорі з наявних числових даних утворюються нові дані, подані графічним способом.
Опрацьовувати дані можна з використанням різноманітних пристроїв, у тому числі з використанням комп’ютера. Для цього потрібно подати дані у вигляді, придатному для опрацювання пристроями комп’ютера, та визначити правила, за якими повинно відбуватися опрацювання.
Кодування повідомлень
З метою зберігання, передавання, опрацювання, захисту повідомлень нерідко змінюють спосіб їх подання. Наведемо кілька прикладів:
• Усні повідомлення записують на папері, замінюючи звуки людської мови літерами алфавіту. При цьому виконується збереження повідомлень.
• Під час розмови по телефону звуки перетворюються на електричні сигнали. Це робить можливим передавання повідомлень на великі відстані.
• Розв’язуючи задачу на уроці математики, слова, що позначають числа, записують цифрами, а математичні операції - спеціальними знаками. Це спрощує опрацювання числових даних.
• Для захисту повідомлень від сторонніх осіб здійснюють шифрування, замінюючи літери в тексті повідомлення іншими літерами, числами або умовними позначеннями.
Процес заміни однієї послідовності сигналів, якою подано повідомлення, іншою послідовністю сигналів називають кодуванням повідомлення.
Кодування є одним із прикладів опрацювання даних. При цьому змінюється спосіб подання, а зміст повідомлення не змінюється.
Кодування широко використовується в сучасному житті для подання повідомлень у вигляді, придатному для опрацювання не лише людиною, а й технічними пристроями. Так, відомості про товари кодують з використанням штрих-ко-дів (мал. 1.2). Цифрами на штрих-коді позначено відомості про товар, країну та підприємство, що є виробником цього товару. Цей числовий код призначено
для опрацювання людиною та використовується для впорядкованого зберігання даних про товари. А товщина ліній штрих-коду та відстань між ними кодують ті самі відомості. Цей графічний код сприймається спеціальними сканерами та опрацьовується з використанням комп’ютера.
Для кодування повідомлень визначають не лише набір сигналів, які будуть використані для заміни сигналів заданого повідомлення, а й правила, за якими здійснюється ця заміна.
Наприклад, з історії добре відомий шифр, яким користувався для секретного листування зі своїми
генералами римський імператор Гай Юлій Цезар (100 р. до н.е. -44 р. до н.е.). Правила кодування полягають у тому, що кожна літера в тексті повідомлення замінюється іншою, що міститься в алфавіті на відстані кількох позицій від заданої літери (мал. 1.3).
Так, закодувавши повідомлення «привіт» з використанням шифру Цезаря зі зсувом на 4 літери праворуч, отримуємо повідомлення «уфкелц».
Декодування повідомлень
Знаючи правило, за яким було закодовано повідомлення, можна його розкодувати. Процес отримання початкового повідомлення із закодованого називають декодуванням повідомлення.
Декодування повідомлень відбувається, коли ми читаємо вголос надрукований текст, виконуємо музичний твір по нотах, розшифровуємо повідомлення, визначаємо за штрих-кодом країну, у якій виготовлено товар, тощо.
Так, для декодування повідомлення, закодованого шифром Цезаря зі зсувом на 4 літери праворуч, потрібно кожну літеру закодованого повідомлення замінити іншою, яку розміщено в алфавіті на 4 позиції ліворуч від заданої. Таким чином, декодувавши повідомлення «зтдфкн зисб», отримуємо «добрий день».
Кодування та декодування повідомлень є прикладами процесів опрацювання даних.
Працюємо з комп'ютером
Виконайте тренувальні завдання за посиланням
https://cutt.ly/dhdeHOF
або QR-кодом.
Найважливіше в цьому пункті
Опрацювання даних - це процес отримання нових даних з наявних шляхом виконання дій за деяким алгоритмом.
Кодування повідомлення - це процес заміни однієї послідовності сигналів, якою подано повідомлення, іншою послідовністю.
Кодування повідомлень виконується з метою їх зберігання, передавання, подальшого опрацювання та захисту. При цьому змінюється спосіб подання, але зміст повідомлення не змінюється.
Для кодування повідомлень визначають набір сигналів, які будуть використані для заміни сигналів заданого повідомлення, та правила, за якими здійснюється ця заміна.
Декодування повідомлення - це процес отримання початкового повідомлення із закодованого.
Лайте вілповілі на запитання
1°. У чому полягає процес опрацювання даних?
2*. Які нові дані можуть бути отримані в результаті опрацювання даних про:
а) кількість і ціну проданих у магазині товарів;
б) зріст учнів та учениць класу;
в) відстань між двома населеними пунктами та швидкість руху поїзда, що курсує між ними?
З*. У чому полягає процес кодування повідомлень?
4*. З якою метою здійснюють кодування повідомлень?
5*. З якою метою звуки музики кодують нотами; повідомлення про особливості руху по дорозі кодують дорожніми знаками?
6*. Повідомлення про що можна закодувати з використанням кольорів; графічних позначень?
7*. Що потрібно попередньо визначити для кодування повідомлення?
8*. За якими правилами у грі «Морський бій» кодують положення кораблів? З якою метою?
9°. У чому полягає процес декодування повідомлень?
Виконайте завлання
1*. Наведіть приклади кодування повідомлень, які використовуються в музиці, фізиці, хімії, географії та ін.
2*. Закодуйте з використанням шифру Цезаря зі зсувом на 4 літери праворуч повідомлення:
а) інформатика·, б) моя шкопа\ в) кодування повідомлень.
'З*. Повідомлення закодовано шифром Цезаря зі зсувом на 3 літери праворуч. Декодуйте повідомлення: а) дзузфзра; б) егург тсесжг\
в) ргдьгоарйм укн усїтсьгдфв.
4*. Зображення, створене олівцем на аркуші паперу в клітинку, закодовано за таким правилом: стрілка вказує напрямок, у якому переміщується олівець по лінії сітки, а число вказує кількість клітинок для переміщення. Відтворіть закодоване зображення:
5*. Закодуйте наведене зображення літер (мал. 1.4) за таким правилом: стрілка вказує напрямок, у якому переміщується олівець по лінії сітки, а число вказує кількість клітинок для переміщення.
6*. Доповніть правила кодування, наведені в попередньому завданні, так, щоб можна було позначати переміщення олівця, при якому відбувається і при якому не відбувається малювання.
7*. Один з найдавніших шифрів розробив Полібій (III ст. до н. е.) - грецький історик, полководець, державний діяч. Цей шрифт отримав назву «квадрат Полібія». Кожна літера алфавіту (або пара літер, що відповідають близьким за вимовою звукам) міститься в таблиці. Під час кодування повідомлення кожна літера замінюється парою цифр - номером стовпця та номером рядка таблиці, на перетині яких вона розміщена. Для кодування повідомлень українською мовою можна використати таблицю із 6 стовпців і 5 рядків (мал. 1.5).
Декодуйте з використанням наведеної таблиці повідомлення, закодоване за наведеним правилом:
а) 53 43 13 52 21 52 42;
б) 62 43 51 34 31 11 33 33 65.
8*. Закодуйте повідомлення, використавши правило кодування, наведене в попередньому завданні:
а) інформатика;
б) повідомлення.
9*. Запропонуйте власні правила кодування символів тексту та закодуйте з їх використанням повідомлення:
а) сьогодні гарний день;
б) мені подобається футбол.
10*. Знайдіть відомості та підготуйте повідомлення про способи кодування:
а) азбука Морзе;
б) семафорна азбука;
в) шрифт Брайля;
г) мова квітів «Селам».
1.2. Кодування текстових і графічних даних
1. Що таке кодування повідомлень? З якою метою здійснюють кодування повідомлень?
2. Наведіть приклади кодування текстових повідомлень.
3. Які види графіки ви знаєте? Охарактеризуйте їх.
Кодування текстових даних
Усі дані, які обробляються технічними пристроями, повинні бути закодовані певним чином. Для опрацювання текстових повідомлень з використанням комп’ютера символи повідомлення кодують числами.
Для кодування тексту використовують таблиці кодів символів, у яких кожному символу, що може бути використаний у текстовому повідомленні, поставлено у відповідність деяке число. У 1963 році у СПІД було розроблено таблицю таких кодів символів, призначену для передавання повідомлень телетайпом. Пізніше вона стала стандартом для використання в комп’ютерній техніці й отримала назву таблиця кодів символів ASCII (англ. American Standard Code for Information Interchange - американський стандартний код для обміну інформацією).
У таблиці ASCII літерам англійського алфавіту, цифрам, розділовим знакам, символам редагування та форматування тексту поставлено у відповідність числа від 0 до 127 (табл. 1.1, с. 10).
Коди символів з таблиці ASCII можна знайти в кінці підручника в додатку 1 або за адресою uk.wikipedia.org/wiki/ASCII.
Таблиця кодів символів ASCII містить коди літер лише англійського алфавіту. Для кодування літер інших алфавітів було розроблено інші таблиці кодів символів. Наприклад, таблиці KOI8-U (KOI - код обміну інформацією) та Windows-1251 включають без змін усі коди таблиці ASCII, а також містять коди літер кирилиці. Кодами цих літер є натуральні числа в діапазоні від 128 до 255.
Таблиця 1.1
Групи кодів символів таблиці ASCII
Таблиця кодів символів Windows-1251 є стандартом для кодування літер кирилиці в операційній системі Windows. У ній, наприклад, літера «а» українського алфавіту має код 224, літера «і» - код 179, літера «ґ» - код 180 та ін. Коди символи з таблиці Windows-1251 можна знайти в кінці підручника в додатку 2 або за адресою uk.wikipedia.org/wiki/Windows-1251.
Кирилиця - алфавіт для групи слов’янських мов, до яких належать українська, російська, білоруська, болгарська та інші мови.
Англійська мова та деякі інші західноєвропейські мови мають алфавіт, який називають латиницею.
Цілих чисел від 0 до 255 вистачає, щоб закодувати символи двох алфавітів - латиниці та кирилиці - та деякі інші символи. Але для кодування символів інших алфавітів (грецького та арабського алфавітів, ієрогліфів тощо) потрібно значно більше значень кодів. Для них розроблено таблицю кодів символів Юні-код (англ. Universal Code, Unicode - універсальний код).
Таблиця Юнікод складається із 17 наборів по 65 536 значень кодів у кожному та дає можливість закодувати 1 114 112 різних символів, тобто майже всі символи писемності всіх світових мов. Як і в інших таблицях кодів, у Юнікоді перші 128 кодів відповідають таблиці ASCII. Окремий розділ у таблиці Юнікод містить коди літер кирилиці. Наприклад, літера «а» українського алфавіту має код 1072, літера «/» - код 1110, літера «ґ» - код 1169 та ін.
Порівняння структури різних таблиць кодів символів наведено в таблиці 1.2.
Таблиця 1.2
Порівняння структури таблиць кодів символів
Лля тих, хто хоче знати більше
У табличному процесорі Excel є функції, призначені для визначення коду заданого символа, а також за заданим кодом - відповідного символа в кодових таблицях Windows-1251 та Юнікод:
• CODE - визначення коду заданого символа в кодовій таблиці Windows-1251;
• UNICODE - визначення коду заданого символа в кодовій таблиці Юнікод;
• CHAR - визначення символа за його числовим кодом у таблиці Windows-1251;
• UNICHAR - визначення символа за його числовим кодом у таблиці Юнікод.
Для тих, хто хоче знати більше
Ідеограма (давньогрец. ιδέα - ідея, γράμμα - писемний знак, літера) - писемний знак, що передає, на відміну від літери, не звук певної мови, а деяке ціле слово, поняття, ідею.
У таблиці Юнікод містяться коди не лише літер і цифр, а й символів, які позначають торгові марки, грошові одиниці, символи транскрипцій, ідеограми тощо. Наприклад, кодом символа української грошової одиниці гривні 8 є число 8372, кодом
ідеограми чоловік
є число 4036002432, а ідеограми жінка
число
4036002433 тощо (коди цих символів не є їх порядковими номерами).
Для вставлення символів у текстовий документ можна застосовувати їхні коди з таблиці Юнікод. Для цього потрібно натиснути та утримувати клавішу Alt і набрати код символа на додатковій цифровій клавіатурі. Так, можуть бути вставлені, наприклад, символи сніговик - код 9731, серце у вигляді квітки 5» - код 10087, нота Р - код 9834, шахова фігура слон й - код 9822 та ін. Знайти символ і відповідний йому код можна на сайті Unicode® Character Table (англ. Unicode Character Table - Таблиця символів Юнікоду) (unicode-table.com). Але якщо вибраний вами символ відсутній серед шрифтів на вашому комп’ютері, то він не буде відображатися в документі.
Кодування графічних даних
У комп’ютерній графіці важливим є кодування кольорів.
Існують різні правила кодування кольору - колірні моделі.
Колірна модель - це спосіб кодування різних кольорів спектра у вигляді впорядкованого набору числових значень певних базових компонентів.
Спектр (лат. spectrum - привид) - багатоколірна смуга, яка утворюється під час проходження білого світла через призму або якесь інше середовище, що заломлює світло.
Найчастіше в комп’ютерній графіці використовують колірну модель RGB, якщо зображення буде відтворюватися на екрані, та модель CMYK для друку зображення.
У колірній моделі RGB (мал. 1.6) базовими компонентами є три кольори спектра - червоний (англ. Red), зелений (англ. Green) і синій (англ. Blue). Значення інтенсивності кожного компонента задається цілим числом від 0 до 255. Використовуючи модель RGB, можна закодувати 2563 = 16,7 млн кольорів.
У моделі CMYK використовують чотири базові компоненти: блакитний (англ. Cyan), пурпурний (англ. Magenta), жовтий (англ. Yellow), чорний (англ. ЬІасК) кольори (мал. 1.7). Частка кожного з базових компонентів задається у відсотках (цілим числом від 0 до 100).
У таблиці 1.3 наведено приклади кодування кольорів.
Таблиця 1.3
Приклади кодування кольорів у колірних моделях RGB та CMYK
Ще одна популярна колірна модель HSB має три базові компоненти: відтінок (англ. Ниє), насиченість (англ. Saturation) та яскравість (англ. Brightness).
Побачити код вибраного вами кольору можна під час роботи в різних програмних засобах. Наприклад, у програмах Word і Excel під час вибору кольору для заливки об’єктів подається код кольору в моделі RGB або HSB (мал. 1.8, а), а в програмі LibreOffice Draw - у моделях RGB, HSB та CMYK (мал. 1.8, б).
Кодування графічних даних виконується по-різному залежно від виду графіки.
Як ви вже знаєте, растрове зображення складається з окремих пікселів. Для кодування растрового зображення визначається кількість пікселів у ньому і колір кожного пікселя кодують набором чисел.
Векторне зображення складається з окремих геометричних фігур (графічних примітивів): кіл, відрізків, кривих, прямокутників тощо. Кожен із графічних примітивів має: координати в площині зображення; форму, яку можна описати математичними формулами; параметри контуру та заливки, які кодуються числами. Кодування векторного зображення полягає в описі значень властивостей графічних примітивів, з яких складається зображення.
Наприклад, для побудови круга достатньо закодувати місце розміщення центра, радіус круга, товщину, стиль і колір лінії кола, колір заливки.
Виконайте тренувальні завдання за посиланням
https://cutt.ly/phdeKOJ
або QR-кодом.
Для опрацювання текстових повідомлень з використанням комп’ютера символи повідомлення кодують числами. Для цього можуть використовуватися різні таблиці кодів символів, наприклад, ASCII, KOI8-U, Windows-1251, Юнікод.
Таблиця кодів символів ASCII містить коди 128 символів, KOI8-U, Windows-1251 -256 символів, Юнікод - 1 114 112 символів. У всіх таблицях кодів символів незмінними залишаються перші 128 кодів, що відповідають таблиці ASCII.
Колірна модель - це спосіб кодування різних кольорів спектра у вигляді впорядкованого набору числових значень певних базових компонентів.
Найчастіше використовують колірну модель RGB, якщо зображення буде відтворюватися на екрані, та модель CMYK для друку зображення.
Для кодування растрового зображення визначається кількість пікселів у ньому і колір кожного пікселя кодують набором чисел.
Кодування векторного зображення полягає в описі значень властивостей графічних примітивів, з яких складається зображення.
Лайте вілповілі на запитання
1 °. Як кодують символи текстових повідомлень під час опрацювання їх з використанням комп’ютера?
2°. Які таблиці кодів символів ви знаєте?
З*. Які символи можуть бути закодовані з використанням таблиць кодів символів ASCII, KOI-8U, Windows-1251, Юнікод?
4*. Що спільного та чим відрізняються таблиці кодів символів ASCII, KOI-8U, Windows-1251, Юнікод?
5°. Що таке колірна модель?
6*. Які колірні моделі ви знаєте? Охарактеризуйте їх.
7*. У чому полягає кодування растрового графічного зображення?
8*. У чому полягає кодування векторного графічного зображення? Наведіть приклади.
Виконайте завлання
1е. Повідомлення закодовано з використанням таблиці кодів символів ASCII. Декодуйте його (скористайтеся додатком 1): а) 83117110; б) 104111109101.
f2e. Закодуйте повідомлення кодами з таблиці кодів символів Windows-1251 (скористайтеся додатком 2): а) Інформатика; б) ваше прізвище та ім’я.
З*. Окремі слова в повідомленні закодовано з використанням таблиці кодів символів Юнікод. Знайдіть символи за їх кодами в таблиці та декодуйте повідомлення. Запишіть отриманий текст. Для пошуку символів можна використовувати сайт Unicode® Character Table (unicode-table.com): Сьогодні зранку 9925. Синоптики обіцяють 9928. Збираючись у 127979, не забудьте взяти із собою 9730.
4*. Визначте, які символи будуть уставлені до текстового документа шляхом уведення їхнього коду за натиснутої клавіші Alt для таких кодів: 1234, 3754, 8986, 9708, 9415, 10001, 10239.
5*. Відкрийте файл Розділ 1\Пункт 1.2\завдання 1.2.5.xlsx. У клітинках електронної таблиці записано коди кольорів колірної моделі RGB. Зафарбуйте клітинки в кольори відповідно до наведених кодів. Значення кольорів установіть на вкладці Спектр у вікні вибору кольору заливки. Збережіть електронну таблицю у вашій папці у файлі з тим самим іменем.
6*. Створіть на аркуші Аркуш 1 електронної таблиці зображення, розфарбувавши клітинки в різні кольори. Закодуйте зображення, розмістивши у відповідних клітинках на Аркуші 2 коди кольорів зафарбованих клітинок отриманого зображення згідно з колірною моделлю RGB. Збережіть електронну таблицю у вашій папці у файлі з іменем завдання 1.2.6.xlsx.
1. У чому полягають процеси кодування та декодування повідомлень?
2. Які таблиці кодів символів використовують для кодування текстових повідомлень?
3. Що означають префікси кіло, мега, гіга1
Двійкове кодування. Біт і байт
Як ви вже знаєте, для кодування даних використовують різні набори сигналів. Для кодування звуків мови використовують літери алфавіту. В українському алфавіті 33 літери, в англійському - 26. Для кодування числових значень використовуються 10 цифр. Для кодування команд, що регулюють порядок руху на пішохідних переходах, використовують 3 кольори світлофора.
Найменшу кількість сигналів для кодування повідомлень має азбука Морзе -лише 2 сигнали: крапка та тире.
З 1844 року азбуку, яку запропонував американський художник Семюел Морзе (1791-1872) і яку назвали на його честь, використовували для передавання повідомлень телеграфом (мал. 1.9).
В азбуці Морзе літери текстових повідомлень кодуються послідовностями крапок і тире. Приклади кодування літер українського алфавіту наведено в таблиці 1.4.
Таблиця 1.4
Приклади кодування літер в азбуці Морзе
Наприклад, слово парта кодується з використанням азбуки Морзе послідовністю сигналів «------ — - ■-».
Кодування повідомлень з використанням сигналів лише двох видів називають двійковим кодуванням. Повідомлення, отримане в результаті двійкового кодування повідомлення, називають двійковим кодом повідомлення.
Двійкове кодування використовується і в сучасних комп’ютерах. У них усі повідомлення кодуються послідовностями сигналів двох видів. Кожний сигнал одного виду умовно позначається цифрою 0, а другого виду - 1.
Цифра 0 або 1 у двійковому коді повідомлення називається бітом (англ. binary digit-двійкова цифра).
З таблиці 1.4 видно, що в азбуці Морзе для кодування літери «т» використовується 1 сигнал - тире, для кодування літери «а» - два, а для літери «п» - чотири сигнали. Під час передавання повідомлень телеграфом одну літеру від іншої відокремлюють проміжками в подачі сигналів. Для опрацювання даних з використанням комп’ютера це не зручно. Простіше відокремити одну літеру від іншої, коли на їх кодування буде використано однакову кількість сигналів.
Якщо для кодування повідомлення використовується один двійковий сигнал (біт) 0 або 1, то можна закодувати, наприклад:
• висновок про правильність твердження: хибне - 0 або істинне - 1\
• стать людини: жіноча - 0 або чоловіча - 1\
• стан вимикача: вимкнено - 0 або ввімкнено - 1
тощо.
З двох бітів можна скласти 4 (22) різних кодів (00, 01,10 і 11). Ними можна закодувати, наприклад, чотири сторони горизонту: 00-північ, 01 - схід, 10-південь, 11 - захід.
З трьох бітів можна скласти вже 8 (23) різних кодів (000, 001, 010, 011, 100, 101, 110, 111). Ними можна закодувати, наприклад, номери рядків або стовпців шахівниці.
Із чотирьох бітів можна скласти 24 = 16 кодів, з п’яти - 25 = 32 коди і т. д.
З восьми бітів можна скласти 28 = 256 кодів, і цієї кількості кодів достатньо, щоб закодувати всі літери англійського та українського (або якогось іншого) алфавітів, арабські цифри, розділові знаки, знаки арифметичнихдій, а такождеякі інші символи. Саме така кількість кодів міститься, наприклад, у таблиці кодів символів Windows-1251.
Послідовність із восьми бітів називається байтом і позначається Б.
Довжина двійкового коду повідомлень
Якщо символ повідомлення кодується послідовністю з 8 бітів, то довжина двійкового коду цього символа дорівнює 8 бітів або 1 Б.
Довжина двійкового коду повідомлення - це кількість бітів або байтів у двійковому коді цього повідомлення.
Наприклад, повідомлення Інформатика - цікавий предмет! містить ЗО символів (включаючи символи пропусків, тире, знак оклику). Якщо кожний символ кодувати двійковим кодом завдовжки 1 Б, то довжина двійкового коду такого повідомлення дорівнюватиме ЗО Б.
Як ви вже знаєте, у таблиці кодів символів Windows-1251 кожний символ має код - ціле число від 0 до 255. У свою чергу, кожне із цих чисел може бути закодовано одним байтом. Приклади такого кодування наведено в таблиці 1.5.
Таблиця 1.5
Приклади двійкового кодування
Таким чином, кожен символ у таблиці кодів символів Windows-1251 має двійковий код завдовжки 1 Б.
Щоб виконати двійкове кодування текстового повідомлення, можна кожний його символ замінити двійковим кодом, що відповідає числу з таблиці Windows-1251.
Саме так кодуються текстові документи, створені в текстовому редакторі Блокнот, при їх збереженні на носії даних, якщо під час збереження використовувати кодування ANSI (англ. American National Standards Institute - Американський національний інститут стандартів). Довжина двійкового коду повідомлення, що міститься в такому документі, буде дорівнювати в байтах кількості символів у текстовому документі. Треба врахувати, що кожне натискання клавіші Enter кодується двома спеціальними символами - символом переходу на новий рядок і символом повернення на початок рядка.
Під час кодування текстів з використанням кодової таблиці Юнікод довжина двійкового коду різних символів є різною - 1 Б, 2 Б, 4 Б і більше.
Графічні, звукові та відеоповідомлення для їх опрацювання комп’ютером також кодуються двійковими кодами.
Довжину двійкового коду повідомлень також називають обсягом даних. Кратні одиниці вимірювання довжини двійкового коду
Для позначення довжини двійкового коду повідомлень використовують кратні одиниці вимірювання, які утворюються з використанням префіксів кіло, мега, гіга, тера та ін. Перелік цих префіксів для позначення кратних одиниць вимірювання визначено в Міжнародній системі одиниць (СІ). Там також наведено відповідні множники. Але історично склалося так, що ці префікси (кіло, мега, гіга, тера) в інформатиці трактуються інакше, ніж, наприклад, у фізиці:
Так сталося тому, що в комп’ютері використовуються двійкові коди, для опрацювання яких зручно оперувати степенями числа 2, а не степенями числа 10. І оскільки 210 = 1024, що приблизно дорівнює 1000, то саме 210 Б = 1024 Б і стали називати кілобайт. Аналогічно 210 кілобайтів стали називати мегабайт і т. д.
Одиниці вимірювання довжини двійкового коду використовують для оцінки розмірів файлів, ємності носіїв даних, об’єму даних, що передаються мережами, та швидкості їх передавання тощо.
Аля тих, хто хоче знати більше
У 1999 році Міжнародна електротехнічна комісія ввела новий стандарт іменування двійкових префіксів. За цим стандартом 1 кБ вважається рівним 1000 Б, а величина 1024 Б отримала нову назву - 1 кібібайт (табл. 1.6).
Таблиця 1.6
Префікси та їх значення, затверджені Міжнародною електротехнічною комісією
Перехід на традиційні значення префіксів кіло, мега, гіга, тера та інші під час вимірювання довжини двійкового коду відбувається досить повільно.
У цьому підручнику, як це склалося історично, будемо вважати, що 1 кілобайт = 1024 байти.
Перехід від одних одиниць вимірювання довжини двійкового коду до інших
Довжину двійкового коду повідомлень можна вказувати в бітах, байтах і в кратних їм одиницях. Розглянемо кілька задач на перехід під час визначення довжини двійкового коду повідомлення від одних одиниць вимірювання до інших.
Задача 1. Довжина двійкового коду повідомлення складає 4,5 МБ. Виразити це значення в байтах. Скільки символів у кодуванні Windows-1251 буде закодовано?
Розв’язання. Для переходу від мегабайтів до байтів спочатку виразимо довжину двійкового коду цього повідомлення в кілобайтах. Ураховуючи, що 1 МБ = 1024 кБ, маємо 4,5 МБ ■1024 = 4608 кБ.
Переведемо кілобайти в байти, ураховуючи, що 1 кБ = 1024 Б:
4608 кБ - 1024 = 4 718 592 Б.
Відповідь: 4,5 МБ = 4 718 592 Б. Оскільки в таблиці Windows-1251 1 символ кодується одним байтом, то закодовано буде 4 718 592 символи.
Задача 2. Двійковий код повідомлення складається з 4 194 304 000 бітів. Виразити довжину двійкового коду цього повідомлення цілим числом у найбільших можливих одиницях.
Розв’язання. Переведемо біти в байти, ураховуючи, що 1 Б = 8 бітів:
4 194 304 000 бітів : 8 = 524 288 000 Б.
Отримане число більше за множник 1024, який використовується для переходу від байтів до кілобайтів. Тому переведемо байти в кілобайти:
524 288 000 Б : 1024 = 512 000 кБ.
Аналогічно міркуючи, переведемо кілобайти в мегабайти:
512 000 кБ: 1024 = 500 МБ.
Отримане значення менше ніж 1024, тому перейти до більшої одиниці зі збереженням цілого результату неможливо.
Відповідь: 4 194 304 000 бітів = 500 МБ.
Задача 3. Обчислити наближено довжину двійкового коду тексту підручника з інформатики (не враховуючи форматування та малюнки).
Розв’язання. Вважатимемо, що текст закодовано з використанням таблиці кодів символів Windows-1251, тобто довжина двійкового коду кожного символа складає 1 Б.
У кожному рядку тексту міститься приблизно 60 символів, тобто довжина двійкового коду рядка складає приблизно 60 Б. На кожній сторінці розміщено в середньому 50 рядків. Отже, довжина двійкового коду сторінки складає приблизно 60 ■ 50 = 3000 (Б). У підручнику приблизно 250 сторінок, тобто довжина двійкового коду підручника становить 3000 ■ 250 = 750 000 (Б).
Перейдемо до крупнішої одиниці вимірювання довжини двійкового коду:
750 000 Б : 1024 = 732,4 кБ.
Відповідь: довжина двійкового коду тексту підручника з інформатики становить приблизно 732,4 кБ.
Працюємо з комп'ютером
Виконайте тренувальні завдання за посиланням
https://cutt.ly/whdeZob
або QR-кодом.
Найважливіше в цьому пункті
Кодування повідомлень з використанням сигналів лише двох видів називається двійковим кодуванням. Повідомлення, отримане в результаті двійкового кодування початкового повідомлення, називають двійковим кодом повідомлення. Цифра 0 або 1 у двійковому коді повідомлення називається бітом. Послідовність із восьми бітів називається байтом.
Довжина двійкового коду повідомлення - це кількість байтів у двійковому коді цього повідомлення.
Кожному символу в таблиці кодів символів Windows-1251 відповідає двійковий код завдовжки 1 Б.
Лайте вілповілі на запитання
1°. У чому полягає двійкове кодування повідомлень?
2°. Що таке 1 біт?
3°. Чому дорівнює 1 байт?
4*. Що таке довжина двійкового коду повідомлення?
5°. Якою є довжина двійкового коду кожного символа в таблиці кодів символів Windows-1251?
6*. Чому дорівнюватиме довжина двійкового коду повідомлення, створеного в текстовому редакторі Блокнот і збереженому в кодуванні ANSI? У кодуванні UTF-8?
7*. На скільки буде відрізнятися довжина двійкового коду повідомлення, у якому зазначено ваше ім’я, якщо його створити в текстовому редакторі Блокнот і зберегти в кодуванні ANSI у двох варіантах: записаним в один рядок і записаним у стовпчик по одній літері в рядку?
8*. Чому дорівнює: 1 кілобайт; 1 мегабайт; 1 гігабайт; 1 терабайт?
9*. Яку математичну операцію потрібно виконати для переведення під час вимірювання довжини двійкового коду повідомлень:
а) з бітів у байти;
б) з байтів у кілобайти;
в) з мегабайтів у кілобайти?
Виконайте завлання
1°. Наведіть приклади, де використовується двійкове кодування повідомлень. 2*. Закодуйте з використанням азбуки Морзе слова порт, рота, торт. Порівняйте кількість сигналів у двійковому коді цих слів.
З*. Визначте довжину двійкового коду повідомлення за умови, що повідомлення закодовано з використанням таблиці кодів символів Windows-1251:
а) Таблиця кодів символів Windows-1251.
б) В алфавіті азбуки Морзе два символи - крапка та тире.
[4в. Порівняйте довжину двійкового коду текстового повідомлення Людина без друзів - що дерево без коріння, створеного в текстовому редакторі Блокнот, якщо зберегти його з використанням різних кодових таблиць.
5*. Заповніть пропуски:
7*. В одному рядку деякого тексту розміщується в середньому 60 символів, а на одній сторінці - 40 рядків. Скільки закодованих сторінок цього тексту можна взяти, щоб довжина двійкового коду не перевищила 8 МБ, якщо для кодування використати таблицю Windows-1251?
«Розв’язування задач на визначення довжини двійкового коду повідомлень»
Увага! Під час роботи з комп’ютером дотримуйтеся вимог безпеки життєдіяльності та санітарно-гігієнічних норм.
1. Обчисліть довжину двійкового коду деякого тексту за умови, що символи тексту закодовано з використанням таблиці кодів символів Windows-1251. У тексті 32 сторінки, кожна сторінка тексту містить 48 рядків, у кожному рядку в середньому 56 символів. Виразіть довжину двійкового коду цього тексту цілим числом у найбільших можливих одиницях.
2. Визначте, використовуючи текстовий редактор Блокнот, довжину двійкового коду повідомлення Практична робота № 1 за умови, що повідомлення закодовано з використанням таблиці кодів символів:
а) Windows-1251 (кодування ANSI);
б) Юнікод (кодування UTF-8).
Збережіть текстові документи з повідомленням у файлах з іменами практична 1 Windows.txt і практична 1 Юнікод-txt.
3. Заповніть у табличному процесорі таблицю:
Збережіть результат у файлі з іменем практична l.xlsx.
Це матеріал з підручника Інформатика 8 клас Ривкінд (2021)
Наступна сторінка: Розділ 2. Апаратне забезпеченню комп’...