Kwoman.ru: Кодування текстової інформації в комп'ютері

Кодування текстової інформації в комп'ютері - часом невід'ємна умова коректної роботи пристрою або відображення того чи іншого фрагмента. Як відбувається цей процес в ході роботи комп'ютера з текстом і візуальною інформацією, звуком - все це ми розберемо в цій статті.

вступ

Електронна обчислювальна машина (яку ми в повсякденному житті називаємо комп'ютером) сприймає текст дуже специфічне. Для неї кодування текстової інформації дуже важливо, оскільки вона сприймає кожен текстовий фрагмент як група відокремлених один від одного символів.

Які бувають символи?

Які бувають символи

У ролі символів для комп'ютера виступають не тільки російські, англійські та інші літери, а й ще розділові знаки, а також інші знаки. Навіть пробіл, яким ми поділяємо слова при друкуванні на комп'ютері, пристрій сприймає як символ. Чимось дуже нагадує вищу математику, адже там, на думку багатьох професорів, нуль має подвійне значення: він і є числом, і одночасно нічого не означає. Навіть для філософів питання пробілу в тексті може стати актуальною проблемою. Жарт, звичайно, але, як то кажуть, в кожному жарті є частка правди.

Яка буває інформація?

Яка буває інформація

Отже, для сприйняття інформації комп'ютера необхідно запустити процеси обробки. А яка взагалі буває інформація? Темою цієї статті є кодування текстової інформації. Ми приділимо особливу увагу цьому завданню, але розберемося і з іншими мікротеми.

Інформація може бути текстової, числової, звуковий, графічної. Комп'ютер повинен запустити процеси, що забезпечують кодування текстової інформації, щоб вивести на екран те, що ми, наприклад, друкуємо на клавіатурі. Ми будемо бачити символи і букви, це зрозуміло. А що ж бачить машина? Вона сприймає абсолютно всю інформацію - і мова зараз йде не тільки про текст - як певної послідовності нулів і одиниць. Вони складають основу так званого двійкового коду. Відповідно, процес, який перетворює інформацію, що надходить на пристрій інформацію в зрозумілу йому, має назву "бінарне кодування текстової інформації".

Короткий принцип дії двійкового коду

Чому найбільшого поширення в електронних машинах отримало саме кодування інформації двійковим кодом? Текстової основою, яка кодується за допомогою нулів і одиниць, може бути абсолютно будь-яка послідовність символів і знаків. Однак це не єдина перевага, яку має двійкове текстове кодування інформації. Вся справа в тому, що принцип, на якому влаштований такий спосіб кодування, дуже простий, але в той же час досить функціональний. Коли є електричний імпульс, його маркують (умовно, звичайно) одиницею. Немає імпульсу - маркують нулем. Тобто текстове кодування інформації базується на принципі побудови послідовності електричних імпульсів. Логічна послідовність, складена з символів двійкового коду, називається машинним мовою. У той же час кодування і обробка текстової інформації за допомогою двійкового коду дозволяють здійснювати операції за досить короткий проміжок часу.

Біти і байти

Цифра, що сприймається машиною, криє в собі деяку кількість інформації. Воно дорівнює одному біту. Це стосується кожної одиниці і кожного нуля, які складають ту чи іншу послідовність зашифрованої інформації.

Відповідно, кількість інформації в будь-якому випадку можна визначити, просто знаючи кількість символів в послідовності двійкового коду. Вони будуть чисельно рівні між собою. 2 цифри в коді несуть в собі інформацію обсягом в 2 біта, 10 цифр - 10 біт і так далі. Принцип визначення інформаційного обсягу, який криється в тому чи іншому фрагменті двійкового коду, досить простий, як ви бачите.

Кодування текстової інформації в комп'ютері

Ось зараз ви читаєте статтю, яка складається з послідовності, як ми вважаємо, букв алфавіту російської мови. А комп'ютер, як говорилося раніше, сприймає всю інформацію (і в даному випадку теж) як послідовності не букви, а нулів і одиниць, що позначають відсутність і наявність електричного імпульсу.

Вся справа в тому, що закодувати один символ, який ми бачимо на екрані, можна за допомогою умовної одиниці виміру, званої байтом. Як написано вище, у двійкового коду є так звана інформаційна навантаження. Нагадаємо, що чисельно вона дорівнює сумарній кількості нулів і одиниць в обраному фрагменті коду. Так ось, 8 біт складають 1 байт. Комбінації сигналів при цьому можуть бути самими різними, як це легко можна помітити, намалювавши на папері прямокутник, що складається з 8 осередків рівного розміру.

Виходить, що закодувати текстову інформацію можна за допомогою алфавіту, що має потужність 256 символів. В чому полягає суть? Сенс криється в тому, що кожен символ буде мати своїм двійковим кодом. Комбінації, "прив'язують" до певних символів, починаються від 00000000 і закінчуються 11111111. Якщо переходити від двійковій до десяткової системі числення, то кодувати інформацію в такій системі можна від 0 до 255.

Не варто забувати про те, що зараз є різні таблиці, які використовують кодування букв російського алфавіту. Це, наприклад, ISO і КОИ-8, Mac і CP в двох варіаціях: 1251 Росія і 866. Легко переконатися в тому, що текст, закодований в одній з таких таблиць, не з'явиться коректно у відмінній від даної кодуванні. Це відбувається через те, що в різних таблицях до одного і того ж двійкового коду відповідають різні символи.

Спочатку це було проблемою. Однак в даний час в програмах вже вбудовані спеціальні алгоритми, які конвертують текст, приводячи його до коректного виду. 1997 ознаменувався створенням кодування під назвою Unicode. У ній кожен символ має в своєму розпорядженні відразу 2 байта. Це дозволяє закодувати текст, який має набагато більшу кількість символів. 256 �� 65536: є ж різниця?

кодування графіки

Кодування текстової та графічної інформації має деякі схожі моменти. Як відомо, для виведення графічної інформації використовується периферійний пристрій комп'ютера під назвою "монітор". Графіка зараз (мова йде зараз саме про комп'ютерну графіку) широко використовується в самих різних сферах. Благо, апаратні можливості персональних комп'ютерів дозволяють вирішувати досить складні графічні завдання.

Обробляти відеоінформацію стало можливим в останні роки. Але текст при цьому значно "легше" графіки, що, в принципі, зрозуміло. Через це кінцевий розмір файлів графіки необхідно збільшувати. Подолати подібні проблеми можна, знаючи суть, в якій представляється графічна інформація.

Давайте для початку розберемося, на які групи поділяється даний вид інформації. По-перше, це растрова. По-друге, векторна.

Растрові зображення досить схожі з картатою папером. Кожна клітина на такому папері закрашивается тим чи іншим кольором. Такий принцип чимось нагадує мозаїку. Тобто виходить, що в растровій графіці зображення розбивається на окремі елементарні частини. Їх називають пікселями. У перекладі на російську мову пікселі позначають "точки". Логічно, що пікселі впорядковані щодо рядків. Графічна сітка складається якраз з певної кількості пікселів. Її також називають растром. Беручи до уваги ці два визначення, можна сказати, що растрове зображення є не чим іншим, як набором пікселів, які відображаються на сітці прямокутного типу.

Растр монітора і розмір пікселя впливають на якість зображення. Воно буде тим вище, чим більше растр біля монітора. Розміри растра - це дозвіл екрана, про який напевно чув кожен користувач. Однією з найбільш важливих характеристик, які мають екрани комп'ютера, є роздільна здатність, а не тільки дозвіл. Воно показує, скільки пікселів доводиться на ту чи іншу одиницю довжини. Зазвичай роздільна здатність монітора вимірюється в пікселях на дюйм. Чим більше пікселів буде припадати на одиницю довжини, тим вищою буде якість, оскільки "зернистість" при цьому знижується.

Обробка звукового потоку

Кодування текстової та звукової інформації, як і інші види кодування, має деякі особливості. Мова зараз піде про останній процесі: кодуванні звукової інформації.

Подання звукового потоку (як і окремого звуку) може бути вироблено за допомогою двох способів.

Аналогова форма представлення звукової інформації

При цьому величина може приймати справді величезна кількість різних значень. Причому ці самі значення не залишаються постійними: вони дуже швидко змінюються, і цей процес безперервний.

Дискретна форма подання звукової інформації

Якщо ж говорити про дискретно способі, то в цьому випадку величина може приймати лише обмежену кількість значень. При цьому зміна відбувається стрибкоподібно. Закодувати дискретно можна не тільки звукову, але і графічну інформацію. Що стосується і аналогової форми, до речі.

Аналогова звукова інформація зберігається на вінілових пластинках, наприклад. А ось компакт-диск вже є дискретним способом подання інформації звукового характеру.

На самому початку ми говорили про те, що комп'ютер сприймає всю інформацію на машинному мовою. Для цього інформація кодується в формі послідовності електричних імпульсів - нулів і одиниць. Кодування звукової інформації не є винятком з цього правила. Щоб обробити на комп'ютері звук, його для початку потрібно перетворити в ту саму послідовність. Тільки після цього над потоком або одиничним звуком можуть відбуватися операції.

Коли відбувається процес кодування, потік піддається тимчасової дискретизації. Звукова хвиля неперервна, вона розвивається на малі ділянки часу. Значення амплітуди при цьому встановлюється для кожного певного інтервалу окремо.

висновок

Отже, що ж ми з'ясували в ході даної статті? По-перше, абсолютно вся інформація, яка виводиться на монітор комп'ютера, перш ніж там з'явитися, піддається кодування. По-друге, це кодування полягає в перекладі інформації на машинний мову. По-третє, машинний мова являє собою не що інше, як послідовність електричних імпульсів - нулів і одиниць. По-четверте, для кодування різних символів існують окремі таблиці. І, по-п'яте, уявити графічну і звукову інформацію можна в аналоговому і дискретно вигляді. Ось, мабуть, основні моменти, які ми розібрали. Однією з дисциплін, що вивчає цю область, є інформатика. Кодування текстової інформації і його основи пояснюються ще в школі, оскільки нічого складного в цьому немає.

джерело

Яка буває інформація?
Які бувають символи?
Яка буває інформація?
А яка взагалі буває інформація?
А що ж бачить машина?
В чому полягає суть?
? 65536: є ж різниця?

Nav view search

Навигация

Курсы

бесплатные приколы

шаблоны joomla 1.7

Дополнительная информация

Новости

Учебный центр "Магнат"...

Дизаин интерьера и...

web-дизайн

Практическая...

Курсы массажа