в чем суть кодирования информации
Процесс кодирования информации
Что такое кодирование информации
Кодирование – это процесс преобразования данных из исходной формы представления в коды.
Код – это набор условных символов для представления информации.
К целям использования кодирования относятся:
Осторожно! Если преподаватель обнаружит плагиат в работе, не избежать крупных проблем (вплоть до отчисления). Если нет возможности написать самому, закажите тут.
Виды кодирования информации, какие бывают способы изменения вида
Перевести в систему кодов можно текст, цвета, графическое изображение, числа, звук, видео и т.д.
Кодирование текстовой информации
Выделяют 3 основных вида кодирования текста:
Поскольку вся информация представлена в памяти компьютера в двоичной системе, для работы с текстом в ЭВМ используют числовой способ кодирования.
Изначально кодирование символов осуществлялось по 7-битному стандарту. В этой системе вычислительная машина записывала в свою память 128 разных состояний. Каждому из них соответствовала определенная буква, знак или символ.
7-битной системы было недостаточно для записи всех мировых языков. По этой причине создатели программ перешли на 8-битный стандарт, который позволил преобразовать 256 разных знаков.
Двоичное кодирование предполагает, что каждый знак соответствует уникальному двоичному коду. В стандартном коде информационного обмена ASCII регламентируется присвоение символу такой последовательности. Первые 33 кода – это операции, такие как пробел, ввод и т.п. Коды 33 – 127 соответствуют буквам латинского алфавита, цифрам, арифметическим символам и знакам препинания. Коды 128 – 255 – это буквы национального алфавита.
Впервые русские буквы были закодированы в стандарте КОИ-8 на вычислительных машинах с операционной системой UNIX. На сегодняшний день более широко используется стандартная кодировка Microsoft Windows с обозначением «Кириллица». Русские буквы для операционной системы MS-DOS преобразуются в стандарте СР866. В устройствах серии Macintosh компании Apple – это кодировка Мас. Еще один стандарт для представления русского алфавита – ISO 8859-5.
Неудобство существования разных кодовых языков состоит в том, что они не адаптированы. Следовательно, текст, созданный в одном стандарте, не будет отображаться в другой кодовой системе. Разработчики нашли решение этой проблемы и предусмотрели автоматическую перекодировку текстовой информации при работе с разными кодовыми стандартами.
Для работы в интернете применяют международную кодировку Unicode. В отличие от 8-битного стандарта, для преобразования символов использует 2 байта, а не 1. Это позволяет закодировать 65536 различных символов.
Кодирование цвета
Для управления яркостью вводят еще один бит, и получается модель IRGB (от английского Intensity – интенсивность). При этом образуются 8 дополнительных кодов, соответственно, цветовая гамма расширяется до 16 оттенков. Добавляются серый, ярко-синий, ярко-зеленый, ярко-голубой, ярко-красный, ярко-лиловый, ярко-желтый, ярко-белый.
Создание более богатой палитры осуществляется в 6-битной системе, называемой RrGgBb. Код 00 означает, что цвет выключен, 01 – это слабый цвет, 10 – обычный оттенок и 11 – интенсивный. В этом случае можно закодировать 64 цвета. Несмотря на это, на экране параллельно могут отражаться до 16 оттенков, поскольку кодирование в кадровом буфере происходит в 4-битной системе. Представление цвета в RrGgBb применяется на видеоадаптерах EGA.
Еще более широкая гамма доступна в видеоинтерфейсе VGA. Благодаря отведению 6 байт на шифровку каждого основного цвета, количество тонов увеличилось до 256 тыс. Из них на экране одновременно отражается максимум 256 оттенков, так как видеобуфер использует 8-битное преображение информации.
В принтерах используется иная цветовая модель – CMYK. Она базируется на голубом, фиолетовом, желтом и черном цветах (Cyan, Magenta, Yellow, Key color – обозначение черного цвета). Так как эти тона получены при вычитании из белого основных цветов, модель называется субстрактивной.
Выбор такой цветовой модели для полиграфии объясняется техническим удобством. Так как печать производится на бумаге, нужно учитывать свойство поверхности отражать. В этом случае проще считать, сколько света отразилось, чем поглотилось.
Кодирование графической информации
Представление графической информации в компьютерах подразделяется на два формата:
Растровый формат можно назвать точечным. Расположенные строго по строкам и столбцам точки имеют отдельные координаты нахождения на дисплее, цвет и уровень интенсивности. Качество изображения напрямую зависит от количества точек – чем их больше, тем картинка качественнее. Растровый способ кодирования подходит для фотографий.
Векторная графика опирается на закодированные геометрические фигуры. В числовой формат приведены размеры объектов, координаты вершин, толщина контуров цвет заливки. Векторное кодирование удобно применять при создании рекламной продукции.
Кодирование числовой информации
Числа в памяти вычислительных машин хранятся в двоичной системе счисления. Выделяют два способа представления чисел:
Целочисленные значения в компьютере представлены с фиксированной запятой.
Целое положительное число переводят в двоичную систему счисления. К полученному коду приписывают 2 нуля слева. Крайний разряд слева в положительном числе равен 0.
Целое отрицательное число преобразуется следующим образом. Число без минуса переводят в двоичную систему, дополняют его нулями слева. Образовавшийся код переводят в обратный, заменяя нули единицами, а единицы – нулями. К полученной комбинации чисел прибавляют 1.
Порядок кодирования действительного или вещественного числа выглядит следующим образом. Число десятичной системы счисления переводят в двоичную. Определяют так называемую мантиссу числа: перемещают запятую в нужную сторону, чтобы слева не было ни одной единицы. Далее определяют значение порядка – количество знаков, на которое перемещена запятая для определения мантиссы.
Кодирование звуковой информации
Звук – это волны с постоянно меняющейся частотой и интенсивностью, вызванные колебанием частиц. Человек распознает звук благодаря меняющемуся давлению акустической волны на препятствия. Громкость звука зависит от акустики звуковой волны, а тон – от частоты.
При оцифровке непрерывная акустическая волна временно превращается в прерывистую. Дискретная форма представляет собой короткие отрезки с неизменным сигналом.
Частота дискретизации – количество измерений громкости в секунду.
Глубина кодирования звука – количество данных, необходимое для преобразования прерывистых уровней громкости звукового сигнала.
От частоты дискретизации глубины кодирования звука зависит точность воспроизведения оригинального звука. Чем выше эти показатели, тем корректнее представление звуковой информации.
Кодирование видеозаписи
Видеофайл состоит из звукового элемента и графического изображения, поэтому эти составляющие подвергаются раздельной кодировке.
Принципы преобразования звука видеозаписи в двоичную систему аналогичны с кодированием обычной звуковой информации.
Последовательность кодирования графики также схожа с переводом обычного изображения в двоичный код. В случае с видео шифруется лишь первый кадр. Последующие изображения преобразуются относительно предыдущей картинки посредством записи изменений.
По завершении процесса кодирования звуковой дорожки и графики получается двоичный код для хранения в памяти ПК и других электронных носителях. Синхронность воспроизведения видеозаписи осуществляется путем разделения этих операций.
Кодирование для чайников, ч.1
Не являясь специалистом в обозначенной области я, тем не менее, прочитал много специализированной литературы для знакомства с предметом и прорываясь через тернии к звёздам набил, на начальных этапах, немало шишек. При всём изобилии информации мне не удалось найти простые статьи о кодировании как таковом, вне рамок специальной литературы (так сказать без формул и с картинками).
Статья, в первой части, является ликбезом по кодированию как таковому с примерами манипуляций с битовыми кодами, а во второй я бы хотел затронуть простейшие способы кодирования изображений.
0. Начало
Давайте рассмотрим некоторые более подробно.
1.1 Речь, мимика, жесты
1.2 Чередующиеся сигналы
В примитивном виде кодирование чередующимися сигналами используется человечеством очень давно. В предыдущем разделе мы сказали про дым и огонь. Если между наблюдателем и источником огня ставить и убирать препятствие, то наблюдателю будет казаться, что он видит чередующиеся сигналы «включено/выключено». Меняя частоту таких включений мы можем выработать последовательность кодов, которая будет однозначно трактоваться принимающей стороной.
1.3 Контекст
2. Кодирование текста
Текст в компьютере является частью 256 символов, для каждого отводится один байт и в качестве кода могут быть использованы значения от 0 до 255. Так как данные в ПК представлены в двоичной системе счисления, то один байт (в значении ноль) равен записи 00000000, а 255 как 11111111. Чтение такого представления числа происходит справа налево, то есть один будет записано как 00000001.
Итак, символов английского алфавита 26 для верхнего и 26 для нижнего регистра, 10 цифр. Так же есть знаки препинания и другие символы, но для экспериментов мы будем использовать только прописные буквы (верхний регистр) и пробел.
Тестовая фраза «ЕХАЛ ГРЕКА ЧЕРЕЗ РЕКУ ВИДИТ ГРЕКА В РЕЧКЕ РАК СУНУЛ ГРЕКА РУКУ В РЕКУ РАК ЗА РУКУ ГРЕКУ ЦАП».
2.1 Блочное кодирование
Информация в ПК уже представлена в виде блоков по 8 бит, но мы, зная контекст, попробуем представить её в виде блоков меньшего размера. Для этого нам нужно собрать информацию о представленных символах и, на будущее, сразу подсчитаем частоту использования каждого символа:
Кодирование информации: понятие, виды информации
Для того, чтобы перейти к изучению видов кодирования и обработки информации, рассмотрим сначала базовые, наиболее важных для понимания данной темы, определения.
Изменение информации, дающее возможность представить информацию в другой, наиболее удобной для понимания человеком или электронным устройством форме, называется кодированием.
Алгоритм, которым необходимо руководствоваться при отображении одного набора знаков в другом, называют кодом.
Двоичным кодом называют такое отображение одного набора знаков в другом, которое производится при помощи двух символов — 0 и 1.
Под длиной кода понимается то количество знаков, которое требуется для отображения кодируемой информации.
Бит представляет собой отображение двоичной информации, которым можно закодировать либо 0, либо 1. У двух битов значение умножается на два (четыре значения), у трёх – ещё на два (восемь значений) и так далее. Таким образом, значение битов растёт в геометрической прогрессии.
Варианты кодирования информации могут выглядеть таким образом:
Информация может быть представлена в различной форме – в виде текста, в виде фотографии, в виде таблицы, в виде звука и так далее. Но для того, чтобы эта информация стала доступна машине, её необходимо закодировать. Далее мы более подробно рассмотрим каждый вид кодирования информации.
Текстовое кодирование информации: особенности и способы
Текстовая информация представляет собой совокупность неких символов. Это могут быть буквы, цифры, знаки, скобки, кавычки и всё что угодно.
Такая информация преобразуется в двоичный код и хранится в памяти компьютера именно в таком виде. Это становится возможным благодаря коду символа и системе кодировки. Первая представляет собой некоторое положительное число, записанное в память ЭВМ, а второе – совокупность таких чисел. Чаще всего в ПК используется система кодировки с названием «American Standard Code for Informational Interchange», в котором отражается и сама суть операций.
С развитием программного обеспечения, создавались всё новые и новые стандарты кодировки текста, но от старого стандарта было сложно уйти. Поэтому программа реализовывалась 50/50: половина соответствовала старым стандартам, а половина – новым. Благодаря тому, что диапазон был расширен, на каждый из стандартов приходилось по 128 символов.
В России наиболее распространёнными являются восьмибитные кодировки. Такие как KOI8 или UTF8.
Растровое кодирование информации
Известно, что для передачи фотографии, её необходимо сохранить в двоичном коде. Чтобы произвести эту операцию, фотографию делят на множество точек – пиксели. А затем эти пиксели записываются на запоминающее устройство, но только после прохождения процесса разбивки и кодировки цвета каждого пикселя.
Посчитать количество пикселей всего изображения очень просто: необходимо умножить количество пикселей по горизонтали на количество пикселей по вертикали. Например, если размер изображения составляет 2657х1973, то количество пикселей составит 5242261.
Возникает вопрос: а что или кто разбивает изображение на пиксели? Ответ: любое современное устройство – будь то камера телефона, фотоаппарат, вебкамера или даже сканер. У каждого устройства с наличием камеры указано количество мегапикселей. Так, если у камеры 20 мегапикселей, то это значит, что камера разбивает изображение на 20 миллионов мегапикселей в двоичном коде. Поэтому многие стремятся приобрести устройства с большим числом мегапикселей, а производители стремятся увеличивать этот показатель всё больше и больше. Чем больше количество мегапикселей, тем лучше и реалистичнее устройство передаёт картинку. Так, на некоторых устройствах вместо фотографий получается лишь силуэт и дело тут не в том, что камера устройства плоха, а в том, что у неё мало мегапикселей.
При всём при том, лишь большое количество мегапикселей не может гарантировать создание качественного, реалистичного снимка. Это связано с тем, что бинарный код и степень кодирования фотографий зависят не только от количества пикселей, но и от цветового разнообразия.
Самым популярным способом записи цвета является алгоритм RGB, название которого уже содержит в себе ответ – это аббревиатура от слов red, green, blue. Любой цвет или оттенок можно получить лишь используя эти цвета в необходимом количестве. Это и есть базовый концепт алгоритма. Пиксели кодируются в двоичном коде с указанием количества того или иного оттенка, формирующего изображение. Таким образом, насыщенность изображения зависит от количества битов, которые используются для кодирования пикселя: чем их больше, тем больше количество вариантов для микса цветов.
Глубина цвета – это все те цвета отдельных пикселей, которые составляют единое изображение.
Кодирование графической информации
Если в предыдущем пункте мы рассматривали растровую графику (изображение состоит из множества пикселей и тд.), то сейчас настало время поговорить о векторной графике.
Если растровую графику может создавать большое количество устройств, то векторную графику создаёт только компьютер. Это происходит благодаря формированию различных примитивных деталей – окружностей, линий или чего-то другого, выраженного в графическом эквиваленте. Иными словами, чертёжная графика и векторная – это два названия одного и того же процесса.
Такая графика является необходимой для графического оформления чего-либо и достаточно популярна среди дизайнеров, работников редакций и прочих специалистов, которые каждый день имеют дело с рисованием и оформлением чего-либо. Как же записывается такое изображение? Оно записывается в двоичном коде, но не с помощью пикселей, а с помощью примитивов. Также там указываются размеры примитивов, расположение на фоне, цвет заливки и другие детали.
Для того, чтобы записать изображение любой геометрической фигуры, необходимо в двоичный код закодировать информацию о типе объекта, его толщине, длине, цвете, расположении его на фоне и так далее. Это намного проще, чем кодировать растровое изображение, так как в этом случае пришлось бы указывать параметры каждого пикселя. Также большое преимущество векторной графики – изображения не занимают много памяти.
Из недостатков векторной графики можно отметить нереалистичность. Поэтому все устройства работают на растровой графике и сталкиваться с векторной графикой обывателю приходится нечасто.
Кодирование числовой информации
Числовая информация тоже подлежит кодированию. Прежде чем переходить к кодированию, важно определить с какой целью это делается. Так, иногда числовая информация применяется для вычислений, а иногда – для вывода. Все данные, как и рассматривалось ранее, кодируются в двоичной системе в битах, но есть и другие способы кодировки. Однако кодирование информации с помощью 0 и 1 можно назвать самым простым и доступным. Например, за 0 можно принять отсутствие сигнала, а за 1- его наличие. Двоичный код не позволяет делать длинные комбинации и это его существенный недостаток, но часто даже это не становится большой преградой в технологическом процессе.
Чтобы закодировать действительное число, необходимо использовать 80-разрядное кодирование, а после – переводить число в стандартный вид. Чтобы закодировать целое число, нужно просто перевести число из одной системы счисления в другую.
Кодирование звуковой информации
Звуки, которые доступны для слуха человека, имеют два показателя – амплитуду и частоту. Амплитуда (громкость звука) – это то, насколько при колебаниях отклоняется состояние воздуха А частота (высота звука) – это количество колебаний за единицу времени.
Рассмотрим на конкретных примерах показатели амплитуды и частоты. Фейерверк – это низкая частота и большая амплитуда, а писк комара – это высокая частота и маленькая амплитуда.
Как же происходят эти процессы непосредственно на устройстве? Рассмотрим на примере компьютера.
Микрофон улавливает звуки и передаёт показатели колебаний, переводя их в электрические колебания. Далее за дело принимается звуковая карта, которая преобразует эти колебания в двоичный код. Двоичный код фиксируется на запоминающем устройстве. Аудиокарта при этом разделяет звук на мелкие детали и кодирует интенсивность звука – это явление получило название дискретизации: в зависимости от её высоты находится точность геометрии звуковой волны и качество записи, как следствие. Чтобы проще было это понять, можно вспомнить способы кодирования графической информации.
Что происходит при декодировании (воспроизведении звука?). Код превращается в электрические колебания, которые выводящие устройства преобразуют в колебания воздуха.
Несмотря на такое детальное рассмотрение, у многих может возникнуть вопрос: от чего же зависит качество звуков? Если коротко, то от результат дискретизации. Если подробно, то играет роль количество битов и дискретизация – вместе они формируют такой показатель как глубина звука. Это происходит за счёт возможности кодирования каждого участка.
Способы кодирования видеозаписи
Видеозаписи являются хорошим примером компиляции звуковой и графической информации.
Звук кодируется стандартным способом, по тем же алгоритмам, которые были рассмотрены ранее.
Что касается изображения, то технология записи изображений чем-то напоминает растровую графику, но, в целом, есть и довольно занятные особенности. Например: одна секунда видео = 25+- быстро сменяющихся кадров. Нашему глазу сложно это почувствовать, так как кадры не сильно отличаются друг от друга. Поэтому чаще всего при кодировке видеофайлов, записывается только базовый кадр, а второй и последующие формируются с использованием отличий одного кадра от другого.мясо окорокпродвижение сайтов москва топ 10как красиво красить губы карандашом и помадойгубы рисунок карандашом поэтапносколько стоит техническая поддержка сайтаhow to block from facebookbest time to post instagram tuesdayсео алматы
Кодирование информации
Вы будете перенаправлены на Автор24
Общие понятия
Кодирование — это преобразование информации из одной ее формы представления в другую, наиболее удобную для её хранения, передачи или обработки.
Кодом называют правило отображения одного набора знаков в другом.
Длина кода – это количество знаков, используемых для представления кодируемой информации.
Виды кодирования информации
Различают кодирование информации следующих видов:
Кодирование текстовой информации
Любой текст (к примеру, студенческий реферат) состоит из последовательности символов. Символами могут быть буквы, цифры, знаки препинания, знаки математических действий, круглые и квадратные скобки и т.д.
Текстовая информация, как и любая другая, хранится в памяти компьютера в двоичном виде. Для этого каждому ставится в соответствии некоторое неотрицательное число, называемое кодом символа, и это число записывается в память ЭВМ в двоичном виде. Конкретное соотношение между символами и их кодами называется системой кодировки. В персональных компьютерах обычно используется система кодировки ASCII (American Standard Code for Informational Interchange – Американский стандартный код для информационного обмена).
Готовые работы на аналогичную тему
Восьмибитными кодировками, распространенными в нашей стране, являются KOI8, UTF8, Windows-1251 и некоторые другие.
Кодирование цвета
Чтобы сохранить в двоичном коде фотографию, ее сначала виртуально разделяют на множество мелких цветных точек, называемых пикселями (что-то на подобии мозаики). После разбивки на точки цвет каждого пикселя кодируется в бинарный код и записывается на запоминающем устройстве.
Если говорят, что размер изображения составляет, например, х 512х512 точек, это значит, что оно представляет собой матрицу, сформированную из 262144 пикселей (количество пикселей по вертикали, умноженное на количество пикселей по горизонтали).
Однако качество кодирования фотографий в бинарный код зависит не только от количества пикселей, но также и от их цветового разнообразия. Алгоритмов записи цвета в двоичном коде существует несколько. Самым распространенным из них является RGB. Эта аббревиатура – первые буквы названий трех основных цветов: красного – англ.Red, зеленого – англ. Green, синего – англ. Blue. Смешивая эти три цвета в разных пропорциях, можно получить любой другой цвет или оттенок.
На этом и построен алгоритм RGB. Каждый пиксель записывается в двоичном коде путем указания количества красного, зеленого и синего цвета, участвующего в его формировании.
Чем больше битов выделяется для кодирования пикселя, тем больше вариантов смешивания этих трех каналов можно использовать и тем значительнее будет цветовая насыщенность изображения.
Цветовое разнообразие пикселей, из которых состоит изображение, называется глубиной цвета.
Кодирование графической информации
Описанная выше техника формирования изображений из мелких точек является наиболее распространенной и называется растровой. Но кроме растровой графики, в компьютерах используется еще и так называемая векторная графика.
Векторные изображения создаются только при помощи компьютера и формируются не из пикселей, а из графических примитивов (линий, многоугольников, окружностей и др.).
Чтобы записать на запоминающем устройстве векторное изображение круга, компьютеру достаточно в двоичный код закодировать тип объекта (окружность), координаты его центра на холсте, длину радиуса, толщину и цвет линии, цвет заливки. В растровой системе пришлось бы кодировать цвет каждого пикселя. И если размер изображения большой, для его хранения понадобилось бы значительно больше места на запоминающем устройстве.
Тем не менее, векторный способ кодирования не позволяет записывать в двоичном коде реалистичные фото. Поэтому все фотокамеры работают только по принципу растровой графики. Рядовому пользователю иметь дело с векторной графикой в повседневной жизни приходится не часто.
Кодирование числовой информации
При кодировании чисел учитывается цель, с которой цифра была введена в систему: для арифметических вычислений или просто для вывода. Все данные, кодируемые в двоичной системе, шифруются с помощью единиц и нолей. Эти символы еще называют битами. Этот метод кодировки является наиболее популярным, ведь его легче всего организовать в технологическом плане: присутствие сигнала – 1, отсутствие – 0. У двоичного шифрования есть лишь один недостаток – это длина комбинаций из символов. Но с технической точки зрения легче орудовать кучей простых, однотипных компонентов, чем малым числом более сложных.
Целые числа кодируются просто переводом чисел из одной системы счисления в другую. Для кодирования действительных чисел используют 80-разрядное кодирование. При этом число преобразуют в стандартный вид.
Кодирование звуковой информации
Принцип разделения звуковой волны на мелкие участки лежит в основе двоичного кодирования звука. Аудиокарта компьютера разделяет звук на очень мелкие временные участки и кодирует степень интенсивности каждого из них в двоичный код. Такое дробление звука на части называется дискретизацией. Чем выше частота дискретизации, тем точнее фиксируется геометрия звуковой волны и тем качественней получается запись.
Качество записи сильно зависит также от количества битов, используемых компьютером для кодирования каждого участка звука, полученного в результате дискретизации. Количество битов, используемых для кодирования каждого участка звука, полученного при дискретизации, называется глубиной звука.
Кодирование видеозаписи
Видеозапись состоит из двух компонентов: звукового и графического.
Учитывая эту особенность, алгоритмы кодирования видео, как правило, предусматривают запись лишь первого (базового) кадра. Каждый же последующий кадр формируются путем записи его отличий от предыдущего.