Текстовая
информация, как и любая другая, хранится в памяти компьютера в двоичном
виде. Для этого каждому символу ставится в соответствие число, называемое
кодом символа. Конкретное соответствие между символами и их
кодами называется системой кодировки.
Одно время в СССР была принята кодировка КОИ-7, которая могла
закодировать 128 символов. Она оказалась неудобной и уступила свое
место кодировке КОИ-8, в которой для кодирования символов использовалось
8 разрядов. Сейчас
в персональных компьютерах обычно исльзуется система кодировки ASCII
(American Standard Code for Information Interchange
- американский стандартный код для обмена информации). В этой системе
не предусмотрены коды для русского алфавита, поэтому в нашей стране
используются варианты этой системы кодировки. В Интернете используют
стандарт Unicode, который определяет коды для знаков, применяемых
во всех современных письменных языках (65 536 кодов). Это и латинский
алфавит для английского языка, кириллический алфавит для славянских
языков, греческий, иврит, арабский алфавит и другие алфавиты используемые
в странах Европы, Азии, Индокитая и Африки.