UTF-8
- Unicode - основная статья.
- Виды кодировок символов - набор символов (character set, charset) и синонимы: кодовая страница, кодировка (encoding). Например Unicode, Windows-1251(CP1251), ASCII.
UTF-8 (Unicode Transformation Format - формат преобразования Юникода) — в настоящее время распространённая кодировка, реализующая представление Юникода(Unicode), совместимое с 8-битным кодированием текста. Формат UTF-8 был изобретён 2 сентября 1992 года Кеном Томпсоном и Робом Пайком и реализован в Plan 9. Сейчас стандарт UTF-8 официально закреплён в документах RFC 3629 и Стандарты ISO/IEC 10646 Annex D.


