(PHP 3>= 3.0.6, PHP 4)
utf8_encode - кодирует строку ISO-8859-1 в UTF-8. Описание
string utf8_encode (string data) Эта функция кодирует строку data в
UTF-8 и возвращает кодированную версию. UTF-8 это стандартный механизм Unicode
для кодирования wide character-значений в байтовый поток.
UTF-8 прозрачна для обычных ASCII-символов, самосинхронизируется (т.е. программа может указать, где начинаются
символы байтового потока) и может использоваться с функциями сравнения нормальных строк для сортировки их как таковых. PHP кодирует
UTF-8 символы в блоки до 4 байтов, как здесь: Таблица 1. Кодирование UTF-8
байтов | битов | представление |
---|
1 | 7 |
0bbbbbbb | 2 | 11 | 110bbbbb 10bbbbbb | 3 | 16 |
1110bbbb 10bbbbbb 10bbbbbb | 4 | 21 | 11110bbb 10bbbbbb 10bbbbbb 10bbbbbb |
Каждый b представляет бит, который может использоваться для хранения данных символа. |