htmlspecialchars
(PHP 4, PHP 5)
htmlspecialchars —
Преобразует специальные символы в HTML сущности
Описание
string htmlspecialchars
( string $string
[, int $quote_style
[, string $charset
]] )
Эта функция полезна при отображении данных, введенных пользователем,
которые могут содержать нежелательные HTML тэги, например в форуме
или гостевой книге. Необязательный второй аргумент
quote_style
определяет режим обработки
одиночных и двойных кавычек.
В режиме по умолчанию, ENT_COMPAT, преобразуются
двойные кавычки, одиночные остаются без изменений. В режиме
ENT_QUOTES преобразуются и двойные, и одиночные
кавычки. а в режиме ENT_NOQUOTES и двойные, и
одиночные кавычки остаются без изменений.
Производятся следующие преобразования:
-
'&' (амперсанд) преобразуется в '&'
-
'"' (двойная кавычка) преобразуется в '"' when ENT_NOQUOTES
is not set.
-
''' (одиночная кавычка) преобразуется в ''' только в
режиме ENT_QUOTES.
-
'<' (знак "меньше чем") преобразуется в '<'
-
'>' (знак "больше чем") преобразуется в '>'
Пример #1 Пример использования htmlspecialchars()
<?php
$new = htmlspecialchars("<a href='test'>Test</a>", ENT_QUOTES);
echo $new; // <a href='test'>Test</a>
?>
Обратите внимание, что функция не производит других преобразований
кроме описанных выше. Для преобразования всех HTML сущностей
используйте htmlentities(). Поддержка
необязательного второго аргумента была добавлена в PHP 3.0.17 и PHP
4.0.3.
Необязательный третий аргумент charset
определяет кодировку, используемую при преобразовании. По умолчанию
используется кодировка ISO-8859-1. Поддержка этого аргумента была
добавлена в PHP 4.1.0.
Начиная с PHP 4.3.0 поддерживаются следующие кодировки.
Поддерживаемые кодировки
Кодировка |
Псевдонимы |
Описание |
ISO-8859-1 |
ISO8859-1 |
Западно-европейская Latin-1
|
ISO-8859-15 |
ISO8859-15 |
Западно-европейская Latin-9. Добавляет знак евро, французские и
финские буквы к кодировке Latin-1(ISO-8859-1).
|
UTF-8 |
|
8-битная Unicode, совместимая с ASCII.
|
cp866 |
ibm866, 866 |
Кириллическая кодировка, применяемая в DOS.
Поддерживается в версии 4.3.2.
|
cp1251 |
Windows-1251, win-1251, 1251 |
Кириллическая кодировка, применяемая в Windows.
Поддерживается в версии 4.3.2.
|
cp1252 |
Windows-1252, 1252 |
Западно-европейская кодировка, применяемая в Windows.
|
KOI8-R |
koi8-ru, koi8r |
Русская кодировка.
Поддерживается в версии 4.3.2.
|
BIG5 |
950 |
Традиционный китайский, применяется в основном на Тайване.
|
GB2312 |
936 |
Упрощенный китайский, стандартная национальная кодировка.
|
BIG5-HKSCS |
|
Расширенная Big5, применяемая в Гонг-Конге.
|
Shift_JIS |
SJIS, 932 |
Японская кодировка.
|
EUC-JP |
EUCJP |
Японская кодировка.
|
Замечание:
Не перечисленные выше кодировки не поддерживаются, и вместо них
применяется ISO-8859-1.
См. также описание функций get_html_translation_table(),
strip_tags(), htmlentities()
и nl2br().