get_html_translation_table
(PHP 4, PHP 5, PHP 7, PHP 8)
get_html_translation_table — Liefert die Umwandlungstabelle, die von htmlspecialchars() und htmlentities() verwendet wird
Beschreibung
$table
= HTML_SPECIALCHARS
, int $flags
= ENT_QUOTES | ENT_SUBSTITUTE | ENT_HTML401, string $encoding
= "UTF-8"): arrayget_html_translation_table() gibt die Umwandlungs-Tabelle zurück, die intern in den Funktionen htmlspecialchars() und htmlentities() verwendet wird.
Hinweis:
Sonderzeichen können auf unterschiedliche Weise kodiert werden.
"
kann kodiert werden als"
,"
oder"
. get_html_translation_table() gibt nur die von htmlspecialchars() und htmlentities() genutzte Form zurück.
Parameter-Liste
-
table
-
Die Tabelle, die zurückgegeben werden soll. Entweder
HTML_ENTITIES
oderHTML_SPECIALCHARS
. -
flags
-
Eine Bitmaske von einem oder mehreren der folgenden Flags, die festlegen, welche Anführungszeichen die Tabelle enthalten wird, sowie für welchen Dokumenttyp sie ist. Der Standardwert ist
ENT_QUOTES | ENT_SUBSTITUTE | ENT_HTML401
.Verfügbare flags
-KonstantenName der Konstante Beschreibung ENT_COMPAT
Die Tabelle soll Entities für doppelte Anführungszeichen enthalten, aber nicht für einfache. ENT_QUOTES
Die Tabelle soll Entities sowohl für einfache als auch doppelte Anführungszeichen enthalten. ENT_NOQUOTES
Die Tabelle soll weder Entities für einfache noch für doppelte Anführungszeichen enthalten. ENT_SUBSTITUTE
Ersetzt ungültige Code-Unit-Sequenzen mit dem Unicode-Ersatzzeichen U+FFFD (UTF-8) oder � (andernfalls), anstatt eine leere Zeichenkette zurückzugeben. ENT_HTML401
Die Tabelle für HTML 4.01. ENT_XML1
Die Tabelle für XML 1. ENT_XHTML
Die Tabelle für XHTML. ENT_HTML5
Die Tabelle für HTML 5. -
encoding
-
Definiert die zu verwendende Zeichenkodierung. Wenn nicht angegeben, ist der Standardwert für dieses Argument UTF-8.
Die folgenden Zeichensätze werden unterstützt:
Unterstützte Zeichensätze Zeichensatz Alias Beschreibung ISO-8859-1 ISO8859-1 Westeuropäisch, Latin-1. ISO-8859-5 ISO8859-5 Wenig verwendeter kyrillischer Zeichensatz (Latin/Cyrillic). ISO-8859-15 ISO8859-15 Westeuropäisch, Latin-9. Enthält das Euro-Zeichen sowie französische und finnische Buchstaben, die in Latin-1(ISO-8859-1) fehlen. UTF-8 ASCII-kompatibles Multi-Byte 8-Bit Unicode. cp866 ibm866, 866 DOS-spezifischer kyrillischer Zeichensatz. cp1251 Windows-1251, win-1251, 1251 Windows-spezifischer kyrillischer Zeichensatz. cp1252 Windows-1252, 1252 Windows spezifischer Zeichensatz für westeuropäische Sprachen. KOI8-R koi8-ru, koi8r Russisch. BIG5 950 Traditionelles Chinesisch, hauptsächlich in Taiwan verwendet. GB2312 936 Vereinfachtes Chinesisch, nationaler Standard-Zeichensatz. BIG5-HKSCS Big5 mit Hongkong-spezifischen Erweiterungen; traditionelles Chinesisch. Shift_JIS SJIS, SJIS-win, cp932, 932 Japanisch EUC-JP EUCJP, eucJP-win Japanisch MacRoman Zeichensatz, der von Mac OS verwendet wurde. ''
Eine leere Zeichenkette aktiviert die Erkennung durch die Kodierung des Skripts (Zend multibyte), default_charset und die aktuelle Sprachumgebung (siehe nl_langinfo() und setlocale()), in dieser Reihenfolge. Nicht empfehlenswert. Hinweis: Weitere Zeichensätze sind nicht implementiert. Statt dessen wird die Standard-Kodierung verwendet und eine Warnung ausgegeben.
Rückgabewerte
Gibt die Umwandlungstabelle als Array zurück, wobei die ursprünglichen Zeichen die Schlüssel sind und die Entities die Werte.
Changelog
Version | Beschreibung |
---|---|
8.1.0 |
flags geändert von
ENT_COMPAT zu ENT_QUOTES |
ENT_SUBSTITUTE | ENT_HTML401 .
|
Beispiele
Beispiel #1 Beispiel für eine Umwandlungstabelle
<?php
var_dump(get_html_translation_table(HTML_ENTITIES, ENT_QUOTES | ENT_HTML5));
?>
Das oben gezeigte Beispiel erzeugt eine ähnliche Ausgabe wie:
array(1510) { [" "]=> string(9) "
" ["!"]=> string(6) "!" ["""]=> string(6) """ ["#"]=> string(5) "#" ["$"]=> string(8) "$" ["%"]=> string(8) "%" ["&"]=> string(5) "&" ["'"]=> string(6) "'" // ... }
Siehe auch
- htmlspecialchars() - Wandelt Sonderzeichen in HTML-Entities um
- htmlentities() - Wandelt alle geeigneten Zeichen in entsprechende HTML-Entities um
- html_entity_decode() - Wandelt HTML-Entities in ihre entsprechenden Zeichen um