HTML-Entitäten

HTML-Entitäten für die sichere Verwendung auf Webseiten kodieren und dekodieren

Was ist das und wie funktioniert es?

Ein HTML-Entities-Encoder und -Decoder wandelt Sonderzeichen in ihre HTML-Entity-Form und zurück — < wird zu &lt;, & wird zu &amp;, und akzentuierte oder Symbolzeichen werden zu benannten oder numerischen Codes. Manche Zeichen haben in HTML besondere Bedeutung: ein rohes < beginnt ein Tag, ein rohes & beginnt eine Entity, um sie also als literalen Text auf einer Seite anzuzeigen, müssen sie kodiert werden. Entity-Kodierung ist, wie Sie spitze Klammern, Ampersands, Anführungszeichen und ungewöhnliche Symbole in HTML setzen, ohne dass der Browser sie als Markup fehldeutet.

Der wichtigste Grund zu kodieren ist Korrektheit und Sicherheit: Fügen Sie benutzergelieferten Text ohne Kodierung in eine Seite ein, können Zeichen wie < und > Ihr Layout brechen oder, schlimmer, eingeschleustes Markup als Code laufen lassen. Kodieren neutralisiert das, indem es die Zeichen in harmlose Entities verwandelt, die genau wie getippt angezeigt werden. Dekodieren macht das Umgekehrte — nützlich, wenn Sie entity-kodierten Text erhalten und die Originalzeichen lesen oder verarbeiten wollen. Dieses Tool macht beides im Browser, sodass nichts Eingefügtes hochgeladen wird.

Anwendungsfälle

Häufige Fragen

Welche Zeichen müssen in HTML kodiert werden?

Die wesentlichen sind < (&lt;), > (&gt;), & (&amp;) und, in Attributwerten, die Anführungszeichen " (&quot;) und ' (&#39;). Sie haben strukturelle Bedeutung in HTML, das Kodieren stellt also sicher, dass sie als literaler Text angezeigt statt als Markup geparst werden.

Was ist der Unterschied zwischen benannten und numerischen Entities?

Benannte Entities nutzen eine lesbare Bezeichnung (&copy; für ©), numerische den Codepunkt des Zeichens (&#169; für dasselbe ©). Benannte sind leichter zu lesen, existieren aber nur für manche Zeichen; numerische funktionieren für jedes Zeichen, weshalb beide Formen auftauchen.

Warum ist Kodierung für die Sicherheit wichtig?

Unkodierten Benutzertext in eine Seite einzufügen lässt Zeichen wie < Tags einführen, die eingeschleuste Skripte laufen lassen können — ein Cross-Site-Scripting-Risiko (XSS). Kodieren verwandelt diese Zeichen in inerte Entities, sodass der Text harmlos angezeigt statt als Markup ausgeführt wird.

Ändert Kodieren, wie der Text für einen Leser aussieht?

Nein. Eine korrekt kodierte Entity rendert als das genaue Zeichen, das sie darstellt — &amp; zeigt sich als &, &lt; als <. Das sichtbare Ergebnis ist identisch; Kodieren ändert nur den zugrundeliegenden Quelltext, sodass der Browser das Zeichen als Text statt Markup behandelt.

Text

Groß-/Kleinschreibung · Wortzähler · Zeichenzähler · Lorem-Ipsum-Generator · Leerzeichen entfernen · Textzeilen sortieren