Vidéo: htmlspecialchars(), remplacer caractères spéciaux 2025
Les encodages pour le jeu de caractères ISO Latin-1 sont fournis par défaut dans tous les navigateurs Web modernes. (Recherchez "Jeu de caractères ISO Latin-1" pour trouver un tableau de valeurs complet.) Ainsi, les entités de caractères de cet ensemble peuvent être utilisées directement dans le balisage HTML sans contorsions particulières.
Cependant, l'utilisation d'autres codages nécessite l'inclusion d'un balisage spécial pour indiquer au navigateur d'interpréter les codes de caractères Unicode. (Unicode est une norme internationale - la norme ISO 10645, en fait - qui englobe suffisamment de codes pour gérer la plupart des alphabets humains, ainsi que de nombreux symboles et caractères non alphabétiques.) Ce balisage spécial prend la forme suivante:
Comme la valeur du jeu de caractères lit UTF-8, vous pouvez référencer toutes les valeurs Unicode courantes. (UTF-8 signifie UCS Transformation Format 8 bits, un format de codage qui représente tous les caractères Unicode.) "Table des caractères UTF-8 Unicode" pour survoler ses codes de caractères d'un million et plus.
Bien que les navigateurs actuels prennent en charge UTF-8 plus ou moins universellement, attendez-vous à voir bientôt un support pour les codes de caractères UTF-16. Les codes de caractères UTF-16 permettent aux navigateurs de traiter plus efficacement les alphabets non romains tels que l'arabe, le katakana (idéogrammes japonais) et le hangul (idéogrammes coréens), que certains navigateurs peinent à rendre correctement et complètement aujourd'hui.
Le logiciel HTML-savvy suppose que certains caractères HTML, tels que les angles droits et gauches (signes inférieurs et supérieurs à la notation mathématique) sont censés être cachés et ne pas être affichés sur votre ordinateur. pages Web terminées. Si vous voulez réellement afficher ces caractères sur vos pages, vous devez faire en sorte que vos souhaits soient clairs pour le navigateur.
Ces entités permettent l'affichage des caractères qui font normalement partie du balisage HTML caché:
-
équerre de gauche (<): << équerre (>): >>
-
ampersand (&): &
-
Si vous avez besoin que ces symboles apparaissent, incluez leurs entités dans votre balise comme ceci: L'élément paragraph identifie du texte comme un paragraphe:
Ceci est un paragraphe
Cette figure montre comment ces entités apparaissent dans une fenêtre de navigateur.
