\'e
pour « », etc.Est-ce que TeX est compatible avec Unicode?
Unicode est un schéma de codage des caractères qui a la capacité de représenter les textes de toutes les langues du monde, ainsi que des symboles importants (y compris les symboles mathématiques).
Nativement, TeX comprend les schémas de codage utilisant des octets simples (c'est-à-dire codant les caractères sur 8 bits1), et ne pouvant donc représenter que 256 caractères au maximum). Or Unicode, pour pouvoir représenter un très grand nombre de caractères, peut nécessiter plusieurs octets par caractère.
Pour que les applications « à l'ancienne », comme TeX ou pdfTeX, puissent comprendre un fichier en Unicode,
la séquence d'octets composant chaque caractère Unicode doit être traitée par une série de macros qui fournissent
un numéro de glyphe dans une police appropriée. Les macros qui lisent le flux d'entrée sont compliquées,
mais pour l'utilisateur, il suffit d'utiliser l'option utf8
quand il charge l'extension inputenc
(présente par défaut sur toute installation de LaTeX):
\usepackage[utf8]{inputenc}
Depuis 2018, il n'y a même plus besoin d'inclure cette ligne dans le préambule des documents: c'est l'option par défaut.
Cette option ne sait traiter que les caractères Unicode qui peuvent être représentés avec
les « encodages standards de LaTeX ».
Le paquet séparé ucs fournit une couverture plus large, mais moins robuste, via l'option utf8x
de inputenc.
utf8
est très souvent suffisante.
En règle générale, vous ne devriez jamais utiliser utf8x
avant d'être convaincu que utf8
ne suffit pas.
Les applications « modernes », telles XeTeX et LuaTeX, lisent leur entrée en utilisant par défaut des représentations UTF-8 d'Unicode. Elles utilisent également des polices TrueType ou OpenType pour leur sortie; or chacune de ces polices possède des tables qui indiquent à l'application quelle(s) partie(s) de l'espace Unicode elle couvre, ce qui permet au moteur de décider quelle police utiliser pour tel ou tel caractère (si besoin).
Tout ce ceci fait qu'UTF-8 est maintenant complètement supporté par LaTeX, et que vous n'avez plus besoin d'avoir peur de convertir vos documents anciens.
Source: Unicode and TeX