Comment fonctionne la césure en TeX?
La césure, c'est la coupure des mots en fin de ligne, comme ici dans « bou-gie » :
Elle est utilisée dans la plupart des livres et journaux, et doit suivre quelques règles pour rester discrète. Quand elle est faite à de mauvais emplacements dans les mots, elle ralentit la lecture et oblige le lecteur à revenir en arrière, par exemple ici:
Les règles de césure sont déterminées par le bon sens, mais aussi par la culture, et pour une même langue, on peut avoir des styles différents selon le pays — par exemple, les styles de césure de l'anglais en Grande-Bretagne et aux États-Unis sont très différents. Par conséquent, un logiciel de mise en page utilisé dans le monde entier doit pouvoir adapter ses règles de césure.
Le système de césure de est plutôt réputé pour sa qualité.
Il a été conçu au départ par Frank Liang, dans le cadre de sa thèse de doctorat.
Bien qu'il soit capable de rater des points de césure qui paraîtraient sensés à un humain,
il choisit rarement des points grossièrement erronés.
L'algorithme prends les « candidats à la césure », c'est à dire des suites de lettres,
et il les compare à un ensemble de « motifs de césure ».
Les caractères qui ne sont pas des lettres ne peuvent pas apparaître dans un candidat,
c'est ainsi que la primitive \accent
de empêche la césure, tout comme les signes de ponctuation
(cela dit, la césure a lieu sur les caractères « envoyés à l'imprimante ».
Donc le problème avec \accent
est évité – en – par l'utilisation du paquet fontenc
,
comme l'explique la page « Pourquoi les mots accentués ne sont-ils pas coupés? »)
Les ensembles de motifs de césure sont généralement dérivés de l'analyse d'une liste de césures valides. Pour et , ce processus de dérivation a été fait à l'aide de l'outil patgen, mais le commun des mortels n'a pas besoin de savoir faire ça.
Pour chaque langue utilisée, les motifs doivent avoir été installés
pour que le moteur puisse s'en servir.
Pour modifier l'ensemble des motifs de césure reconnus par un système ou XeTeX
,
une réinstallation partielle est nécessaire
(notez que LuaTeX
assouplit cette contrainte).
fournit deux commandes à l'utilisateur pour le contrôle
de la césure : \language
(qui sélectionne un style de césure),
et \hyphenation
(qui donne des instructions explicites au moteur de césure,
généralement pour les cas particuliers ou les nouveaux mots, annulant l'effet
des motifs chargés par ailleurs).
L'utilisateur ordinaire de n'a pas à se soucier
de la commande \language
, puisque l'extension babel
s'en occupe pour lui ; l'utilisation de \hyphenation
est expliqué
sur la page évoquant les problèmes de césure.
Sources:
- Coupure de mots en fin de ligne (Université d'Ottawa).