Différences
Ci-dessous, les différences entre deux révisions de la page.
Les deux révisions précédentesRévision précédente | |||
2_composition:langues:multilinguisme:codage [2021/02/10 18:58] – Suppression de ce qui ne concerne pas le codage. jejust | 3_composition:langues:multilinguisme:codage [2021/11/21 18:21] (Version actuelle) – Remise en forme de la page. Suppression des restes de code LaTeX. jejust | ||
---|---|---|---|
Ligne 9: | Ligne 9: | ||
Ce codage ne permet pas de représenter les caractères accentués utilisés | Ce codage ne permet pas de représenter les caractères accentués utilisés | ||
dans la langue française. | dans la langue française. | ||
- | On a donc étendu le codage à 256 (sur 8 bits), et assigné les caractères | + | On a donc étendu le codage à(nbsp)256 (sur 8(nbsp)bits), et assigné les caractères |
régionaux aux nombres de 128 à 256. | régionaux aux nombres de 128 à 256. | ||
Ligne 21: | Ligne 21: | ||
Pour les langues asiatiques qui n' | Pour les langues asiatiques qui n' | ||
- | idéogrammes, | + | idéogrammes, |
- | (glyphes) peuvent être codés. Ils ont donc codé leurs glyphes sur 2 octets, ce | + | (glyphes) peuvent être codés. Ils ont donc codé leurs glyphes sur 2(nbsp)octets, ce |
- | qui permet de disposer de 65000 glyphes différents. Plusieurs codages | + | qui permet de disposer de 65000(nbsp)glyphes différents. Plusieurs codages |
différents ont été utilisés pour la même langue, et sont utilisés | différents ont été utilisés pour la même langue, et sont utilisés | ||
concurremment (suivant les machines, les régions, les habitudes, les programmes | concurremment (suivant les machines, les régions, les habitudes, les programmes | ||
Ligne 29: | Ligne 29: | ||
quand des programmes utilisent un codage propriétaire et ne sont plus maintenus. | quand des programmes utilisent un codage propriétaire et ne sont plus maintenus. | ||
(voir déjà | (voir déjà | ||
- | (version 2 de '' | + | (version(nbsp)2 de '' |
les textes sur les nouveaux Macs avec la nouvelle version de '' | les textes sur les nouveaux Macs avec la nouvelle version de '' | ||
- | Le codage sur 8 bits ne permet que l' | + | Le codage sur 8(nbsp)bits ne permet que l' |
dans les cas de langues extrêmement proches comme l' | dans les cas de langues extrêmement proches comme l' | ||
Il est possible de coder les caractères et accents particuliers de ces deux | Il est possible de coder les caractères et accents particuliers de ces deux | ||
- | langues | + | langues sur les 128(nbsp)nombres supplémentaires. |
Pour pouvoir utiliser plusieurs langues très différentes simultanément, | Pour pouvoir utiliser plusieurs langues très différentes simultanément, | ||
- | utiliser l' | + | utiliser l' |
- | toutes les langues. Le codage se fait sur plusieurs octets, et avec des codages | + | Le codage se fait sur plusieurs octets, et avec des codages différents (utf-8, utf-16, etc) |
- | différents (utf-8, utf-16 etc ...) | + | |
Voir plus loin pour les détails. | Voir plus loin pour les détails. | ||
- | Les programmes de saisie de textes | + | Les programmes de saisie de textes |
le passage d'une langue à l' | le passage d'une langue à l' | ||
- | Ils utilisent pour cela soit le 8ème bit du nombre pour savoir si le caractère | + | Ils utilisent pour cela soit le 8< |
est régional ou pas, ou utilisent un système de balises comme le fait < | est régional ou pas, ou utilisent un système de balises comme le fait < | ||
- | Encore faut-il que ce balisage, codage soit documenté pour la pérennité des | + | Encore faut-il que ce balisage, codage soit documenté pour la pérennité des documents saisis. |
- | documents saisis. | + | |
Les éditeurs utf-8 utilisent le codage utf-8 pour représenter les glyphes, | Les éditeurs utf-8 utilisent le codage utf-8 pour représenter les glyphes, | ||
Ligne 58: | Ligne 56: | ||
===== Qu' | ===== Qu' | ||
- | |||
$\Reponse$ | $\Reponse$ | ||
Ligne 64: | Ligne 61: | ||
qu' | qu' | ||
- | Il y a donc une correspondance (bijection ...) entre le codage d'un caractère | + | Il y a donc une correspondance (bijection...) entre le codage d'un caractère |
de texte, et son codage dans la fonte. | de texte, et son codage dans la fonte. | ||
Ligne 73: | Ligne 70: | ||
Nous verrons plus loin comment expliquer à < | Nous verrons plus loin comment expliquer à < | ||
pour le texte, et quel codage est utilisé pour la fonte. | pour le texte, et quel codage est utilisé pour la fonte. | ||
- | |||
- | |||
Ligne 83: | Ligne 78: | ||
Suivant le codage utilisé pour la saisie, il sera peut-être nécessaire de | Suivant le codage utilisé pour la saisie, il sera peut-être nécessaire de | ||
procéder à un transcodage du texte. Par exemple, '' | procéder à un transcodage du texte. Par exemple, '' | ||
- | codage propriétaire (mais documenté ! c'est un logiciel GNU). | + | codage propriétaire (mais documenté! c'est un [[wpfr> |
Il faudra configurer le codage de sauvegarde du texte pour qu'il soit | Il faudra configurer le codage de sauvegarde du texte pour qu'il soit | ||
- | utilisable par < | + | utilisable par < |
- | '' | + | par [[1_generalites: |
+ | '' | ||
- | Le paquetage [[ctanpkg> | + | Le paquetage [[ctanpkg> |
- | l' | + | l' |
préciser le codage de la police utilisée. Ce paquetage permet de traiter de | préciser le codage de la police utilisée. Ce paquetage permet de traiter de | ||
- | nombreux langages. Se reporter à la documentation de [[ctanpkg> | + | nombreux langages. Se reporter à la documentation de [[ctanpkg> |
langues disponibles. | langues disponibles. | ||
- | Voici quelques exemples d' | + | Voici quelques exemples d' |
+ | |||
+ | ==== Un exemple avec “babel” ==== | ||
+ | |||
+ | Le texte a été saisi avec '' | ||
- | \begin{itemize} | ||
- | \item{ Un exemple de [[ctanpkg> | ||
- | Le texte a été saisi avec '' | ||
- | par défaut (FR), et le codage est donc ISO-8859-1. | ||
- | |||
- | |||
<code latex> | <code latex> | ||
- | \documentclass{article} | + | \documentclass{article} |
+ | \usepackage[T1]{fontenc} | ||
+ | \usepackage[latin1]{inputenc} | ||
+ | \usepackage[frenchb]{babel} | ||
+ | % Commentaire : fin du preambule | ||
- | \usepackage[T1]{fontenc} | + | \begin{document} |
- | \usepackage[latin1]{inputenc} | + | |
- | \usepackage[frenchb]{babel} | + | |
- | % Commentaire : fin du preambule | + | \title{Titre de mon article} |
+ | \author{Le Monsieur \and La Madame} | ||
+ | \date{Le \today} | ||
- | \begin{document} | + | |
- | \title{Titre de mon article} | + | \begin{abstract} |
- | \author{Le Monsieur \and La Madame} | + | Résumé |
- | \date{Le \today} | + | \end{abstract} |
- | \maketitle | + | |
- | \begin{abstract} | + | \tableofcontents |
- | Résumé de mon article, passionnant. | + | |
- | \end{abstract} | + | |
- | \tableofcontents | + | \section{Explications} |
- | \section{Explications} | + | \texttt{fontenc}, \texttt{inputenc} |
+ | sont des packages permettant d' | ||
+ | les accents. | ||
+ | \texttt{babel} sert à franciser le | ||
+ | document. | ||
- | \texttt{fontenc}, | + | \end{document} |
- | sont des packages permettant d' | + | </ |
- | les accents. | + | |
- | \texttt{babel} sert à franciser le | + | ==== Un exemple avec “CJK-LaTeX” ==== |
- | document. | + | |
- | + | ||
- | \end{document} | + | |
- | </ | + | |
- | } | + | Cet exemple a été saisi avec '' |
- | \item Un exemple de '' | + | version |
- | Cet exemple a été saisi avec '' | + | langues. Le codage interne est spécifique à '' |
- | version | + | il est possible de spécifier avec quel codage on veut que |
- | langues. Le codage interne est spécifique à '' | + | soit écrit le fichier sur le disque. |
- | il est possible de spécifier avec quel codage on veut que | + | Le texte '' |
- | soit écrit le fichier sur le disque. | + | comprends pas le chinois) et j'en ai seulement traduit la partie |
- | Le texte <<chinese.tex>> | + | en anglais. |
- | comprends pas le chinois) et j'en ai seulement traduit la partie | + | |
- | en anglais. | + | |
- | Le texte a été traité par '' | + | |
- | Il est difficile de montrer des exemples réels car cette FAQ | + | Le texte a été traité par '' |
- | est en langage national, et ne gère pas l' | + | |
- | \ldots | + | Il est difficile de montrer des exemples réels car cette FAQ |
- | Une solution serait d' | + | est en langage national, et ne gère pas l' |
- | travail), mais la taille de cette FAQ augmenterait d'une façon | + | Une solution serait d' |
- | déraisonnable. | + | travail), mais la taille de cette FAQ augmenterait d'une façon |
- | + | déraisonnable. | |
- | Notez la première ligne du texte qui indique à '' | + | |
- | nature de le codage du texte. | + | |
+ | Notez la première ligne du texte qui indique à '' | ||
+ | nature de le codage du texte. | ||
<code latex> | <code latex> | ||
- | |||
%% -*- coding: emacs-mule -*- | %% -*- coding: emacs-mule -*- | ||
\documentclass[12pt]{article} | \documentclass[12pt]{article} | ||
- | \usepackage{times} | + | |
- | \renewcommand{\baselinestretch}{1.2} | + | \renewcommand{\baselinestretch}{1.2} |
\begin{document} | \begin{document} | ||
Ligne 182: | Ligne 173: | ||
sur la partie gauche en chinois traditionnel, | sur la partie gauche en chinois traditionnel, | ||
à droite en chinois simplifié. | à droite en chinois simplifié. | ||
- | '' | + | \texttt{CJK-LaTeX} s' |
- | '' | + | \texttt{Emacs-mule} de telle façon qu'il |
est possible de saisir et d' | est possible de saisir et d' | ||
types de fontes (Big5 pour les caractères | types de fontes (Big5 pour les caractères | ||
Ligne 194: | Ligne 185: | ||
Le fichier a été exporté en utilisant la fonction | Le fichier a été exporté en utilisant la fonction | ||
\verb|cjk-write-file| fournie par le paquetage | \verb|cjk-write-file| fournie par le paquetage | ||
- | '' | + | \texttt{CJK-LaTeX}, et le résultat a été passé à |
- | '' | + | \texttt{PDF-LaTeX}. |
- | Ici, signature en chinois \ldots | + | Ici, signature en chinois\ldots |
\end{document} | \end{document} | ||
Ligne 203: | Ligne 194: | ||
- | \item{Un exemple | + | ==== Un exemple |
- | Vous pourrez trouver des exemples dans la distribution de | + | |
- | '' | + | |
- | \url{http:// | + | |
- | } | + | |
- | \item{Un exemple de '' | + | |
- | Vous pourrez trouver des exemples dans la distribution | + | |
- | '' | + | |
- | \url{http:// | + | |
- | Linux adorée \ldots | + | |
- | Debian propose un paquetage << | + | |
- | dans la section documentation. | + | |
- | } | + | |
- | \item{Un exemple | + | Vous pourrez trouver des exemples dans la distribution |
- | Le texte a été saisi avec '' | + | '' |
- | + | ||
- | + | ||
- | <code latex> | + | |
- | \documentclass[french, | + | |
- | \usepackage[notipa]{ucs} | + | ==== Un exemple avec “THAI-LaTeX” ==== |
- | \usepackage[utf8]{inputenc} | + | |
- | \usepackage[T1]{fontenc} | + | |
- | \usepackage[T3, | + | |
- | \usepackage[greek, | + | |
+ | Vous pourrez trouver des exemples dans la distribution | ||
+ | '' | ||
+ | ou dans votre distribution Linux adorée... | ||
+ | Debian propose un paquetage '' | ||
+ | dans la section documentation. | ||
- | \title{Un titre} | + | ==== Un exemple avec “UCS-LaTeX” ==== |
- | \author{Auteur} | + | Le texte a été saisi avec '' |
+ | |||
+ | |||
+ | <code latex> | ||
+ | \documentclass[french, | ||
- | % commande | + | |
- | \newcommand\frt[1]{\foreignlanguage{french}{#1}} | + | \usepackage[utf8]{inputenc} |
+ | | ||
+ | \usepackage[T3, | ||
+ | \usepackage[greek, | ||
- | % commande \rut pour écrire en russe | ||
- | \newcommand\rut[1]{\foreignlanguage{russian}{# | ||
- | % commande grt pour écrire du texte en grec | + | \title{Un titre} |
- | \newcommand\grt[1]{\foreignlanguage{greek}{#1}} | + | \author{Auteur} |
- | % commande \phot pour écrire du texte en alphabet | + | % commande \frt pour écrire du texte français |
- | %phonétique | + | \newcommand\frt[1]{\foreignlanguage{french}{#1}} |
- | \newcommand\phot[1]{\bgroup\fontencoding{T3}% | + | |
- | \selectfont\SetUnicodeOption{tipa}#1\egroup} | + | |
+ | % commande \rut pour écrire en russe | ||
+ | \newcommand\rut[1]{\foreignlanguage{russian}{# | ||
- | \begin{document} | + | % commande grt pour écrire du texte en grec |
+ | \newcommand\grt[1]{\foreignlanguage{greek}{#1}} | ||
- | \maketitle | + | % commande |
+ | % phonétique | ||
+ | \newcommand\phot[1]{\bgroup\fontencoding{T3}% | ||
+ | \selectfont\SetUnicodeOption{tipa}# | ||
- | \tableofcontents | + | \begin{document} |
- | \section{Je suis auteur de textes multilingues et | + | \maketitle |
- | de dictionnaires: | + | |
- | La composition de textes multilingues dans le cadre | + | \tableofcontents |
- | d' | + | |
- | par | + | |
- | c' | + | |
- | \frt{Russe:} | + | \section{Je suis auteur de textes multilingues et |
+ | de dictionnaires: comment faire ?} | ||
- | Ici suit le texte en Unicode (russe) ... | + | La composition de textes multilingues dans le cadre |
+ | d'un traitement | ||
+ | par \LaTeX{} doit se faire en '' | ||
+ | c'est le seul moyen pour\dots | ||
- | \rut{ texte en russe } | + | \frt{Russe:} |
+ | Ici suit le texte en Unicode (russe)\dots | ||
- | \frt{Grec (en Polytonic)}: | + | \rut{ texte en russe } |
- | Ici suit le texte en grec: | ||
- | \grt{ texte en grec } | + | \frt{Grec polytonique)}: |
- | \end{document} | + | Ici suit le texte en grec: |
- | </ | + | \grt{ texte en grec } |
- | + | ||
- | } | + | |
- | + | ||
- | + | ||
- | \end{itemize} | + | |
+ | \end{document} | ||
+ | </ | ||