Les méthodes de saisie sont utilisées quand le nombre de glyphes utilisés par la langue sont très supérieurs au nombre de touche d'un clavier. Ces méthodes de saisie sont donc utilisées pour toutes les langues à idéogrammes.
Le principe de saisie est le suivant: une fois l'éditeur mis dans le mode «langue à idéogrammes» l'appui d'une touche ne va pas donner un caractère, mais faire apparaître une fenêtre (menu) qui va proposer différents choix en fonction de ce qui a déjà été tapé. Il existe de nombreuses méthodes de saisie qui sont fondées soit sur la phonétique, soit sur la structure, soit une combinaison des deux, soit le codage direct des caractères.
Une bonne méthode de saisie doit se contenter d'un nombre réduit de touches, comme 26 touches par exemple (disponibles sur des claviers occidentaux).
Voyons les méthodes de saisie suivant les langues:
Je vais donner les informations trouvées sur le site: http://seba.ulyssis.org/thesis/im.php, simplement traduites car je ne suis en aucun cas un spécialiste des langues orientales.
Pas de détails trouvés.
Pas de détails trouvés.
La méthode de saisie du japonais est phonétique. On saisit phonétiquement en caractères romains, et le programme qui supporte la méthode de saisie propose le glyphe correspondant qui existe en trois versions: hiraganas, katakanas ou kanjis.
Les informations suivantes ont été trouvées sur la page suivante: http://www.escale-japon.com/accueil.php?page=faq&select=faq
Le japonais utilise 3 systèmes d'écriture:
Voir cette page qui donne quelques informations supplémentaires: http://www.physics.wustl.edu/~alford/japanese_latex.html
Méthode de saisie du russe: (valable pour toutes les langues européennes, et celles dérivées.)
C'est une méthode simple, car il y a correspondance directe entre les touches dessinées sur le clavier et le caractère correspondant.
Pour le russe, j'ai aussi vu une méthode de translittération qui traduisait
les suites de caractères romains en caractères cyrilliques (méthode phonétique).
Un tel mode est disponible dans yudit
.
La méthode est dérivée de la méthode de saisie simple, qui associe un caractère à une touche. Le clavier peut ici se trouver en deux états: clavier romain (latin) et clavier grec. Une touche (combinaison de touches) permet de commuter d'un mode à l'autre. On utilise les touches mortes (de composition) pour certains caractères.
Voir aussi «Comment composer du texte en grec moderne ou classique?».
Il y a environ 8500 glyphes à saisir. On utilise 3 méthodes concurremment:
La méthode est dérivée de la méthode simple une touche pour un caractère, mais modifiée pour supporter les particularités de la langue. elle vérifie la conformité des caractères saisis. Il y a des «tons» qui sont appliqués à certaines voyelles (a, e, i, o, u, y, a-circumflex, e-circumflex, o-circumflex, a-breve, o-horn, or u-horn).
Je vous renvoie aux sites suivants pour avoir plus de détails:
Il y a aussi des listes de diffusion consacrées à Unicode. Voir votre lecteur de news préféré, et chercher «Unicode».
Voir les détails d'installation et de configuration à l'URL suivante: http://ccat.sas.upenn.edu/~nsivin/chinp.html (en anglais).
Voir les détails d'installation et de configuration à l'URL suivante: http://www.yale.edu/chinesemac/pages/input_methods.html.
Voici une liste d'URL qui vous donneront tous les détails de configuration et d'installation des méthodes de saisie. Elles sont disponibles sous forme de paquetages sur toutes les distributions.
Maintenant que votre texte est saisi, vous voulez le traiter avec . Auparavant, il va falloir s'assurer que le codage de votre texte sera accepté par (problème déjà entrevu auparavant). Vous avez plusieurs possibilités suivant l'éditeur utilisé.
autofe
de UCS-LaTeX qui permet de passer d'une langue à l'autre sans baliser le changement.iconv
. Voir dans le chapitre utilitaires pour d'autres programmes. Parfois, votre éditeur préféré vous permet de choisir le codage de sauvegarde du fichier, qui peut être différent de celui de la saisie. Voir Emacs
par exemple. Vous transcoderez votre texte par exemple en codage CJK et traiterez le texte avec CJK-LaTeX
. Le principe est le même pour Ivritex
ou THAI-LaTeX
ou Arab-TeX
.