Manuel de Codage

Le manuel de codage est un standard de saisie pour les textes hiéroglyphiques. Il est officiellement décrit dans [BGH+88]. Les logiciels d'édition de hiéroglyphes utilisent ce standard, mais lui apportent généralement un certain nombre de modifications. Celles-ci répondent, d'une part, à la demande des utilisateurs, qui réclament un meilleur contrôle sur le rendu du système, et d'autre part corrigent quelque bogues dans le standard d'origine (en particulier pour tout ce qui concerne le hachurage des textes).

Ce document se veut une présentation précise de l'état « actuel » du standard. Il se base essentiellement sur winglyph1.2. Dans cette présentation, les éléments présentés sans commentaire spécial font partie de [BGH+88]. Ceux qui sont extraits de Winglyph sont suivis de WG ; ceux qui proviennent de Tksesh sont suivis de Tk. Je ne connais pas assez bien Macscribe pour l'inclure ici.

Conventions

Un texte au format du manuel de codage est a priori écrit en ASCII ou en ISO8859.1.

Du fait de la multiplicité des plates-formes, il serait souhaitable (ce n'est pas le cas actuellement, à ma connaissance) que tout programme traitant des textes au format du MDC reconnût les séquence de codes ascii (10), (13, 10) et (13) comme des fins de lignes.

Description informelle du manuel de codage

le principe général du Manuel est le suivant : les signes sont codés selon leur code typographique dans la fonte de Gardiner (A40, I3, etc.) sauf pour les unilitaires, les bilitaires, et les trilitères. Pour ceux-ci, il est aussi possible d'utiliser leur translittération (voir tableau pour les codes). En cas d'ambiguïté, seul le premier signe dans l'ordre de la liste sera accessible par sa translittération.

Les variantes de signes dont les codes sont suivis d'une astérisque dans la liste, comme A14*, sont codés en remplaçant l'astérisque par un « A » : « A14A », ceux suivis de deux astérisques, comme G7** sont codés avec un « B » : « G7B ».

Les signes sont combinés en les séparant par les symboles « - », « * », « : »   : « - » sépare deux cadrats, « : » permet d'empiler des signes verticalement, et « * » sépare des signes horizontalement, à l'intérieur d'un cadrat. Les parenthèses permettent de changer les priorités.

Ligatures

Le système de ligatures proposé ici est particulier à la version actuelle de TKsesh. Winglyph utilise la même notation, mais considère les ligatures commes des hiéroglyphes composites. En particulier, pour winglyph, une ligature est connue ou inconnue. Pour Tksesh, une ligature est une façon particulière de grouper des hiéroglyphes. Si la ligature est définie, tksesh les groupera d'une manière spéciale, sinon, il se comportera comme si les signes étaient séparés par '*'. Le symbole servant à lier des hiéroglyphes est '&'. Les modificateurs comme \, \t, etc. ne sont pas pris en compte. Les marques grammaticales sont par contre significatives.

exemples

A&t
ligature simple des signes A et t
t&w&t
ligature de trois signes. On peut lier autant de signes que nécessaire.
k-A &p-w
ligature de deux signes n'appartenant pas au même mot

Grammaire du manuel de codage


Serge Rosmorduc
Last modified: Mon Dec 21 14:55:50 MET 1998

Bibliographie

[BGH+88]
Jan BUURMAN, Nicolas GRIMAL, Michael HAINSWORTH, Jochen HALLOF et Dirk VAN DER PLAS. « Inventaire des signes hiéroglyphiqures en vue de leur saisie informatique » ; Mémoires de l'Académie des Inscriptions et Belles Lettres. Institut de France, Paris, 1988.