Manuel de Codage
Le manuel de codage est un standard de saisie pour les textes
hiéroglyphiques. Il est officiellement décrit dans
[BGH+88]. Les logiciels d'édition de
hiéroglyphes utilisent ce standard, mais lui apportent
généralement un certain nombre de modifications. Celles-ci
répondent, d'une part, à la demande des utilisateurs, qui
réclament un meilleur contrôle sur le rendu du système, et d'autre
part corrigent quelque bogues dans le standard d'origine (en
particulier pour tout ce qui concerne le hachurage des textes).
Ce document se veut une présentation précise de l'état « actuel
» du standard. Il se base essentiellement sur
winglyph1.2. Dans cette présentation, les éléments
présentés sans commentaire spécial font partie de [BGH+88]. Ceux qui sont extraits de Winglyph
sont suivis de WG ; ceux qui proviennent de Tksesh sont
suivis de Tk. Je ne connais pas assez bien Macscribe pour
l'inclure ici.
Conventions
Un texte au format du manuel de codage est
a priori écrit en ASCII ou en ISO8859.1.
Du fait de la multiplicité des plates-formes, il serait
souhaitable (ce n'est pas le cas actuellement, à ma
connaissance) que tout programme traitant des textes au format
du MDC reconnût les séquence de codes ascii (10), (13, 10) et
(13) comme des fins de lignes.
Description informelle du manuel de codage
le principe général du Manuel est le suivant : les signes sont
codés selon leur code typographique dans la fonte de Gardiner
(A40, I3, etc.) sauf pour les unilitaires, les bilitaires, et les
trilitères. Pour ceux-ci, il est aussi possible d'utiliser leur
translittération (voir tableau pour les codes). En cas
d'ambiguïté, seul le premier signe dans l'ordre de la liste sera
accessible par sa translittération.
Les variantes de signes dont les codes sont suivis d'une
astérisque dans la liste, comme A14*, sont codés en remplaçant
l'astérisque par un « A » : « A14A », ceux suivis de deux
astérisques, comme G7** sont codés avec un « B » : « G7B ».
Les signes sont combinés en les séparant par les symboles « -
», « * », « : » : « - » sépare deux cadrats, « : » permet
d'empiler des signes verticalement, et « * » sépare des signes
horizontalement, à l'intérieur d'un cadrat. Les parenthèses
permettent de changer les priorités.
Ligatures
Le système de ligatures proposé ici est particulier à la version
actuelle de TKsesh. Winglyph utilise la même notation, mais
considère les ligatures commes des hiéroglyphes composites. En
particulier, pour winglyph, une ligature est connue ou
inconnue. Pour Tksesh, une ligature est une façon particulière de
grouper des hiéroglyphes. Si la ligature est définie, tksesh les
groupera d'une manière spéciale, sinon, il se comportera comme si
les signes étaient séparés par '*'. Le symbole servant à lier des
hiéroglyphes est '&'. Les modificateurs comme \, \t, etc. ne
sont pas pris en compte. Les marques grammaticales sont par contre
significatives.
exemples
- A&t
- ligature simple des signes A et t
- t&w&t
- ligature de trois signes. On peut lier autant de signes que nécessaire.
- k-A &p-w
- ligature de deux signes n'appartenant pas au même mot
Grammaire du manuel de codage
Serge Rosmorduc
Last modified: Mon Dec 21 14:55:50 MET 1998
Bibliographie
- [BGH+88]
Jan BUURMAN,
Nicolas GRIMAL,
Michael HAINSWORTH,
Jochen HALLOF et
Dirk VAN DER PLAS.
« Inventaire des signes hiéroglyphiqures en vue de leur
saisie informatique » ; Mémoires de
l'Académie des Inscriptions et Belles Lettres. Institut de
France, Paris, 1988.