Les TIC et l’aménagement linguistique

Kamal Naït-Zerrad

télécharger l'article en pdf

 

 

Introduction

L’utilisation des TIC (technologies de l’information et de la communication) comme assistant du processus d’aménagement linguistique devient une nécessité pour différentes raisons :

  • l’absence ou la rareté des ressources linguistiques fiables et en particulier de dictionnaires ou lexiques
  • la lente disparition de certains parlers
  • la diffusion de propositions de normalisation linguistique faites par des institutions pour combler l’absence de norme instituée
  • la dispersion des différents acteurs intervenant sur la standardisation : chercheurs, universitaires, auteurs,  enseignants, étudiants.

On présentera ici une ébauche de programme partiel concernant l’aménagement linguistique – portant sur le lexique en général - mais qui dépasse ce cadre puisque les réalisations pourront toucher tous les publics :

  • sauvegarde de la langue ou plus précisément d’une partie de la langue,
  • collecte de l’ensemble des néologismes publiés et analyse critique (annotations, commentaires, propositions).

On évoquera également l’enseignement à distance et l’exploitation des corpus.

Il faut avoir à l’esprit que l’objectif est le partage des contenus : il est donc nécessaire d’utiliser un format de données assurant  leur exploitation par l’utilisateur quel qu’il soit (compatibilité machines et systèmes). Le programme informatique ne peut cependant être viable que si certaines conditions sont réunies, en particulier l’existence d’une norme et une police de caractères adéquate pour écrire la langue.

 

Préalables à l’informatisation de la langue

Norme(s)

Il faut avant toute chose définir une norme (ou des normes) et plus exactement – en l’absence de tout cadre officiel – des conventions d’écriture. Celles-ci doivent être (quasi)exhaustives. En effet, un mot soumis à un programme informatique doit être reconnu de manière univoque sinon l’automatisation est impossible (on peut cependant introduire des variantes quand cela est indispensable…). Il est donc nécessaire d’opter pour un alphabet et pour un système de notation se basant sur des règles d’orthographe et de grammaire. Un tel système a été proposé à l’Inalco, même s’il n’est pas encore complet : outre le fait qu’un certain nombre de problèmes restent encore en suspens, un dictionnaire orthographique, par exemple, n’a pas encore été établi à partir de ces règles.

Cette norme est indispensable pour toutes les applications faisant intervenir le traitemaent automatique de la langue.

Polices de caractères

Jusqu’à ces dernières années, pour écrire en berbère, il existait sur le marché plusieurs polices bricolées à partir de polices existantes. Bricolées, c'est-à-dire aménagées en introduisant  les caractères nécessaires pour l’écriture à base latine (č, ṣ, ṭ, ɣ, …). En fait, il s’agissait de leur substitution à des caractères inutilisés en berbère  comme (p, o, v), les caractères accentués (à, é, è, etc.) et quelques autres symboles (police ASCII à 256 caractères). Avec ces polices ad hoc, les textes ne peuvent être lisibles qu’avec la police utilisée pour écrire le texte : l’interopérabilité et la compatibilité étaient nulles entre deux polices différentes (avec des caractères spéciaux dont le code étaient différents).  L’apparition du standard Unicode a permis de résoudre le problème, puisque  à  chaque caractère correspond un code unique. Il existe maintenant plusieurs polices Unicode où tous les caractères de l’alphabet, utilisés par exemple pour écrire le kabyle, sont présents. On peut cependant ajouter que cela est valable pour le berbère en général, en tout cas pour un alphabet à base latine, étant donné que l’ensemble des caractères possibles sont inclus dans certaines polices Unicode. Cela résout du même coup le problème de la compatibilité PC –MAC : Les ordinateurs et les logiciels récents incluent Unicode et les fichiers écrits dans ce standard (traitement de texte, etc.) sont maintenant lisibles sur les deux machines sans perte… Il reste à concevoir des polices complètes avec les différents styles et graisses. Quant aux tifinagh et néo-tifinagh, 55 caractères ont été codés dans le standard Unicode et des fontes sont desormais disponibles.

Clavier

Tous ceux qui écrivent en berbère ont été confrontés à la difficulté de taper sur ordinateur les caractères propres à l’alphabet…  Il n’existe en effet à l’heure actuelle aucun clavier physique commercialisé pour écrire le berbère. Deux solutions pour faciliter l’écriture des caractères « spéciaux »1 (caractères non accessibles à partir du clavier latin (langues européennes)) ont été envisagées : - soit on crée des raccourcis en général limités aux programmes de traitement de texte, - soit on utilise des logiciels pour créer des claviers intégrés dans le système et utilisables alors avec n’importe quel logiciel. Pendant des années, la première méthode a été employée parce que simple et pour des besoins limités à l’écriture de textes, mais avec l’accroissement des besoins et leur diversification et complexité  (dessin, tableur, pages web, …), il était indispensable de passer à la deuxième solution qui s’avère plus judicieuse et plus globale. La plus simple et accessible consiste en  l’intégration d’un clavier dans le système d’exploitation (Windows ou Mac). D’autant que ce clavier ajoute simplement des fonctionnalités à un clavier existant et son utilisation est indépendante du logiciel avec lequel on travaille.  On peut donc écrire plusieurs langues ayant différents caractères spéciaux avec un même clavier pourvu que les affectations de touches correspondantes soient réalisées.

Correcteur orthographique / grammatical

La production de l’écrit est devenue depuis quelques années de plus en plus importante (roman, théâtre, cinéma…). Il faudrait donc un outil qui permette au moins de corriger les fautes de frappe et les coquilles. On peut résoudre ce problème (pour l’orthographe) de manière simple dans les logiciels de traitement de texte en créant son propre dictionnaire, mais plus le nombre d’unités augmente, moins il est fiable. Il faut donc passer par un vrai correcteur basé sur le traitement automatique de la langue.

 

Diffusion sur le Web

La situation du berbère sur le net est encore précaire. Le berbère n’étant langue officielle nulle part, il est clair qu’il n’y a pas encore d’interface pour les programmes les plus courants comme les navigateurs ou les traitements de texte, par exemple.  Pour ce qui concerne le matériel, on a déjà vu plus haut qu’il n’y avait pas encore de clavier spécifique au berbère (que ce soit à base latine ou tifinagh).  L’absence d’une interface berbère dans les grands navigateurs (IE, Firefox, Safari, etc.) est également patente, même si on voit apparaître sur certains sites libres une interface (et des contenus) en kabyle, par exemple l’encyclopédie libre Wikipedia disponible sur le web. Pour ce qui est des sites (culturel, informatif, littéraire, etc.) entièrement en berbère, ils sont encore très peu nombreux : on citera par exemple  le site kabyle www.imyura.net.

 

Enseignement à distance (e-learning)

Pour les langues à faible effectif dans le système académique européen,  -  c’est le cas  du berbère - la solution de l’apprentissage à distance semble être une piste sérieuse.

En effet, l’applicaion des nouvelles technologies à l’enseignement à distance du berbère ne dispose que d’avantages et permet de résoudre les problèmes connexes  ( ?) comme le manque de ressources.  L’enseignement à distance permet de rassembler des étudiants dispersés n’importe où  dans le monde et ainsi compenser le faible nombre d’étudiants par université. Il offre également une disponibilité plus importante. En outre, elle peut permettre de stimuler l’étude et l’enseignement du berbère en Europe, ainsi que la promotion de la recherche sur la langue et la société berbères.

L’idéal serait qu’un réseau d’universités prenne en charge cet enseignement et son organisation. Ce réseau serait constitué d’institutions européennes et africaines.

 

Diffusion de matériel pédagogique ou scientifique sur Internet

On connaît les problèmes des pays du Nord de l’Afrique en matière de ressources et de diffusion pour le berbère : manque de ressources, qui sont onéreuses quand elles existent ; diffusion faible. Je prendrai deux exemples, tous les deux dans le domaine lexicographique  mais large… : l’un, pédagogique et qui touche le grand public ; l’autre, scientifique mais qui peut également intéresser le grand public.

Le dictionnaire

Les vrais dictionnaires berbères sont encore peu nombreux et partiels. Ceux qui sont sur le marché (kabyle, Maroc central, touareg) sont bilingues (dans le sens berbère – français) mais unidirectionnels (en général, il n’existe qu’un index inverse non exemplifié et qui ne peut s’utiliser de manière autonome). Il n’y a donc pas de vrai dictionnare pouvant servir par exemple à la traduction et d’ailleurs ces dictionnaires ne sont pas à la portée de toutes les bourses.

Pour résoudre les deux problèmes, une base de données lexicale en ligne est indispensable. Un bon modèle pour cette base est le Centre National de Ressources Textuelles et Lexicales (CNRTL), même si ce sont des ressources unilingues (en français) :
« Créé en 2005 par le CNRS, le CNRTL fédère au sein d’un portail unique, un ensemble de ressources linguistiques informatisées et d’outils de traitement de la langue. Le CNRTL intègre le recensement, la documentation (métadonnées), la normalisation, l’archivage, l’enrichissement et la diffusion des ressources » (www.cnrtl.fr)

Il faut d’ailleurs relever que, dans les dictionnaires bilingues entre langues européennes, le corps de l’article d’une entrée est rédigé dans la langue source : par exemple, dans le sens français – anglais,  il est donc en français. Or, ce n’est pas le cas pour les dictionnaires berbères, tout est rédigé en français sauf bien entendu les entrées et les exemples…

Site pour vocabulaire spécialisé

Il s’agit de constituer des ressources lexicales électroniques spécialisées mises en ligne sur un site web. Ce site devrait être le fruit d’une collaboration internationale. On sait que les chercheurs berbérisants sont dispersés et que leurs moyens sont limités.

Ce site aurait plusieurs avantages :

  • Il permettrait de fédérer les travaux de chercheurs géographiquement éloignés : Les berbérisants sont en effet dispersés sur plusieurs pays en particulier dans le Nord de l’Afrique et en Europe, avec quelques-uns dans le reste du monde.
  • Il faciliterait la diffusion des connaissances : elles seraient en effet disponibles pour n’importe quel internaute. On pourrait penser à deux niveaux : l’un accessible au grand public et l’autre aux experts ou aux participants au programme.
  • Il permettrait également de faciliter le travail de comparaison en particulier pour les linguistes ;
  • Enfin, il rendrait le travail de néologie plus facile, plus fiable et plus étayé.

Conception et réalisation du site

Il faut définir les contenus et préciser le mode de fonctionnement du site. Il regroupera dans un premier temps les vocabulaires spécialisés existant dans les différentes variétés. Cela se fera sous la forme sous-sites pour chaque domaine : botanique, toponymie, techniques (construction, agriculture, tissage, …), anthropologie (rites, parenté, …), etc. Il est indispensable pour ce projet de créer un réseau de coopération : universités européennes et du Nord de l’Afrique ; spécialistes des différents domaines : linguistes, botanistes, géographes, anthropologues, etc.

Exemple :

L’organisation du sous-site « techniques » pourrait se décliner sous la forme de différentes tables ou base de données présentées ici de manière simplifiée.

Langue :

Variété / sous-variété / tribu ou groupe/ parler ou village/ localisation (administrative)

Techniques :

Habitation, Construction / Apiculture / Tissage /Appareils, Outils et machines : charrues, moulins, tours,…

Habitation, Construction :

La maison / la tente / …

La maison :

Table des éléments constituant la maison

Illustrations :

Différentes parties de la maison / coupes /…

Corpus

Parmi les sources pour la connaissance du lexique, les corpus sont très importants. Comme nous l’avons indiqué plus haut, les dictionnaires sont rares en berbère et ils sont en général limités à un parler ou quelques parlers d’une variété. Or, nous disposons d’un ensemble de textes et de manuscrits dans différents fonds dont une toute petite partie a été publiée. Il s’agira donc de les numériser et de les rendre exploitables, pas seulement d’ailleurs pour le recueil du lexique mais également pour l’étude linguistique (syntaxe, morphologie, sémantique, etc.). Le format des données devra permettre la mise à disposition sur Internet du corpus aux chercheurs. 

Analyse critique des néologismes et propositions

Ce projet consiste à collecter l’ensemble des néologismes publiés et d’en faire une analyse critique. L’analyse des néologismes permet d’illustrer tous les éléments à prendre en compte dans ce type de création : la motivation, l’adéquation, la dérivabilité, l’acceptabilité, la maniabilité, la panberbérité, etc. On peut ainsi faire une évaluation des néologismes en décelant les conflits sémantiques, les erreurs, les calques étymologiques, etc. On pourra éventuellement proposer des alternatives.

L’Amawal (Amawal (Amawal (Lexique). Tamaziɣt – tafransist (berbère – français). Tafransist – tamaziɣt (français – berbère), Imedyazen, Paris, 1980) élaboré sous la direction de M. Mammeri  reste la base sur laquelle tous les néologues ont travaillé. L’histoire des conditions de l’élaboration de ce lexique de berbère moderne a été rapportée par Ramdane Achab (La néologie lexicale berbère (1945-1995), Peeters, Paris-Louvain, 1996), auteur qui a analysé les procédés de création des néologismes proposés. C’est pourquoi on commencera par cet ouvrage.

Chaque néologisme de l’Amawal, dans l’ordre alphabétique de la publication, est présenté selon la grille suivante sur un exemple :

Notion/Concept caricature
Equivalent / néologisme AFƔUL
Source AMAWAL
Racine FƔL
Morphologie -
Type de néologisme extension de sens / néologie sémantique
Usage dans la référence -
Usage dans l’environnement -
Origine1 (parler / dialecte1) partout plus kabyle (OR, EOR)
Références Taifi / Foucauld/ Renisio / Delheure/ Kossmann/… (Maroc central, Rif, Figuig, Aurès, Ouargla, Timimoun, Ahaggar…)
Sens monstre, difforme, contrefait / idiot, fou, débile
Origine2 (parler / dialecte2) kabyle (EOC, OC)
Références Dallet
Sens grand, gros, bien bâti
Origine3 (parler / dialecte3) -
Propositions -


Commentaires :

Le vocable AFƔUL a, partout où il est attesté, les sens de « 1. monstre, difforme, contrefait ; 2. idiot, fou, débile » sauf en kabyle, en partie. Le sens 2 est secondaire, on retrouve cette relation d’équivalence difforme ~ débile dans beaucoup de langues.

En kabyle, il prend le sens de « grand, gros, bien bâti » dans beaucoup de parlers (en particulier occidentaux), alors que dans la plupart des parlers kabyles orientaux, ce sont les sens 1 et 2 qui sont attestés. On peut supposer très probablement qu’il s’agit dans le premier cas d’antiphrase, le même mot y signifiant par ailleurs « cuillère » où l’on retrouve l’idée de courbure sinon de difformité.

On peut aussi illustrer ce phénomène par le verbe à finale –t (très courant en touareg) :

  • Kabyle (parlers occidentaux) : fɣullet « être fort, bien bâti »
  • Touareg de l’Ahaggar : fəɣulət « être contrefait, difforme / être très mal façonné (pour une chose) »

Le nouveau sens « caricature » n’a vraisemblablement pas (pour les auteurs de l’Amawal) le kabyle pour origine mais bien les autres variétés avec le sens de « difforme, contrefait ». Pour le kabyle, on constate donc qu’en termes d’acceptabilité, il existe une ambiguïté interne puisqu’il y a conflit sémantique entre un terme positif (grand, fort) et un terme négatif (caricature). Ce qui n’est pas le cas pour les autres variétés où il s’agit simplement d’un nouveau sens par extension.

 

Mise en œuvre

Comme nous l’avons indiqué, ces projets ne peuvent être réalisés que dans le cadre d’une coopération internationale entre institutions et universitaires de différents pays concernés par le berbère. Une proposition détaillée, élaborée pour chacun des projets possibles ou prioritaires, doit être rédigée et présentée aux universités européennes et africaines.