22 septembre 2018

Les mots d'origine russe dans les dictionnaires français : variations, incohérences et erreurs. Le cas du Petit Robert.


L'intégration de mots d'origine étrangère provenant de langues n'utilisant pas l'alphabet latin pose des problèmes à une langue comme le français. C'est le cas du russe qui combine un alphabet différent (cyrillique), un accent tonique modifiant la prononciation de certaines voyelles dans certaines conditions et une morphosyntaxe nominale à déclinaisons. C'est pourquoi le français a choisi, à de rares exceptions près, comme barzoï, koulibiac et sterlet (dans les périodes plus anciennes), d'intégrer les mots russes sur la base de leur orthographe d'origine transcrite, selon certaines règles, en caractères latins (1). À de rares exceptions près (2), il a importé les mots dans leur forme du nominatif singulier. Cela ne va pas sans de nombreuses variations et incohérences, d'autant plus que les usages de transcription du russe au français ont changé dans le temps et que certains mots russes ont été empruntés par l'intermédiaire d'une autre langue (3). Cela se reflète dans les dictionnaires contemporains comme le montre l'exemple que je vais analyser, celui du Petit Robert (4), avec des références au Petit Larousse illustré (5). 
1. Nomenclature 
Lorsqu'on interroge la version numérique du PR sur les termes (mots et acceptions) d'origine russe qu'il contient, on obtient une liste de 100 mots (6). Ce qui est peu. En fait, dans ce dictionnaire, il y en a plus. Certains mots échappent à cette recherche, n'étant pas désignés explicitement dans le champ « Étymologie » comme provenant du russe. C'est le cas de bérézina (du nom d'une défaite napoléonienne), kalachnikov (du nom d'un ingénieur), léniniste, léninisme, liquidateur (d'un accident nucléaire), stakhanoviste (du nom d'un mineur de fond), stakhanovisme, stalinien, stalinisme, déstalinisation, trotskiste, trotskisme (7). Personnellement, j'ai recensé jusqu'à 235 termes d'origine russe dans la presse française (8) avec des fréquences très variées allant d'une seule occurrence (grand-russien) (9) à 1 995 559 (russe). 
La présence de certains termes dans la nomenclature du PR est critiquable. Ce sont, par exemple, des mots dérivés d'ethnonymes vieillis comme tatar (forme ancienne de tartare) ou tchérémisse (10). Pourquoi ces choix alors qu'il y en aurait bien d'autres désignant des peuples de la Fédération de Russie, comme tchétchène (чечен(ец), чеченский) (11), qui auraient au moins autant mérité de figurer dans le dictionnaire ? Tsigane est présenté comme provenant de l'allemand Zigeuner (c'est phonétiquement peu crédible) ou du hongrois czigany (en fait cigány [ʦi.ɡaːɲ], qui aurait plutôt donné tsigagne), mais les premières attestations en français indiquent que le mot provient plutôt du russe tsygan (цыган) (12).
On peut aussi s'interroger sur la présence de termes désignant des réalités archaïques comme tchervonets (ancienne unité de monnaie), télègue (chariot) ou touloupe (sorte de manteau en peau retournée). Si l'on s'en tient aux seuls moyens de transport anciens, on aurait pu aussi bien retenir briska, kibitka ou tarantass… Сertes, ces termes se trouvent dans la littérature russe (assez mal traduite) du XIXe siècle et ont participé à la création d'une Russie exotique, mais est-ce une raison suffisante pour les conserver de nos jours ?
On peut en revanche regretter l'absence de termes importants comme vieux-croyant (calque de старовер(ец)) (13), occidentaliste (14) et occidentalisme (calques de западник et de западничество) - alors que slavophile (славянофил) est présent - ou de mots plus récents comme pavlovien (15) ou contemporains comme kompromat (« matériel, document compromettant »).
N'ont pas non plus droit de cité des syntagmes figés entrés dans la langue comme maladie infantile du (communisme, etc.), d'après le livre de Lénine Детская болезнь « левизны », idiot utile (полезный идиот, expression attribuée à Lénine, mais non documentée), compagnon de route (спутник), notre maison commune (наш общий дом, expression popularisée par Mikhaïl Gorbatchev), monde russe (русский мир, concept ancien repris ces dernières années par Vladimir Poutine et le patriarche Cyrille).
2. Domaines couverts par les emprunts russes 
Les emprunts russes sont le reflet de certaines spécificités de la Russie dans des domaines variés (16).
- Géographie : cosmos (russisme sémantique, dans le sens d'« espace extra-terrestre »), liman, merzlota, perspective (russisme sémantique, dans le sens de « grande avenue rectiligne »), podzol, raspoutitsa, steppe, taïga, tchernoziom, toundra.
- Zoologie : barzoï, bélouga, kolinski, mammouth, ociètre, pоlatouche (17), saïga, sévruga, sterlet.
- Ethnonymes : biélorusse, Popov, russe, samoyède, tatar, tchérémisse, ukrainien.
- Habitation : datcha, isba, yourte.
- Habillement : chapka, touloupe.
- Objets divers : balalaïka, knout, matriochka, samovar, télègue, troïka.
- Gastronomie : blinis, bortch, kacha, koulibiac, kvas, malossol, pirojki, vodka.
- Unité de mesure : verste.
- Unités monétaires : kopeck, rouble, tchervonets.
- Religion : icône, iconostase, pope, starets, uniate.
- Régime politique, organisation sociale et idéologies de l'époque tsariste : artel, boyard, cosaque, défaitisme (18), douma, intelligentsia, mir, moujik, nihilisme, nihiliste, oukase, pogrom, slavophile, tsarévitch.
- Régime politique, organisation sociale et idéologie de l'époque soviétique : agit-prop, apparatchik, bolchevik, bolcheviste, bolchevisme, combinat, glasnost, Gosplan, goulag, hooligan, kolkhoze, komsomol, koulak, marxologue, menchevik, nomenklatura, nomenklaturiste, perestroïka, personnalité (russisme sémantique, dans l'expression « culte de la personnalité »), plénum, præsidium, refuznik, révisionnisme, révisionniste, samizdat, soviet, soviétique, sovkhoze.
- Syntagmes figés liés à la période soviétique : compagnon de route; culte de la personnalité; réalisme socialiste
- Mots dérivés de noms de personnes (politique) (19), brejnévien; eltsinien; gorbatchévien;  khrouchtchévien; léninisme; léniniste; marxologue; poutinien; stakhanovisme; stakhanoviste; stal; stalinien; stalinisme; trotskisme; trotskiste.
- Mots dérivés de noms de personnes (littérature) : dostoïevskien; gogolien ; pouchkinien; soljénitsynien;  tchékhovien; tolstoïen;  tourguenévien. 
- Sciences et techniques : cosmodrome; cosmonaute (20),  jarovisation; kalachnikov; liquidateur; mazout; pavlovien; printanisation; réflexe (conditionné/conditionnel) (21); spoutnik; tokamak; vernalisation (calque du russe).
La part du lion revient aux termes des domaines sociaux, idéologiques et politiques des deux périodes antagonistes de l'histoire de la Russie, le régime tsariste et le régime soviétique. La part des termes négatifs est importante : knout, oukase, pogrom pour le régime tsariste, apparatchik, goulag, nomenklatura, kompromat pour le régime communiste. On remarque aussi le faible poids des emprunts scientifiques et techniques. 
3. Types de russismes 
Les russismes relèvent de plusieurs catégories : emprunts de mots, emprunts de sens, calques, emprunts d'image, à quoi il faut ajouter tous les mots composés ou dérivés à partir de mots russes.
3.1 Emprunts de mots :
- Emprunts de noms communs comme babouchka; blini; bolchevik; chapka; datcha; glasnost; goulag; isba; matriochka; moujik; niet; pérestroïka; pogrom; samovar; soviet; spoutnik; vodka; etc.
- Emprunts de noms propres comme bérézina; kalachnikov.
- Emprunts d'ethnonymes comme ingouche; kalmouk; mordve; ossète; tchétchène; tchouvache.
3.2 Emprunts de sens comme dans compagnon de route (calque de спутник, en politique); cosmos (космос, dans le sens d'« espace extra-terrestre »); liquidateur (ликвидатор, d'un accident nucléaire).
3.3 Calques  de forme comme décembriste (d'après декабрист); occidentaliste (d'après западник); slavophile (славянофил); cosmodrome (космодром); printanisation (яровизация); vernalisation (яровизация); grand-russien (великоруссы, великороссы); petit-russien (малороссы); biélorussien (белорусы);  vieux-croyant (старовер(ец)).
3.4 Mots composés ou dérivés à partir de mots russes : mazout (mazouter, mazoutage, démazouter, démazoutage); podzol (podzolique, podzolisation, podzoliser); russe (russification, russifier, russiser, russophile, russophobe, russophobie, russophone); steppe (steppique).
- en particulier mots dérivés à partir de noms de personnes dans les domaines littéraire : Dostoïevski (dostoïevskien); Tolstoï (tolstoïen); politique : Lénine (léninisme, léniniste); Staline (stalinien, stalinisme, déstaliniser, déstalinisation) et, plus rarement, scientifique Pavlov (pavlovien).
3.5 Emprunts d'expressions imagées : communisme de guerre (военный коммунизм); idiot utile (полезный идиот, attribué à Lénine, mais non documenté); maison commune (общий дом, expression de Mikhaïl Gorbatchev); monde russe (русский мир, expression ancienne reprise par Vladimir Poutine); nouveau russe (новый русский, jeu de mot possible à partir de l'assonance en français nouveau riche / nouveau Russe); réflexe pavlovien (au sens figuré); village Potemkine (Потёмкинские деревни). 
4. Mots russes et mots migrateurs
Les mots empruntés par le français au russe ne sont pas tous venus en droite ligne de cette langue. Les mots voyagent. Le russe a été souvent l'intermédiaire entre le français et, en particulier, mais pas seulement, une autre langue parlée sur le territoire de l'ancien Empire russe ou de l'Union soviétique. L'origine des russismes se répartit de la manière suivante :
4.1 Mots d'origine slave :
- Doublets d'origine vieux-slave comme glasnost (de glasny - doublet vieux-slave glas / russe golos).
- Mots d'origine russe (avec ascendance vieux-slave) comme bolchevik (de больше = plus; les majoritaires, les majos (au 2e congrès du Parti social-démocrate de Russie); menchevik (de меньше = moins; les minoritaires, les minos); borchtch; datcha (du verbe dat' = donner); kacha; kremlin (kreml', кремль; au moyen-âge, partie fortifiée d'une villе; le kremlin d'Astrakhan, de Moscou, de Pskov, etc.); kvas; matriochka; merzlota (de miorznout' = geler); mir; moujik (radical mouj + suffixe diminutif –ik; littéralement « petit homme »); oukase; perestroïka (littéralement « reconstruction »); pirojki; podzol (littéralement « qui ressemble à de la cendre »); pogrom; raskol (scission, schisme); raspoutitsa; rouble; samovar (littéralement « auto-bouilloire »); soviet (conseil); spoutnik (compagnon de route); starets; steppe; staroste (староста); tchernoziom (littéralement « terre noire »); troïka (le chiffre 3, un groupe de 3); ukrainien (vieux-russe оукраина, lisière, limite, frontière); verste; vodka; zakouski.
- dont des abréviations comme zek de з/к, abréviation de заключённый каналоармеец.
- dont des mots-valises comme kolkhoze (кол(лективное) хоз(яйство)); sovkhoze (сов(етское) хоз(яйство)); samizdat (littéralement « édition par soi-même », « autoédition », sur le modèle de gosizdat (гос(ударственное) издат(ельство)), « édition d'État »).
- dont des acronymes comme komsomol (ком(мунистический) со(юз) мол(одёжи)); tokamak (то(роидальная) ка(мера с) ма(гнитными) к(атушками)).
4.2 Mots issus du grec ancien ou formés sur la base de cette langue comme сosmodrome; cosmonaute (grec + latin); dekabriste (de декабрь - dekabr' – décembre -, du grec ancien par le vieux-slave avec dénasalisation); icône; iconostase; tsigane (grec ancien τσίγγανος).
4.3 Mots d'origine latine comme apparatchik (par l'allemand apparat - latin apparatus - + suffixe russe tchik); intelligentsia (latin intelligentia); nomenklatura; plénum; présidium; uniate (latin ecclésiastique unio).
4.4 Langues caucasiennes comme ingouche (ингуш, peut-être du village caucasien d'Angoucht); ossète (осетин, du géorgien); tchétchène (чечен, peut-être du village caucasien de Tchétchène-aoul).
4.5 Langues finno-ougriennes comme oudmourte (удмурт, ancien nom Votiak); toundra.
4.6 Langues mongoles : bouriate (бурят).
4.7 Langues paléosibériennes : tchouktche (чукча).
4.8 Langues sames comme nenets (ненец), samoyède (ancien nom des Nenets; une étymologie populaire prétend que le mot vient du russe samo – soi-même - + ed – manger, autrement dit cannibale… en réalité le mot russe самоед vient de la langue same samè-ednè (самэ-еднэ), qui signifie « terre des Sames »).
4.9 Langues turques comme kalmouk (калмык), liman (du turc, qui l'a emprunté au grec); mazout (du turc, qui l'a emprunté à l'arabe); sévruga; taïga; tatar (татар), tchérémisse (черемиc, ancien nom des Maris), tchouvache (чуваш), toungouse (тунгус, ancien nom des Evenks), yakoute (якут), yourte. 
5. Transcription des mots russes 
Dans un ouvrage destiné à tous les publics, il n'est pas question d'utiliser la translittération scientifique. Il faut seulement fournir au lecteur la possibilité d'avoir une idée de la forme russe d'origine dans un système phonético-orthographique qui lui soit familier et compréhensible. C'est pourquoi les dictionnaires usuels utilisent une transcription (22). Malheureusement les transcriptions du PR (23) ne sont pas toujours rigoureuses ni uniformes comme le montre le relevé qui suit :
- Consonne mouillée (palatalisée). En translittération scientifique, la mouillure (palatalisation) est marquée par le signe ' (ь en russe). En transcription, il est possible de ne pas la marquer. Dans le PR, on relève des cas où elle est notée comme dans gromit' (громить, article pogrom) et d'autres où elle ne l'est pas, comme dans oukazat (указать, article oukase), varit (варить, article samovar), malossolnyi (малосольный, article malossol). Il conviendrait d'uniformiser en l'indiquant dans tous les cas.
- Finale des adjectifs. La finale des adjectifs masculins durs au nominatif singulier (-ый en russe) est notée tantôt –yï, tantôt –yi ou encore –y. Exemples : gossoudarstvienn (государственный, article goulag), malossolnyi (малосольный, article malossol), biely (белый, article biélorusse), glasny (гласный, article glasnost).  Là aussi il conviendrait d'uniformiser.
- Rouble. Le mot est transcrit bizarrement ruble, alors qu'on attend roubl ou, de préférence, roubl' (рубль, rubl' en translittération scientifique).
- Yourte. Sous yourte, on lit « du russe jorta ». Selon le même système de transcription, il faudrait lire « iourta » (юрта en russe, jurta en translittération scientifique). 
6. Usage et Orthographe 
On ne sait pas sur quelle(s) base(s) le PR, qui se veut un dictionnaire descriptif (même si, parfois, il se permet des commentaires prescriptifs), s'appuie pour choisir les formes qu'il retient. De nos jours, il est indispensable que tout dictionnaire se fonde sur l'analyse d'un corpus réunissant des centaines de milliers de textes et des dizaines de millions de mots (24). C'est ce que font depuis longtemps les dictionnaires anglo-saxons (25). À défaut de cela, des sondages dans l'internet donnent quelques indications. C'est pourquoi j'ai sondé la fréquence de certaines formes à l'aide de Google Recherche avancée, en précisant : Langue : français, Pays : France, Date : 25 avril 2018. Les tableaux qui suivent présentent les résultats en pourcentages d'occurrences sur la Toile.

Tableau no 1 : Transcriptions courantes du russe у (u) et ю (j+u)
orthographe
russe
orthographe(s)
française(s)
% d'occurrences
dans la presse
française
белуга
bélouga
24,5

béluga
75,5
номенклатура
nomenklatoura
0,1

nomenklatura
99,9
указ
oukase
51,7

ukase
48,3
севрюга
sévriouga
0,8

sévrouga
1,2

sévruga
97,8

On observe des variations orthographiques entre u (béluga) et ou (bélouga) et des variations dans les variations : la graphie u domine presque sans partage avec nomenklatura et sévruga, largement avec béluga, mais est légèrement dominée avec ukase. La graphie ou, qui correspond pourtant à la prononciation et à l'orthographe françaises, est quasiment inexistante avec nomenklatura et sévruga, plus importante avec bélouga et légèrement dominante avec oukase.

Tableau no 2 : Transcriptions de certaines consonnes russes.
consonne russe et
équivalent français attendu
orthographe
russe
orthographe(s)
française(s)
% d'occurrences
dans la presse
française
щ = chtch
борщ
bortch
10,2


borstch
67,6


borchtch
21,5
ц = ts
интеллигенция
intelligentsia
95,6


intelligentzia
4,4
з = z
изба
isba
70,5


izba
29,5

колхоз
kolkhoz
41,0


kolkhoze
59,0

совхоз
sovkhoz
51,4


sovkhoze
48,5
в = v
квас
kvas
54,8


kwas
45,2

копеек
kopeck
44,5


kopek
55,5
к = k
кулибяк
koulibiac
42,00


koulibiak
57,00


koulebiak
0,4


koulebiaka
0,3
м = m
погром
pogrom
83,00


pogrome
17,00


La transcription attendue domine d'une manière écrasante avec intelligentsia, plus modestement avec kopek (à cause du c adventice souvent rencontré en français comme en anglais), koulibiak (pour le k final) et kvas. En revanche les formes attendues borchtch et izba sont minoritaires. Le cas de kolkhoze et de sovkhoze s'explique par la volonté de bien marquer que la consonne finale se prononce. Ce choix est moins justifié dans le cas de pogrome.

Tableau no 3 : Nombre de certains mots russes empruntés au pluriel.

% d'occurrence
dans la presse
française
un blini
51,8
un blinis
48,1
des/les blini
5,2
des/les blinis
94,8
des/les pirojki
35,4
des/les pirojkis
64,6
des/les zakouski
24,7
des/les zakouskis
75,2

Dans cette série, on observe une variation dans le traitement de la marque du nombre pour des mots pourtant identiques du point de morphologique. En russe, ce sont tous des mots au nominatif-accusatif pluriel désignant des éléments nombrables. En français, le mot blini prend presque toujours un s au pluriel (c'est ce qu'on attend), mais ce n'est pas le cas de zakouski, encore moins celui de pirojki, souvent employés sans s. Le comble de l'absurdité se manifeste au singulier lorsqu'on relève la forme un blinis, qui cumule deux marques de pluriel, une première russe (i ou mieux y), une seconde française (s) ! La cause en est peut-être à rechercher dans le PR, qui ne donne que la forme blinis n. m. (26) et même - c'est un comble - la prononciation [blinis] ! 
Si l'on veut rester au plus près de la transcription du russe, les mots de la liste (27) qui suit devraient s'écrire de la manière suivante :
Boyard (transcription du russe : [bojar], forme ancienne de [bojarin]) : boyar. Le d final est superflu. D'ailleurs la femme du boyar est la boyarine [en russe bojarinja].
Béluga (russe [beluga]) :  bélouga.
Bortch (russe [boršč]) : borchtch (28).
Intelligentzia (russe [intelligencija]) : intelligentsia.
Isba (russe [izba]) : izba.
Koulibiac (russe [kulebjaka]) : koulibiak. La forme la plus exacte serait koulebiaka (n. fém.). Voir ci-dessous.
Kwas (russe [kvas]) : kvas.
Kopeck (russe [kopejek]) : kopek.
Liman (russe [liman]) : limane.
Nomenklatura (russe [nomenklatura]) : nomenklatoura.
Ociètre (russe [osëtr]) : ossiotre.
Sévruga (russe [sevrjuga]) : sévriouga.
Remarques sur trois emprunts anciens.
Barzoï (russe борзой [borzoj]) (29) : Cet emprunt respecte la prononciation russe du /o/ dans cette position en dehors de l'accent (/o/ ≈ /a/).
Koulibiac (russe кулебяка [kulebjaka]) : Cet emprunt respecte la prononciation du /e/ avant l'accent tonique (/e/ ≈ /i/ dans cette position) et la quasi-chute du /a/ final après l'accent (/a/ ≈ /ə/).
Sterlet (russe стерлядь [sterljad']) : Cet emprunt reproduit approximativement la prononciation russe du /a/ dans cette position en dehors de l'accent (/a/ ≈ /ə/). 
7. Étymologie 
Dans le PR, le champ "Étymologie" se caractérise par un manque de systématicité et d'uniformité dans le traitement de l'origine russe des mots. Ce manque d'uniformité se remarque dans des mots de formations parallèles.
- Sous bolchevik, on donne simplement comme explication « partisan de la majorité », alors que sous menchevik, on lit « de menchistvo (30) », minorité ». Il aurait été souhaitable d'uniformiser la présentation des renseignements et donc de dire sous bolchevik « de bol'chinstvo, majorité ».
- Sous sovkhoze, on apprend que le mot vient de « sov(ietskoïé) khoz(iaïstvo), économie soviétique ». Sous kolkhoze, on ne donne pas la forme russe d'origine, pourtant parallèle, à savoir « kol(letktivnoïé) khoz(iaïstvo), entreprise collective, coopérative ». Il faudrait l'ajouter.
Certaines étymologies sont  insuffisantes, se limitant à mentionner « mot russe », alors qu'une explication serait utile.
- Sous komsomol, on ne dit pas qu'il s'agit d'un acronyme formé sur kommounistitcheski soïouz molodioji (Коммунистический союз молодёжи, Union de la jeunesse communiste).
- Sous merzlota, on devrait préciser « du russe miorznout' (мёрзнуть) "geler" ».
- Sous raspoutitsa, on devrait ajouter « du russe ras- (рас-) "idée de défaire, détruire" et pout' (путь) "chemin" », période pendant laquelle les chemins sont détrempés, défoncés ».
- Sous tokamak, on devrait dire qu'il s'agit d'un acronyme formé sur toroidal'naïa kamera s magnitnymi katouchkami (тороидальная камера с магнитными катушками, chambre torique de confinement magnétique).
- Sous vernalisation, calque de iarovizatsia (яровизация), on devrait dire que iarovoï (яровой) signifie « produit au/par le printemps ».
Certaines étymologies sont carrément fantaisistes, voire légèrement comiques.
- Sous matriochka, on nous apprend que cela voudrait dire « petite mère, nom donné aux robustes paysannes » [sic] ! En fait le mot vient de Matriona (Матрёна), qui est un prénom féminin russe…
Certaines étymologies sont approximatives, inexactes, voire erronées.
- Sous barzoï, on lit « mot russe "lévrier" ». Ce n'est pas tout à fait exact. L'adjectif borzoï (борзой) signifie « rapide, vif », d'où le nom de borzaïa sobaka (борзая собака) pour désigner des chiens de chasse particulièrement vifs.
- Sous intelligentsia, on lit « mot russe "intelligence" ». C'est inexact. En russe, le mot intelligence se dit oum (ум); intelligent, oumny (умный). Ce sont les mots latins intelligens et intelligentia qui ont donné le russe intelligent (un intellectuel) et intelligentsia (les intellectuels, la classe intellectuelle).
- Sous liman, on dit « mot russe "estuaire" ». En fait le terme russe pour estuaire (эстуарий) est l'hyperonyme de liman. En russe, liman désigne un estuaire particulier (avec une lagune) comme en français, qui lui a emprunté ce mot.
- Sous podzol, on dit que le mot russe signifie « sol sablonneux, stérile ». Ce n'est pas exact. Dans podzol, il y a zola (зола), la cendre. Il aurait fallu dire « sol ayant l'apparence de la cendre (31) ».
- Sous starets, on lit « mot russe "vieillard" ». Сe n'est pas tout à fait exact. Le mot vieillard se dit couramment en russe starik (старик). Le point commun entre les deux est la racine star, qui veut dire effectivement « vieux, âgé ».  Starets est d'un autre niveau de langue. Il désigne un moine, un ancien et, à ce titre, directeur de conscience d'autres moines.
L'origine russe de certains termes est incertaine, douteuse, voire inexacte.
- Hooligan. Si le mot hooligan avait été emprunté directement au russe, on aurait la forme khouligane. Même si le mot a été popularisé en français en référence aux hooligans soviétiques, il était employé en anglais en Angleterre dès la fin du XIXe siècle (attesté en 1898) et un peu de recherche montrerait certainement qu'il l'a été en France avant l'apparition de l'acception russe.
- Kolinski. Pour désigner la fourrure du vison de Sibérie (Mustela sibirica), on ne trouve pas de trace de ce mot en russe. S'il s'agit d'un nom de famille, on le relève aussi bien en Pologne (Koliński) qu'en Russie (Колинский). Quant à l'adjectif relatif de kolonok (колонок, vison de Sibérie), c'est kolonkovy (колонковый : колонковые кисти : pinceaux Kolinsky (32). Il est peu probable que kolonkovy ait donné kolinski.
- Liquidateur. Il faudrait indiquer qu'il s'agit d'un russisme, d'un emprunt sémantique du russe likvidator (ликвидатор).
- Mammouth. Le mot provient d'une forme ancienne du russe (mamut, de nos jours mamont) par l'intermédiaire de l'anglais mammoth comme le suggère l'orthographe en français.
- Polatouche. Sous ce mot, on mentionne « du russe ». C'est peu probable. En russe, cet animal est désigné sous le nom de biélka-letiaga (белка-летяга, écureuil volant) ou simplement letiaga (летяга). Ce mot est plus certainement d'origine polonaise (dans cette langue, on dit polatucha) (33).
- Refuznik. C'est un faux russisme, en réalité un russo-américanisme forgé sur l'anglais to refuse + suffixe russe –nik. En russe, on dit otkaznik (отказник).
- Uniate. Le mot vient du latin ecclésiastique unio. Il est probable que ce soit un emprunt au polonais plutôt qu'au russe. 
8. Genre 
Dans l'importation de mots russes en français se posent des problèmes de genre.
En russe, les noms terminés par un -a sont, à quelques exceptions près, féminins. C'est pourquoi on dit une datcha, de la kacha, la pérestroïka, etc. Or, curieusement, sévruga (севрюга) est devenu masculin. En toute logique, on devrait dire une sévruga (ou mieux une sévriouga)… De même kopeck, qui vient de kopejek (копеек), forme du génitif pluriel de kopejka (копейка), devrait être féminin…
Les mots terminés par une consonne mouillée sont soit masculins, soit féminins. En russe artel (артель) est féminin. On devrait dire une artel (34)...
Les mots terminés par une consonne dure sont masculins. C'est pourquoi le mot touloupe (тулуп) devrait être masculin. On devrait dire un touloupe (35)...
Ne parlons pas de koulibiac (кулебяка, n. fém.) et de sterlet (стерлядь, n. fém.). J'en ai parlé plus haut.
Il serait difficile de revenir sur des usages fautifs, mais bien implantés. 
9. Nombre 
On constate dans le PR un manque d'uniformité dans le traitement du nombre et de sa marque. C'est le cas de la série blinis, pirojki, zakouski. Blinis n'est donné que sous la forme du pluriel, avec un s (mais la définition indique qu'il s'agit « d'une petite crêpe », soit un singulier), alors que pirojki et zakouski sont donnés aux deux formes, singulier et pluriel (pirojki et pirojkis, zakouski et zakouskis). On ne pourrait donc manger que des blinis, mais déguster un ou des zakouski(s), un ou des pirojki(s). La difficulté vient du fait que ces trois mots sont au pluriel en russe. On a ici un bel exemple de démotivation du signe linguistique. En toute rigueur, on devrait dire un bline, des blines (singulier блин, pluriel блины), un pirojok, des pirojoks (singulier пирожок, pluriel пирожки). Là encore, il n'est pas question de revenir sur l'usage, même s'il est critiquable, sinon absurde. Mais il faudrait uniformiser blini(s), pirojki(s), zakouski(s). 
10. Définition 
Sous bélouga, le PR donne deux acceptions. La première : « Mammifère cétacé apparenté au narval, aussi appelé baleine blanche, dauphin blanc, qui vit dans les eaux arctiques ». La seconde : « Poisson des mers Noire et Caspienne, espèce d'esturgeon ». Il serait bon de préciser que le sens 1 est fondé sur une confusion. Il correspond non pas au russe beluga ( белуга), mais beluxa (белуха). Beluga désigne l'esturgeon (Huso huso); beluxa, le cétacé (Delphinapterus leucas). La confusion existe aussi en russe.
Sous mir, on trouve une formulation un peu laborieuse : « Organisme de propriété collective rurale, avant la révolution russe de 1917. » Il y aurait lieu de l'améliorer. 
Sous tchérémisse, on apprend que le mot désigne une langue, mais il désigne aussi un peuple (36).
Sous télègue, on apprend qu'il s'agit d'une « charrette à quatre roues, utilisée en Russie. » Si l'on consulte, dans ce même dictionnaire, les mots charrette et chariot, on apprend qu'une charrette est « une voiture à deux roues » et un chariot « une voiture à quatre roues »… On ne peut qu'en déduire qu'une télègue est un chariot et non pas « une charrette à quatre roues »… 
11. Conclusion 
Le Petit Robert est certainement un bon dictionnaire. Cela ne signifie pas qu'il n'ait pas besoin d'être amélioré. En particulier, il serait temps qu'il s'appuie sur un vaste corpus de textes afin de mieux traiter les variations de formes et autres et les fréquences de chacune.
Pour ce qui concerne les emprunts au russe, au chapitre de la nomenclature, il conviendrait de supprimer certains mots obsolètes (comme tchérémisse, télègue) pour en ajouter d'autres plus importants (comme occidentaliste, pavlovien, tchétchène, vieux-croyant). La transcription devrait être améliorée en appliquant un système unique (pour la mouillure de la consonne, la transcription de la terminaison -ый, etc.) et en corrigeant certaines erreurs (ruble, jorta). Dans le champ étymologie, on devrait indiquer explicitement l'origine russe de tous les mots ou acceptions de la nomenclature provenant de cette langue (par exemple sous liquidateur); vérifier l'origine exacte de mots comme kolinski, polatouche; donner systématiquement le mot ou l'expression russe à l'origine de l'emprunt (comme pour merzlota, raspoutitsa); l'origine des acronymes (comme pour komsomol, tokamak); le même genre de renseignements pour les mots ayant le même mode de formation (comme pour bolchevik et menchevik, kolkhoze et sovkhoze); améliorer la traduction littérale des mots d'origine russe (matriochka); revoir certaines explications étymologiques (intelligentsia, matriochka, starets). Dans le choix de l'orthographe, on devrait privilégier les formes correspondant aux règles de transcription du russe en français, quand elles ont une fréquence suffisante, et marquer les autres formes comme variantes (déconseillées). Par exemple : bélouga var. béluga; borchtch var. bortch, borstch; intelligentsia var. intelligentzia; izba var. isba; kopek var. kopeck; koulibiak var. koulibiac; kvas var. kwas; oukase var. ukase. Dans le champ nombre, on devrait uniformiser la forme du nombre dans la série un blini/des blinis; un pirojki/des pirojkis; un zakouski/des zakouskis (37). Enfin, il faudrait améliorer la formulation de certaines définitions (mir) et indiquer la source de confusion (bélouga). Bref une révision est nécessaire. 
L'intégration en français de mots provenant de langue n'utilisant pas l'alphabet latin présente bien des difficultés. Si l'on veut améliorer nos dictionnaires, réduire autant que possible les incohérences et les erreurs qu'ils véhiculent, il est important que les lexicographes étudient attentivement la question en s'appuyant sur les conseils des spécialistes de ces langues.

Voir aussi dans ce blog, « Les mots d'origine russe en français. Liste alphabétique » et « Les mots d'origine russe en français. Liste du nombre d'occurrences » (dans la presse française).

Lionel Meney
Paris-Québec, 2018.

Notes
(1) Si le français s'était appuyé sur la prononciation (comme le fait le russe pour ses emprunts à l'anglais, par exemple l'anglais site donne сайт [saït] en russe), un mot comme malossol (cornichon à la russe, малосол), avec accent final (marqué ici par le caractère gras), aurait donné melassol; Popov (Попов), Papov; tchernoziom (чернозём), tchirnaziom
(2) Ont été importés au nominatif-accusatif pluriel des mots comme blini (блины), pirojki (пирожки) et zakouski (закуски); au génitif pluriel, kopeck (kopeïek, копеек); à l'accusatif singulier Moscou (à partir du syntagme в Москву = à Moscou), mais la rivière de Moscou, la Moskova (Москва-река), l'a été au nominatif avec ajout d'un o épenthétique…
(3) Ainsi la graphie kwas au lieu de kvas peut s'expliquer par l'allemand ou le polonais.
(4) Le Petit Robert (PR), Nouvelle édition millésime 2018, Dictionnaires Le Robert, Paris, 2017. (5) Le Petit Larousse illustré (PLI), édition bicentenaire, Larousse, Paris, 2017.
(6) À quelques exceptions près, ces mots se trouvent aussi dans la nomenclature du PLI. Ce dictionnaire n'a pas retenu Gosplan, spoutnik (mais le mot figure dans la partie encyclopédique), tchervonets. En revanche, certains termes comme babouchka, raskol, staroste (au sens russe, le PR donne le sens polonais) ou zemstvo, présents dans le PLI, sont absents du PR.
(7) Tsar (vieux-russe цьсарь) est marqué « mot slave ». Tsarine (russe царица) est une forme germano-slave (Zarin).
(8) En interrogeant la base de textes  Eureka.cc pour l'ensemble des articles répertoriés (115 001 964) le 8 mai 2018. Les variantes orthographiques et les formes du singulier et du pluriel ont été prises en compte. Pour les formes polysémiques, marquées d'un astérisque, le décompte est plus approximatif.
(9) Dans des publications spécialisées, ce terme serait plus fréquent.
(10) Les Tchérémisses, au nombre de 557 000, sont appelés de nos jours Maris.
(11) Les Tchétchènes sont au nombre de 1 500 000 environ. Le mot est présent dans le PLI.
(12) Voir la fiche tsigane du Centre national de ressources textuelles et lexicales avec plusieurs exemples en contexte russe.
(13) Présent dans le PLI.
(14) Présent dans le PLI.
(15) Présent dans le PLI.
(16) Dans cette partie, je reprends l'orthographe du PR.
(17) Nous verrons plus bas que l'origine russe de certains termes de cette liste est douteuse.
(18) Le PR précise : « mot forgé en français et en russe par un écrivain russe » (en 1915). L'équivalent russe est porajentchestvo (пораженчество), formé sur porajenie (défaite). L'écrivain russe en question est le révolutionnaire G. A. Aleksinski (Григорий Алексеевич Алексинский). Voir Catherine Slater, « Note critique sur l'origine de "défaitisme" et "défaitiste" », Mots. Les langages du politique, 1980, p. 213-217.
(19) Le PR donne peu d'adjectifs dérivés de noms de personnes à l'exception de quelques politiques.
(20) On distingue un astronaute américain, un cosmonaute russe, un spationaute français ou européen, un taïkonaute chinois…
(21) Calque du russe ouslovny refleks (условный рефлекс); création d'Ivan Pétrovitch Pavlov (1849-1936).
(22) Voir dans Wikipédia, « Transcription et translittération ». La translittération établit une correspondance lettre par lettre entre les deux langues. Sauf pour х, щ, ю et я, à une lettre russe correspond une seule lettre latine. Pour cela, elle a recours à des signes diacritiques (voir dans Wikipédia, « Translittération des caractères cyrilliques russes »). La transcription établit une correspondance son par son. Un son peut être représenté par deux lettres (voir dans Wikipédia, « Transcription du russe en français »). Ainsi le mot малосол sera translittéré malosol (= même nombre de caractères) et transcrit malossol (pour répondre à la prononciation française); le mot мужик sera translittéré mužik et transcrit moujik.
(23) Les transcriptions du PR et du PLI se ressemblent, ce qui donne à penser qu'elles ont été puisées à la même source.
(24) Le PR revendique seulement « un corpus vaste et varié de citations mises en mémoire » (Préface, p. VII). C'est loin, très loin d'être satisfaisant.
(25) Le corpus Bank of English, qui a servi à la rédaction du Collins Cobuild English Dictionary, compte 4,5 milliards de mots. Le Corpus of Contemporary American English (COCA) compte 450 millions de mots.
(26) Le PLI donne correctement blini n. m.
(27) J'utilise ici la translittération scientifique.
(28) Cf. la transcription de Khrouchtchev (Хрущёв).
(29) Le caractère gras indique la place de l'accent tonique.
(30) Sic. Il faudrait lire men'chinstvo.
(31) Le Petit Larousse dit plus justement « cendreux ».
(32) On trouve les deux orthographes Kolinski et Kolinsky.
(33) C'est d'ailleurs l'étymologie que retient le PLI.
(34) On relève sur la Toile des cas d'emploi d'artel au féminin.
(35) À la fiche touloupe, le Centre national de ressources textuelles et lexicales, donne ce mot au masculin et en fournit plusieurs exemples.
(36) Dans sa partie encyclopédique, le PLI donne systématiquement le nom du peuple et de sa langue, par exemple : « Bachkirs […]. Ils parlent bachkir ».
(37) Les formes « correctes » un pirojok et une zakouska se rencontrent parfois, mais ce sont surtout les connaisseurs du russe qui les emploient.

Mots-clés : Langue française; langue russe; emprunts de mots russes; dictionnaires; Petit Robert; Petit Larousse illustré. 


Aucun commentaire:

Enregistrer un commentaire