39 bits par seconde. C'est le débit d'information d'une langue, et même celui de toutes les langues. | cross pond high tech | Scoop.it

Nous connaissons tous, dans notre entourage, des gens qui parlent comme de véritables « mitraillettes » et d'autres dont l'élocution est au contraire plutôt traînante. Si nous sommes un minimum polyglottes, nous aurons également remarqué que ces différences dans le débit de paroles ne se rencontrent pas que d'un locuteur à l'autre, mais aussi d'une langue à l'autre : pas besoin de lire Murakami ou Cervantès dans le texte pour savoir que ces deux langues, le japonais et l'espagnol, se parlent plutôt vite…

Une équipe de linguistes du laboratoire Dynamique du langage (université Lumière Lyon II) s'est posé une intéressante question. Elle s'est demandé si le fait que certaines langues se parlaient avec un débit plus rapide que d'autres les rendaient plus efficaces pour transmettre de l'information. Et leurs conclusions,  parues le mois dernier dans la revue « Science Advances » , sont tout à fait étonnantes.

Densité syllabique

Pour leur expérience, les linguistes lyonnais ont demandé à 170 locuteurs de 17 langues différentes de lire à voix haute des séries de textes. Et ils ont appliqué à leurs enregistrements les méthodes et outils d'analyse hérités de la théorie de l'information du génial Claude Shannon. Première observation : le constat intuitif que certaines langues semblent plus rapides que d'autres à l'oreille est parfaitement justifié. Le débit de parole, mesuré en nombre de syllabes prononcées par seconde, varie quasiment du simple au double, sur un éventail allant de 8,03 syllabes par seconde pour le japonais à 5,25 pour le vietnamien et même 4,70 pour le thaï - comme quoi ces variations n'ont rien à voir avec la répartition géographique, puisque les langues asiatiques se trouvent aux deux extrémités du spectre.

Mais cela ne nous renseigne pas sur la plus ou moins grande efficacité supposée des langues à transmettre de l'information. Pour cela, les signataires de l'étude ont mesuré un autre paramètre, un peu plus difficile à saisir : la densité syllabique d'information. Principal auteur de l'étude, le linguiste François Pellegrino nous explique ce qu'il entend par ces termes : « Si une syllabe peut être facilement déduite de celles qui la précèdent, c'est qu'elle apporte peu d'information, au sens de Shannon ; si, au contraire, elle est difficilement prédictible, elle en apporte beaucoup. » Prenons un exemple tiré du français courant pour rendre cette définition plus concrète. Si vous lisez le mot « parce », il y a fort à parier que la syllabe suivante sera « que » : le simple fait de pouvoir la prédire avec une quasi-certitude signifie que sa densité d'information est quasi nulle.

Deux stratégies

Toutes les langues n'encodent pas la même quantité moyenne d'information - mesurée en bits - dans chacune de leurs syllabes. « La densité moyenne d'information des différentes langues varie sur un intervalle allant de 5,03 bits par syllabe, pour le japonais, à 8,02 bits, pour le vietnamien », indique François Pellegrino. Que le japonais ait une densité moyenne d'information d'environ 5 bits par syllabe signifie que prédire quelle sera la syllabe suivante à partir de celles qui l'ont précédée revient à faire le bon choix parmi 32 (25) possibilités ; en vietnamien, cela revient à faire le bon choix parmi 256 (28) possibilités ; c'est donc 8 fois plus facile à faire pour le japonais que pour le vietnamien. En d'autres termes, la densité d'information du japonais est 8 fois plus faible que celle du vietnamien.

Or, l'étude menée par le laboratoire Dynamique du langage sur les 17 langues choisies a montré que ces deux paramètres, débit de parole (mesuré en nombre de syllabes par seconde) et densité d'information (mesuré en bits par syllabe), variaient en sens inverse. Un débit de parole plus important s'accompagne systématiquement d'une densité d'information plus faible, et vice versa. Et il en résulte un phénomène tout à fait remarquable. C'est que si l'on considère à présent le débit d'information d'une langue, défini comme le produit des deux paramètres ci-dessus, celui-ci s'avère constant en tout point du globe : il s'établit à environ 39 bits par seconde. Si dissemblables soient-elles, qu'elles sonnent rapidement ou lentement à nos oreilles, toutes les langues parlées à la surface de la Terre véhiculent, dans un laps de temps donné, la même quantité d'information.

« Une bonne façon de voir les choses, commente François Pellegrino, consiste à dire que, pour être efficaces en termes de transmission d'information, les langues ont le choix entre deux stratégies opposées : soit elles privilégient un débit de paroles élevé au prix d'une faible densité d'information, soit elles font l'inverse. » A cet égard, le français est une langue « moyenne », située à peu près à équidistance des deux extrêmes tant pour le débit de paroles (6,85 syllabes par seconde) que pour la densité d'information (6,68 bits par syllabe). Ce qui lui permet, lui aussi, d'atteindre un débit d'information proche de 39 bits par seconde.

Un mécanisme darwinien

Que cette dernière valeur soit universelle signifie sans doute qu'elle ne doit rien au hasard, mais elle est étroitement contrainte par nos capacités cognitives et la façon dont notre cerveau traite le langage. Une langue qui serait très en deçà de ce seuil de 39 bits par seconde ne permettrait pas à ses locuteurs de faire face à la complexité du monde et serait vite éliminée. Si elle le dépassait, elle surchargerait leurs capacités cognitives (il nous est impossible de maintenir en permanence la production ou le traitement d'un débit d'information trop important) et connaîtrait le même sort. Ce seuil de 39 bits par seconde correspond donc à une niche à la fois biologique et culturelle, qui définit la zone de viabilité des langues humaines.

Cette vision des langues est d'autant plus fascinante que celles-ci, loin d'être figées, évoluent sans cesse au cours du temps. Comme le montre clairement une précédente étude du même laboratoire lyonnais (lire ci-dessous), il peut arriver que de nouveaux sons apparaissent, par exemple, par l'ajout de voyelles nasales (« an », « in », « on », etc.) qui vient doubler le nombre de voyelles total dont dispose une langue. Plus de sons et donc plus de syllabes augmentent la densité d'information d'une langue. Quitte à la faire dévier de sa niche de 39 bits par seconde ? Non, répond François Pellegrino. « Notre hypothèse est que, chaque fois qu'un changement dans la structure d'une langue a modifié sa densité syllabique d'information, ce changement a également conduit ses locuteurs à modifier en sens inverse leur débit de parole, afin de préserver un débit d'information optimal. » Un mécanisme darwinien qui ressemble beaucoup à la façon dont les espèces vivantes, soumises aux lois de l'évolution, s'adaptent pour ne pas mourir.

L'énigme des sons « f » et « v »

Une équipe du laboratoire lyonnais Dynamique du langage, réunie autour de Dan Dediu, a validé une géniale intuition qu'avait eue, dans les années 1980, le grand linguiste américain Charles Hockett. Celui-ci avait remarqué que les consonnes dites labiodentales - le « f » et le « v » -, n'existaient que chez les peuples ayant accès à des aliments mous. Au terme d'une rigoureuse enquête de plusieurs années qui a mêlé analyse statistique, modèle biomécanique et données phylogénétiques, Dan Dediu et les coauteurs de l' étude parue au printemps dernier dans la revue « Science » ont validé ce point. Les consonnes labiodentales sont apparues dans la grande famille des langues indo-européennes (plus de 1.000 langues !) plus tard que les autres sons, il y a entre 6.000 et 3.500 ans. Et leur apparition a été la conséquence de l'invention de l'agriculture, qui a substitué aux aliments très abrasifs consommés par les chasseurs-cueilleurs, telles les racines, d'autres denrées plus molles, comme le pain ou le fromage. Un changement alimentaire qui a modifié la position des incisives. Alors que, chez les enfants et les adultes des populations pratiquant l'agriculture, les incisives du haut sont un peu en avant sur celles du bas, chez les chasseurs-cueilleurs, l'usure des dents fait que cet écart disparaît. Or, le modèle biomécanique utilisé dans l'étude a montré que, avec des incisives du haut alignées sur celles du bas, l'effort musculaire à fournir pour prononcer les sons « f » et « v » était de 29 % plus élevé que la normale. Plus coûteux sur le plan énergétique, ces sons ne sont donc pas apparus dans les langues des chasseurs-cueilleurs. « Notre étude montre comment un changement culturel a entraîné un changement biologique qui a entraîné un changement linguistique », résume Dan Dediu.

Des débits de paroles variables en Europe

En syllabes par seconde :

Espagnol : 7,71

Italien : 7,16

Français : 6,85

Anglais : 6,34

Allemand : 6,09