Si rien n’est fait, entre 50 et 90% des langues parlées dans le monde aujourd’hui seront amenées à disparaître d’ici la fin du siècle, d’après the Economist. Mais que faire?
L’une des solutions serait de pouvoir être compris de tous, quelle que soit la langue parlée. Par exemple, grâce à un système de traduction instantanée auquel nous pourrions être toujours connectés. Il faudrait pour cela être branchés constamment sur un interprète artificiel performant. Mais y aura-t-il un jour un interprète artificiel performant?
Imaginons qu’un interprète artificiel soit basé sur un modèle statistique: pour chaque mot à traduire, prenons “amour” à traduire en anglais par exemple, cet interprète irait rechercher au sein d’une gigantesque base de livres francophones possibles et imaginables, tous les ouvrages où figurent ce mot (Tristan et Yseut, Le Cid, Romeo et Juliette, etc.). Puis pour chaque ouvrage trouvé, il irait trouver sa traduction anglaise, et dans 99,7% des cas, il constaterait que “amour” est traduit par “love”. Enfin, il jugerait que ce seuil de probabilité est suffisant pour traduire de manière fiable “amour” par “love”.
Tout cela en quelques fractions de seconde. On comprend alors mieux tout le potentiel de Google Books. Et l’espoir gigantesque qu’Internet représente pour sauver les langues en voie de disparition.