Confidentialité & Cookies
Ce site utilise des cookies. En continuant, vous acceptez leur utilisation. En savoir plus, y compris comment contrôler les cookies.
La plupart dentre nous savent que «e» est la lettre la plus courante en anglais et le mot le plus courant. Nombreux sont ceux qui connaissent ETAOIN SHRDLU, la chaîne absurde qui apparaissait à l’imprimé en raison de la conception de l’imprimante du début du 20e siècle et sert maintenant de raccourci pour les lettres les plus populaires.
Au-delà de la tradition et des anecdotes dominantes, nous sommes généralement moins sûrs des mots et des lettres les plus courants de la langue anglaise. Différentes études au fil des ans ont produit des résultats variables, en fonction des ensembles de données et des méthodes utilisées.
Aujourdhui, le directeur de recherche de Google, Peter Norvig, a utilisé les vastes données du corpus Google Books – plus de 743 milliards de mots – pour produire tableaux de fréquence des mots et des lettres mis à jour. Voici son nombre de lettres:
Comme vous pouvez le voir, il ne viole que légèrement ETAOIN SHRDLU, devenant ETAOIN SRHLDCU.
Norvig a également étudié les longueurs de mot les plus courantes, les séquences de lettres (« n -grammes »), des lettres à différentes positions dans les mots, et bien plus encore. Cest une page fascinante – un régal pour les passionnés de données et les nerds des mots. (Et ils se ressemblent souvent.)