Privacy & Cookies
Deze site maakt gebruik van cookies. Door verder te gaan, gaat u akkoord met het gebruik ervan. Meer informatie, inclusief hoe u cookies beheert.
De meesten van ons weten dat e de meest voorkomende letter in het Engels is en dat het het meest voorkomende woord is. Velen zijn bekend met ETAOIN SHRDLU, de onzinstring die vroeger in druk verscheen vanwege het printerontwerp uit het begin van de 20e eeuw en nu dient als afkorting voor de meest populaire brieven.
Afgezien van de heersende kennis en weetjes, zijn we over het algemeen minder zeker over de meest voorkomende woorden en letters in de Engelse taal. Verschillende onderzoeken hebben in de loop der jaren verschillende resultaten opgeleverd, afhankelijk van de datasets en gebruikte methoden.
Nu heeft Googles onderzoeksdirecteur Peter Norvig de enorme hoeveelheid gegevens van het Google Books-corpus – meer dan 743 miljard woorden – gebruikt om te produceren bijgewerkte woord- en letterfrequentietabellen. Hier is zijn aantal letters:
Zoals u kunt zien, schendt het ETAOIN SHRDLU slechts een klein beetje en wordt het ETAOIN SRHLDCU.
Norvig onderzocht ook de meest voorkomende woordlengtes, letterreeksen (“n -grams ”), letters in verschillende posities in woorden en nog veel meer. Het is een fascinerende pagina – een feest voor zowel datafluden als woordnerds. (En ze lijken vaak op elkaar.)