Privacy & Cookies
Dette websted bruger cookies. Ved at fortsætte accepterer du deres brug. Lær mere, herunder hvordan du styrer cookies.
De fleste af os ved, at e er det mest almindelige bogstav på engelsk, og det er det mest almindelige ord. Mange er fortrolige med ETAOIN SHRDLU, den nonsensstreng, der plejede at blive trykt på grund af det tidlige 20.C-printerdesign og nu fungerer som stenografi for de mest populære bogstaver.
Ud over fremherskende historie og trivia er vi generelt mindre sikker på det engelsksprogede mest almindelige ord og bogstaver. Forskellige undersøgelser gennem årene har produceret forskellige resultater afhængigt af de anvendte datasæt og metoder.
Nu har Googles forskningsdirektør Peter Norvig brugt de enorme data fra Google Books corpus – over 743 milliarder ord – til at producere opdaterede ord- og bogstavfrekvenstabeller. Her er hans antal bogstaver:
Som du kan se, overtræder det kun ETAOIN SHRDLU og bliver ETAOIN SRHLDCU.
Norvig undersøgte også de mest almindelige ordlængder, sekvenser af bogstaver (“n -grammer “), bogstaver i forskellige positioner i ord og meget mere. Det er en fascinerende side – en fest for datafiender og ordnørder ens. (Og de er ofte ens.)