Sekretess & Cookies
Denna webbplats använder cookies. Genom att fortsätta godkänner du deras användning. Läs mer, inklusive hur du kontrollerar cookies.
De flesta av oss vet att ”e” är den vanligaste bokstaven på engelska och det är det vanligaste ordet. Många känner till ETAOIN SHRDLU, den nonsenssträng som tidigare visades på tryck på grund av skrivardesignen från början av 20-talet och nu fungerar som stenografi för de mest populära bokstäverna.
Utöver rådande historia och trivia är vi i allmänhet mindre säker på engelska språkets vanligaste ord och bokstäver. Olika studier under åren har gett varierande resultat, beroende på vilka datamängder och metoder som används.
Nu har Googles forskningsdirektör Peter Norvig använt de enorma uppgifterna från Google Books Corpus – över 743 miljarder ord – för att producera uppdaterade ord- och bokstavsfrekvenstabeller. Här är hans bokstavsantal:
Som du kan se, bryter det bara ETAOIN SHRDLU och blir ETAOIN SRHLDCU.
Norvig undersökte också de vanligaste ordlängderna, sekvenser av bokstäver (”n -grammar ”), bokstäver i olika positioner i ord och mycket mer. Det är en fascinerande sida – en fest för datavänner och ordnördar lika. (Och de är ofta lika.)