Privacy & Informasjonskapsler
Dette nettstedet bruker informasjonskapsler. Ved å fortsette godtar du bruken av dem. Lær mer, inkludert hvordan du kontrollerer informasjonskapsler.
De fleste av oss vet at e er den vanligste bokstaven på engelsk og det er det vanligste ordet. Mange er kjent med ETAOIN SHRDLU, tullstrengen som pleide å vises på trykk på grunn av skriverdesign fra begynnelsen av 20-tallet, og som nå fungerer som stenografi for de mest populære bokstavene. generelt mindre sikker på det engelskspråklige vanligste ord og bokstaver. Ulike studier gjennom årene har gitt varierende resultater, avhengig av datasett og metoder.
Nå har Googles forskningsdirektør Peter Norvig brukt de enorme dataene fra Google Books corpus – over 743 milliarder ord – til å produsere oppdaterte ord- og bokstavfrekvenstabeller. Her er hans brevtelling:
Som du ser, bryter det bare ETAOIN SHRDLU, og blir ETAOIN SRHLDCU.
Norvig undersøkte også de vanligste ordlengdene, bokstavsekvensene -grammer ”), bokstaver i forskjellige posisjoner i ord og mye mer. Det er en fascinerende side – en fest for datafekter og ordnerdene. (Og de er ofte like.)