ETAOIN SRHLDCU tai: Mitkä ovat yleisimmät sanat ja kirjaimet englanniksi?

X

Tietosuoja & Evästeet

Tämä sivusto käyttää evästeitä. Jatkamalla hyväksyt niiden käytön. Lisätietoja, mukaan lukien evästeiden hallinta.

Selvä!

Mainokset

Useimmat meistä tietävät, että e on yleisin kirjain englanniksi ja se on yleisin sana. Monille on tuttu ETAOIN SHRDLU, hölynpöly merkkijono, joka ilmestyi aiemmin painetussa muodossa 20. vuosisadan alun tulostussuunnittelun takia ja toimii nyt suosituimpien kirjainten lyhenteenä.

Vallitsevan tarinan ja trivia-asioiden lisäksi olemme yleensä vähemmän varmoja englannin kielen yleisimmistä sanoista ja kirjaimista. Eri tutkimukset ovat vuosien varrella tuottaneet vaihtelevia tuloksia käytetyistä aineistoista ja menetelmistä riippuen.

Nyt Googlen tutkimusjohtaja Peter Norvig on käyttänyt Google Books -korpusin valtavia tietoja – yli 743 miljardia sanaa päivitetyt sana- ja kirjaintaajuustaulukot. Tässä on hänen kirjaintensa lukumäärä:

Kuten näette, se rikkoo vain vähän ETAOIN SHRDLU: ta ja siitä tulee ETAOIN SRHLDCU.

Norvig tutki myös yleisimpiä sanojen pituuksia, kirjainsekvenssejä (”n -grammit ”), kirjaimet eri paikoissa sanoin ja paljon muuta. Se on kiehtova sivu – juhla sekä tietohulluille että sana-nörtteille. (Ja ne ovat usein samankaltaisia.)

Mainokset

Vastaa

Sähköpostiosoitettasi ei julkaista. Pakolliset kentät on merkitty *