Ochrana osobních údajů & Soubory cookie
Tento web používá soubory cookie. Pokračováním souhlasíte s jejich použitím. Další informace, včetně toho, jak ovládat soubory cookie.
Většina z nás ví, že e je nejběžnější písmeno v angličtině a je nejběžnějším slovem. Mnozí znají ETAOIN SHRDLU, nesmyslný řetězec, který se dříve objevil v tisku kvůli designu tiskárny z počátku 20. let a nyní slouží jako zkratka pro nejoblíbenější písmena.
Kromě převládající tradice a drobností jsme obecně méně jistý o nejběžnějších slovech a dopisech v anglickém jazyce. Různé studie v průběhu let přinesly různé výsledky v závislosti na použitých souborech dat a použitých metodách.
Ředitel výzkumu společnosti Google Peter Norvig využil rozsáhlá data z korpusu Knih Google – přes 743 miliard slov – k vytvoření aktualizované tabulky frekvencí slov a písmen. Tady je jeho počet písmen:
Jak vidíte, porušuje ETAOIN SHRDLU jen nepatrně a stává se ETAOIN SRHLDCU.
Norvig také zkoumal nejběžnější délky slov, sekvence písmen („n -gramy “), písmena na různých pozicích ve slovech a mnoho dalšího. Je to fascinující stránka – pastva pro datové zloduchy i slovní blbečky. (A často jsou si podobní.)