Prywatność & Pliki cookie
Ta witryna używa plików cookie. Kontynuując, zgadzasz się na ich użycie. Dowiedz się więcej, w tym jak kontrolować pliki cookie.
Większość z nas wie, że „e” to najpowszechniejsza litera w języku angielskim, a najczęściej używane słowo to. Wielu zna ETAOIN SHRDLU, nonsensowny ciąg, który pojawiał się w druku z powodu projektowania drukarek z początku XX wieku, a teraz służy jako skrót dla najpopularniejszych liter.
Poza dominującą wiedzą i ciekawostkami, jesteśmy generalnie mniej pewności co do najczęściej używanych słów i liter w języku angielskim. Różne badania na przestrzeni lat przyniosły różne wyniki, w zależności od zbiorów danych i zastosowanych metod.
Teraz dyrektor badań Google, Peter Norvig, wykorzystał ogromne dane z korpusu Google Books – ponad 743 miliardy słów – do stworzenia zaktualizowane tabele częstości występowania słów i liter. Oto liczba jego listów:
Jak widać, narusza ETAOIN SHRDLU tylko nieznacznie, stając się ETAOIN SRHLDCU.
Norvig zbadał również najczęściej używane długości słów, sekwencje liter („n -gramy ”), litery w różnych pozycjach w słowach i wiele więcej. To fascynująca strona – uczta zarówno dla miłośników danych, jak i znawców słów. (I często są do siebie podobni).