Confidențialitate & Cookie-uri
Acest site folosește cookie-uri. Continuând, sunteți de acord cu utilizarea lor. Aflați mai multe, inclusiv cum să controlați cookie-urile.
Majoritatea dintre noi știm că „e” este cea mai comună literă în engleză și este cel mai frecvent cuvânt. Mulți sunt familiarizați cu ETAOIN SHRDLU, șirul de prostii care apărea în tipar din cauza designului imprimantei de la începutul secolului al XX-lea și servește acum ca prescurtare pentru cele mai populare litere.
Dincolo de tradițiile și trivialitățile predominante, suntem în general mai puțin sigur cu privire la cele mai comune cuvinte și litere din limba engleză. Diferite studii de-a lungul anilor au produs rezultate variate, în funcție de seturile de date și metodele utilizate.
Acum, directorul de cercetare Google, Peter Norvig, a folosit vastele date din corpusul Google Books – peste 743 miliarde de cuvinte – pentru a produce tabele actualizate cu frecvență de cuvinte și litere. Iată numărul scrisorilor sale:
După cum puteți vedea, încalcă ETAOIN SHRDLU doar ușor, devenind ETAOIN SRHLDCU.
Norvig a investigat, de asemenea, cele mai frecvente lungimi de cuvinte, secvențe de litere („n -grame „), litere în diferite poziții în cuvinte și multe altele. Este o pagină fascinantă – o sărbătoare atât pentru demonii de date, cât și pentru tocilarii de cuvinte. (Și sunt adesea la fel.)