X
개인 정보 보호 & 쿠키
이 사이트는 쿠키를 사용합니다. 계속하면 사용에 동의하는 것입니다. 쿠키 제어 방법을 포함하여 자세히 알아보세요.
알았습니다!
광고
대부분의 사람들은 e가 영어에서 가장 일반적인 문자이고 the가 가장 일반적인 단어라는 것을 알고 있습니다. 많은 사람들이 20 세기 초반의 프린터 디자인 때문에 인쇄에 사용되던 말도 안되는 문자열 인 ETAOIN SHRDLU에 익숙하고 이제는 가장 인기있는 글자의 약자로 사용됩니다.
일반적인 지식과 퀴즈를 넘어서, 우리는 일반적으로 영어의 가장 일반적인 단어와 글자에 대해 덜 확신합니다. 수년간 여러 연구에서 사용 된 데이터 세트와 방법에 따라 다양한 결과가 나왔습니다.
이제 Google의 연구 책임자 인 Peter Norvig는 Google 도서 자료의 방대한 데이터 (7,340 억 단어 이상)를 사용하여 업데이트 된 단어 및 문자 빈도 표. 그의 글자 수는 다음과 같습니다.
보시다시피 ETAOIN SHRDLU를 약간 위반하여 ETAOIN SRHLDCU가됩니다.
Norvig는 또한 가장 일반적인 단어 길이, 문자 시퀀스 ( “n -grams ), 단어의 다양한 위치에있는 글자 등. 데이터 마니아와 단어 애호가 모두를위한 만찬 페이지입니다. (종종 비슷합니다.)