ETAOIN SRHLDCU、または:英語で最も一般的な単語と文字は何ですか?

X

プライバシー&クッキー

このサイトはクッキーを使用しています。続行することにより、それらの使用に同意したことになります。 Cookieの制御方法など、詳細をご覧ください。

了解しました!

広告

私たちのほとんどは、「e」が英語で最も一般的な文字であり、が最も一般的な単語であることを知っています。多くの人がETAOINSHRDLUに精通しています。これは、20世紀初頭のプリンター設計のために印刷物に表示されていた意味のない文字列で、現在では最も人気のある文字の省略形として機能します。

一般的な伝承や雑学を超えて、私たちは一般的に、英語の最も一般的な単語や文字についてはあまり確信がありません。長年にわたるさまざまな研究により、使用するデータセットと方法に応じてさまざまな結果が得られました。

現在、Googleの調査責任者であるPeter Norvigは、Googleブックスのコーパスからの膨大なデータ(7,430億語以上)を使用して作成しています。単語と文字の頻度の表を更新しました。彼の文字数は次のとおりです。

ご覧のとおり、ETAOIN SHRDLUにわずかに違反し、ETAOINSRHLDCUになります。

Norvigは、最も一般的な単語の長さ、文字のシーケンス( “n -grams」)、単語のさまざまな位置にある文字など。これは魅力的なページです。データフィーンドとワードオタクの饗宴です(そして、それらはよく似ています)。

広告

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です