2005年01月03日

【単語帳の謎】どうやって「重要英単語」を判断するか?

今,巷には「単語帳」なる英語教材が溢れています.

単語帳には,ただ単語をアルファベット順に並べただけのものから,例文や関連語などをふんだんに取り入れて分かりやすい&覚えやすい工夫が施されているものまで,実にさまざまな種類があります.

資格試験勉強の時や,受験の時にお世話になった方も多いはずです.

で,ここでひとつ質問なんですが,単語帳に載っている単語って,一体どういう基準で選んだ単語でしょう?

おそらくほとんどの方の答えはこうだと思います:「そんなの当たり前じゃないか,よく出る単語だよ!」

そうですね,単語帳には普通,「よく出る単語」が掲載されていると普通の人は思っていますし,実際に単語帳自体にそう書いてあることも多いです.そもそも「出る単」とか「よく出る」なんて名前が単語帳に付くぐらいですから,単語帳はいかに「よく出る単語」を掲載するかで価値が決まると思われていると言ってよいでしょう.

普通,私たちが単語帳を選ぶ際にも,ぜんぜん出ないようなマニアックな単語がいっぱい載っているような単語帳よりも,「これだけ覚えれば大丈夫!」のようなよく出る単語がたくさん載っている単語帳の方を使いたいと思いますよね?

なので,ここではTOEICの単語帳を例にとりますけど,そこには「TOEICに良く出る」との謳い文句とともに,単語が掲載されているわけです.中には「コンピュータを使って分析した」との非常に怪しい「お墨付き」がついているのもあります.

ではここでもう一つ質問:じゃあ実際にTOEICで一番良く出る単語はどの単語だかご存知ですか?

それでは受験英語ではどうでしょう?

・・・

答えは非常に簡単で,"the"です.TOEICでも受験英語でも"the"です.さらに,2番目によく出る単語は"be"でしょう.その後,"and", "to", "of", "a"... と続いていきます.

それなのに,「TOEICによく出る」「入試に出る!」と謳っている単語帳で,一番はじめに"the"が書いてあるようなものを見たことがありますか?少なくとも私の知る限り無いです.

つまり,巷に溢れている単語帳には,ウソをついているものがたくさんあるということで,「TOEICに良く出る」「入試に出る!」と書いてあったら,"the"や"be"や"and"が載ってないと厳密には虚偽の記載がしてあることになるのです.

それでも,なぜそれで良く売れているかと言えば,当たり前ですが,ほとんどの人にとって,"the"や"and"が書いてある必要が無いからです.つまり,単語帳には,「良く出て,かつ簡単すぎない単語」が載っているのです.ではこの"the"のような「簡単すぎる単語」はどうやって除外しているのでしょうか?

こうやって突き詰めていくとキリがありません.つまり,単語帳を使うときは,基本的にどんな基準で選んだ単語が載っているか分かったもんじゃない,と腹をくくって使った方がいいです.その単語帳の著者が独断と偏見とフィーリングで選んだような単語帳も少なくないでしょう.「コンピュータを使って分析した」っていっても,どうやって分析したのかが書かれていません.恐らくそのほとんどが,コンピュータを使ってそれぞれの単語の出現数を数えた程度でしょう.

なので,このブログでは,この「単語帳」の問題を踏まえて,どうやって「重要英単語」を選んでいるかオープンにしようと思います.もちろん,私のフィーリングなどではなく,しっかりと計算で選んでいます.詳しい計算式などは秘密ですが(というかそもそも見たい人います?),以下に挙げる基準がもとになっています.(ここでは例としてTOEICの重要英単語を選定する場合を取り上げています)

  • TOEICの過去問をOCRなどを使って読み込み,各単語がそこにどれだけ出現しているかを調べる.たくさん出現している単語は「重要度」を高くする.
  • TOEICではない,「一般的な英語」を大量に集めたデータベース(コーパス)を分析し,そこでの出現回数を調べる.そこにたくさん出現している単語は重要度が低くなるようにする.
  • 固有名詞は除外する.
  • ある長文問題だけには良く出て,他の部分には出現しないような,出現分布が偏っている単語は,いくら多く出ても重要度が低くなるようにする.逆に言うと,満遍なく出現している単語は重要度が高い.
  • アルク社の選定したSVL(標準語彙水準)を参照して,あまりに簡単な単語は重要度が低くなるようにする.

上の5つの基準で計算したファクターを総合して,「重要度スコア」を計算しています.その重要度スコアが高い順に取り出したランキングが,このブログで紹介している「重要英単語」になるのです.

(「英検2級重要英単語」は明日から...)

☆それを考えるとこっちのブログランキングの信憑性って...まあ仕方ないことですが.

posted by はぎ at 12:50| Comment(183) | TrackBack(1) | 英単語分析 | このブログの読者になる | 更新情報をチェックする

広告


この広告は60日以上更新がないブログに表示がされております。

以下のいずれかの方法で非表示にすることが可能です。

・記事の投稿、編集をおこなう
・マイブログの【設定】 > 【広告設定】 より、「60日間更新が無い場合」 の 「広告を表示しない」にチェックを入れて保存する。


×

この広告は1年以上新しい記事の投稿がないブログに表示されております。