【難易度世界一?】日本語は語彙量が多いと言われるのはなぜ?

「各語の90%以上を理解しようとする場合、フランス語なら約2000語、英語なら3000語、ドイツ語なら約5000語、日本語なら10000語が必要と言われている」なんて噂を耳にした方は少なくないのではないでしょうか。

「日本語は語彙が多い」とよく聞きますね。日常会話の大半を理解するために必要な単語数が多いとか、そもそも語彙のサイズが大きいとか。

どうして日本語の語彙が多いと言われるのかの理由をいくつか挙げてみました。

※いちおう断っておきますが、【難易度世界一?】という文言は、いちおう日本語が最難関に認定されている、アメリカ外交官養成局のランキングを参考に、ちょっと誇張しました。

<記事は広告の後にも続きます>

日本語を読むには、より多くの語彙が必要。

冒頭の文言とは異なりますが、「日本語は語彙が豊富である」と言われることがあります。たしかに、日本語には非常に多くの言葉があります。

ただし語彙の豊富さに関しては、公用語レベルになっている言語に関してはどの言語も同じようなものでしょう。一方で、「一般的な文章を読むために必要な語彙が、日本語の場合は多い」というデータがあります。

『講座 日本語と日本語教育(6)日本語の語彙・意味(上)』で引用されているデータによると、英語とフランス語とスペイン語では最頻5,000語を覚えると、それぞれ文章(ここでは文学作品)の93.5%、96%、92.5%を理解できるのに対し、日本語の場合は最頻5,000語をおさえても理解できるのが81.7%に留まるそう。

つまり「日本語は語彙が豊富だ」というのはおそらく「日本語を母語としない人が、日本語の文章をある程度理解できるようになるのに必要な語彙量が多い」ということになりそうです。

たしかにそれは「日本語の語彙は豊富である」とも言えますが、一方で「ある程度を文章を読むだけでも相当量の語彙が必要な効率悪い言語」ということにもなりそうです。

では、どうして日本語を話すにはより多くの語彙が必要になるのか、理由をいくつか挙げてみました。ただしここに挙げた理由は全てが科学的根拠に基づくものではないので、話半分に読んでいただけたらと思います。

  • データの出典:玉村文郎 編(1989)『講座 日本語と日本語教育(6)日本語の語彙・意味(上)』明治書院、155-157頁

<記事は広告の後にも続きます>

日本語の豊富なオノマトペ(擬音語、擬態語)

大雨の中の船の写真
Free-Photos / Pixabay

オノマトペ(onomatopeia)とは擬音語や擬態語の事。

擬音語は「バタン」とか「カタカタ」「ざあざあ」など音を言葉であらわしたもので、擬態語は「くねくね」「きらきら」「うるうる」など、音というよりはようすをあらわしたもの。

私達日本人は、オノマトペを日常会話でものものすごく頻繁に使っていますよね。

その日本語のオノマトペは実に多様。「滔々」「燦燦」「錚々」など漢字を当てられているものから、「ふわふわ」「ころころ」「わちゃわちゃ」などひらがなのみで書かれるのものも。

「ころころ」と「ごろごろ」、「さらさら」と「ざらざら」など清音か濁音かでニュアンスが変わったりもします(カタカナにしても変わる……?)。

一方英語にはbangとかding dongなどの擬音語やオノマトペ由来の単語があったりしますが、日本語よほどは多くない印象です。

日本語のオノマトペは本当に種類が豊富で、多様なニュアンスを表すことができます。しかも、新しく作ることだって可能ときた。

日本語の創造性豊かなオノマトペが、日本語の「語彙数」の多さに貢献していることは間違いないかと思います。

<記事は広告の後にも続きます>

3種類の日本語の語彙:和語、漢語、外来語

日本語の単語は、語源によっていくつかの種類に分けられます。

和語は古来の日本語に由来していることば。ひらがなで書かれることが多いですが、漢字を使う場合は訓読みがされます。

漢語は中国語由来の言葉で、漢字で書かれることが多いもの。主に音読みが使われますね。

外来語は、それ以外の外国語から入ってきた単語。英語やドイツ語などのヨーロッパの言葉から入ってきた「カタカナ語」が代表的ですが、「金平糖」など漢字で書かれるものもあります(厳密にいえば漢語も外来語だけど、漢語を日本語とみなさない人はいないでしょうね)。

日本語の語彙はこの3種に大きく分けることができますが、ある程度オーバーラップがあります。つまり同じ意味でも語源が異なる単語があるということ。

例えば「速さ」「速度」「スピード」がそうですね。この3つの単語は意味こそ同じですが、ニュアンスや使われる状況、形態論的なルールなどが微妙に異なったりしています。

他にも「気持ち」「感情」「フィーリング」など、日本語にはこの手の意味が重複した単語が多く見られます。

日本語にはもともと漢語があるうえに昨今では英語由来のカタカナ語が大量に生まれているので、これも日本語の語彙量を押し上げているものと考えられます。

<記事は広告の後にも続きます>

敬語による違い

握手している場面の写真
rawpixel / Pixabay

日本語は非常に複雑な敬語体系を持つ言語です。

「です」「ます」を語尾につける丁寧語に始まり、美化語や、尊敬語と謙譲語があります。

あまりに複雑なので日本語のネイティブですら難儀することが多く、日本人向けの敬語の指南書なんかは多数出版されています。個人的には、言語に関してあまり規範的になるのは好きじゃないんですが。

「食べる」一つとっても「お食べになる」「召し上がる」「いただく」「頂戴する」と4つの形があります。

それに「会社」も、あなたの会社か私の会社かで「貴社」「御社」「弊社」「当社」(これは敬語ではないですが)があります。探せば、同様の例はいくらでも出てくるはず。

敬語に限らずこういった単語は、日常生活(主にビジネス)でも非常によく使う言葉。

それを考えると、日本語で「日常会話を理解する」のには多くの語彙が必要というのもさもありなんと思えますね。

<記事は広告の後にも続きます>

位相語や役割語

女性語とか男性語とか、ちょっとお行儀のよくない単語とかいっぱいありますよね。そういった単語は役割語とか位相語と呼ばれます。

自分の夫の事を「夫」と言わずに「主人」とか「旦那」と言ったり、その逆で「妻」と直に言わずに「家内」と言ったり。「おいしい」と「うまい」があったり。

フィクションの女性が「-かしら」とか言ったり、ご年配の方が「ーじゃ」とか。どちらも現実世界では絶滅危惧種ですが。

日本語は人称も豊富ですね。1人称いひとつとっても、「僕」「俺」「私」「あたい」「おいら」「拙者」「小生」「当方」「わし」「我」「ミー」、等々。

2人称も「あなた」「君」「お前」「貴様」「あんた」「ユー」「ぼく」「そち」「そちら」「てめえ」等々。

ただ、お行儀の悪い言葉とかスラングとかは他の言語にもあるので、これが語彙量の違いの大きな原因なのか、少し微妙なところではありますが。

<記事は広告の後にも続きます>

その他、単語のバリエーション

自転車に乗ってどこかへ行く人の写真
Free-Photos / Pixabay

そのほかうまく分類できませんが、日本語には似たような意味の単語のバリエーションが非常多いと思います(あくまで個人的な印象ではありますが)。

これは漢語の場合に顕著です。

たとえば「行く」ひとつとっても、「行く」目的地によって「出社する」「出勤する」「登校する」「入獄する」「出頭する」「参列する」だったり。

「見る」も、「目にする」「鑑賞する」「観賞する」「観覧する」「凝視する」「視認する」「観覧する」「閲覧する」、そして敬語を使って「ご覧になる」「拝見する」「拝謁する」などのバリエーションがあります。

個人的にすごいと思うのが、「入る」という意味の言葉。どこに入るかによって「入室」「入場」「入港」「入国」「入院」「入学」「入居」「入隊」「入店」「入寮」「入信」「入団」「入門」「入湯」「入社」「入会」「入閣」と少なくとも17種類の単語があります。眺めているとゲシュタルト崩壊を引き起こしそうです。

こういった語彙は日常生活で目にすることが非常に多いので、「一般的な日本語の文章をある程度理解できるようになるのに必要な語彙量」を大きく押し上げている一因になっているように思えます。

漢字の意味さえ分かれば、意味の類推は簡単そうですが!

<記事は広告の後にも続きます>

番外編:国語辞典の収録単語数は?

ここで番外編として、国語辞典がそれぞれどれくらいの語彙をカバーしているのか見てみましょう。

まず代表的かつ権威のある広辞苑第七版は、総項目数25万を誇ります。広辞苑と同じくらい分厚い大辞林も、ほぼ同数の25万1,000

もちろん広辞苑には普段使わない語彙があったり、歴史上の人物などの固有名詞も含まれていますので、これだけを見て日本語の語彙を語ることはできません。

一方、より一般的な国語辞典の収録単語数は以下の通りです。7万語前後のものが多いですね。

最後に:そもそも「単語」の基準って何だろう

以上、「日本語の語彙数が多い」という主張に対する考えれられる理由をあげてみました。

ただ言語の単語数を数えることは、非常に大きな問題をはらみます。

それが「『単語』とは何か」についての基準です。何をもって単語とするかは、思っているより遥かに難しいのです。

「です」や「ます」はそれぞれ1単語なのでしょうか? ならば「食べていらっしゃったらしいから」はいくつの単語からなるのでしょう?

created by Rinker
小学館
¥2,200 (2024/03/28 13:57:11時点 Amazon調べ-詳細)

多義語に関しても同様です。特に日本語では、発音やひらがな表記が同じでも、意味やニュアンスが違えば漢字表記が異なるという例もあります(「作る」「造る」など)。

こういった単語を同一単語とみなすか、はたまた別の単語ととらえるのかは、非常に難しい問題なのです。

以上の理由から、「日本語は語彙量が大きい」という言説は慎重に考えなければならないと思います。

そんなこんなで色々と御託を並べました。お楽しみいただけていれば幸いです。

……あと、「語彙数」という表現が散見されますが、これ変です。「語彙量」か「単語数」と言いかえましょう。語彙=「その人が知っている単語の総量」です。英語のvocabularyも同様ですね。

Header Image by DoriyaKiz / Pixabay

ヘルシンキからの日帰り旅行にぴったりな名所9つ【国内だけじゃない!】

英語の多読学習におすすめな洋書&ウェブサイトを紹介する【小説中心】

8件のコメント

  1. ぽんち

    「食べていらっしゃったらしいから」

    食べ・て・いらっしゃった・らしい・から

    5語です、単純明快ですね。おっしゃるような点もあるかと思いますが、日本語の語彙が途方もなく多いのは、近代から現代(明治から令和)にかけての語の変遷が非常に盛んなのも一因と思います。明治文学など見てみると、かなり多くの言葉が現代とは違うことが分かります。が、それらも近代のもので、知らねば多少古い小説や時代物など読めないので、日常の言葉と言えます。

    • めいげつ

      ぽんち様

      コメントありがとうございます。
      そうですね。単純に「単語」とした場合「食べていらっしゃったらしいから」は5語になりそうですね。ただ西洋語的な意味での「単語(おそらく自立語が近いかと)」となると、もしかすると「1単語の変化形」のように扱われる可能性もありそうです。
      そこから日本語をラテン文字表記した場合(カナ漢字表記でもそうですが)どうスペーシングするかという問題にも行きつきますね。日本語学習者向けの教科書ではどういう風に「単語」を区切っているかというのも興味深いです。
      僕は日本語の歴史的な変遷については少々疎くて詳細は分かりませんが、明治期ないしそれ以前の語彙とその後に出現した語彙が共存しているならその説も支持できますね(恐らくあるのでしょうが思いつきませんでした)。ただ「一般的な文章を読むために必要な語彙が、日本語の場合は多い」とうい観点でみてそれがどれだけ影響があるのかは少し疑問に思います。

  2. tt

    ただ伝えるだけであれば日本語は簡単だと思います。そこから磨き上げていくのが途方もなく感じるんでしょうね。外国の人と話していると決まって日本語はライティングとリーディングが難しいと言っていますね。これは日本人にとってもですけど。

    • めいげつ

      tt様こんにちは。
      うーん、至極簡単な内容(「トイレどこ」とか「〇〇売ってますか」)くらいならどの言語でも伝えるのは簡単だと思いますが、それ以上の内容を、それも的確に伝えるとなると難しいのは本当ですね。

  3. ニコラス

    こんにちは。日本語を勉強している外国人なのです。自己評価では多分5000か7000語を知っているだろうと思ってますので、記事の90%に近い理解できるでしょう。とにかく読みながらそう感じました。あと役割語のことを調べてみます。すごく勉強になりました!それじゃ

    • めいげつ

      ニコラスさんこんにちは。コメントありがとうございます。
      なるほど、僕の書いた記事の語彙レベルは大体その辺りなんですね~。
      勉強になったと言っていただいてこちらも嬉しいです。日本語の勉強がんばってください!

  4. ちょろりんこ

    めいげつさん初めまして!
    ブログとても興味深く読ませていただきました!まずは記事を書いてくださりありがとうございますm(_ _)m

    私自身は日本語より英語の方がより狭いところにスポットを当てた詳しいニュアンスを伝えるには優れているのかな?(see,watch,lookなど日本語では全て”みる”と訳しますよね!)とふと感じたことがきっかけで、あれ、でもそういえば日本語って世界的にみても語彙量が大きいと聞いたことがあるぞ?と思い、これはどういうことかと気になり検索に至りました

    そこで「一般的な文章を読むために必要な語彙が、日本語の場合は多い」というのを見て自分の認識の間違いに気づけました(^-^)

    また、なぜ「一般的な文章を読むために必要な語彙が、日本語の場合は多い」のかのトリックの解釈もとってもしっくりきて納得することが出来ました!特に「日本語には似たような意味の単語のバリエーションが非常多い」という部分が、衝撃が走りストンと腑に落ちた感覚になりましたし、私が前半に書いた英語の特徴(なんですかね?)との対比にも感じられて新たな発見でした!!

    それから、めいげつさんがおっしゃっていた「単語数はどう判断するのか」や「漢字表記はどう判断するのか」も同じように疑問に感じ、奥が深いなと思いつつ難しいな〜と思いました

    沢山の発見がありとても良い時間になりました!本当にありがとうございます

    最後に!語彙力が無いとよく言いますがこれも語彙量が小さいと言ったほうがより言葉の意味に忠実なんですかね?

    とてつもない長文失礼しました!m(_ _)m

    • めいげつ

      ちょろりんこさん初めまして。返信が遅れてすみません。
      記事のご感想ありがとうございます! とても励みになります。ちょろりんこさんの新たな知的発見に役立てて何よりです。

      日本語と英語を比べるとき、和語か漢語かで大分印象が違う感じですね。
      和語はだいぶざっくりしてます(それこそsee,watch,lookと「みる」)が、漢語は英語と同じぐらいかそれ以上「狭いスポットを当てている」感じがします。
      「日本語には似たような意味の単語のバリエーションが非常多い」(ちょっと適当すぎたかな)のも、主に漢語の特徴ですね。

      「語彙力が無い」の「語彙力」はあくまで力とかスキルなので、「語彙力が無い」と言ってもは特に問題ないかと思います。
      「語彙」とはざっくりいえば「単語の総量」なので、数の大小というよりは量の多い少ないで語るべきだという印象があります。
      もし百科事典かなんかで、科学の語彙とか哲学の語彙とかあらゆる種類の語彙が豊富なときに「語彙数が多い」と言えなくもないかもですが……実際使うかどうかは微妙ですね。
      国語辞典についても「収録『単語数』が多い」と言いますよね。そんな感じです。

      僕も長文失礼いたしました。

めいげつ へ返信する コメントをキャンセル

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

Powered by WordPress & Theme by Anders Norén