更級日記は「大野の語彙法則」に従うか?
大野の語彙法則という日本の古典に関する統計的法則がある。
『更級日記』もこの法則に従うかどうかを検討してみた。
「大野の語彙法則」というのは,国語学者の大野晋(おおの・すすむ)が1956年に発表した法則である。
正確な記述はWikipediaの記事を参照していただくとして,だいたいこんな法則(水谷静夫による改訂版)である。
(1) 万葉集,土佐日記,竹取物語,枕草子,源氏物語,紫式部日記,讃岐典侍日記,方丈記,徒然草の9作品に登場する語彙(ただし,助詞・助動詞を除く)を,品詞別に分けて集計し,構成比を求める
(2) 作品ごとの名詞の構成比を横軸,動詞・形容詞・形容動詞の構成比を縦軸にプロットすると,動詞・形容詞・形容動詞の構成比はそれぞれ右下がりの直線上に並ぶ
ようするに,日本の古典では,動詞,形容詞,形容動詞の構成比は名詞の構成比の関数となる,ということである。
論より証拠で,実際にデータを見てみよう。
◆ ◆ ◆
水谷静夫『数理言語学』(培風館,1982年)14ページに掲載されていた表を2つの表に分けて紹介しよう。
まず,各作品に登場する語彙の品詞別語数は次のようになる:
作品名 | 名詞 | 形容動詞 | 形容詞 | 動詞 | その他 | 計 |
---|---|---|---|---|---|---|
万葉集 | 4660 | 75 | 276 | 1545 | 452 | 7008 |
土佐日記 | 529 | 12 | 66 | 326 | 65 | 998 |
竹取物語 | 717 | 45 | 105 | 552 | 94 | 1513 |
枕草子 | 3048 | 215 | 349 | 1620 | 252 | 5484 |
源氏物語 | 6501 | 683 | 1130 | 5554 | 820 | 14688 |
紫式部日記 | 1433 | 117 | 222 | 874 | 96 | 2742 |
讃岐典侍日記β | 982 | 65 | 125 | 633 | 126 | 1931 |
方丈記 | 652 | 27 | 66 | 344 | 64 | 1153 |
徒然草 | 2836 | 131 | 285 | 1380 | 210 | 4842 |
『讃岐典侍日記』にβという記号を付けた理由は後で述べる。
この表を構成比[%]で書き直すと次のようになる:
作品名 | 名詞 | 形容動詞 | 形容詞 | 動詞 | その他 |
---|---|---|---|---|---|
万葉集 | 66.5 | 1.1 | 3.9 | 22.0 | 6.4 |
土佐日記 | 53.0 | 1.2 | 6.6 | 32.7 | 6.5 |
竹取物語 | 47.4 | 3.0 | 6.9 | 36.5 | 6.2 |
枕草子 | 55.6 | 3.9 | 6.4 | 29.5 | 4.6 |
源氏物語 | 44.3 | 4.7 | 7.7 | 37.8 | 5.6 |
紫式部日記 | 52.3 | 4.3 | 8.1 | 31.9 | 3.5 |
讃岐典侍日記β | 50.9 | 3.4 | 6.5 | 32.8 | 6.5 |
方丈記 | 56.5 | 2.3 | 5.7 | 29.8 | 5.6 |
徒然草 | 58.6 | 2.7 | 5.9 | 28.5 | 4.3 |
この表のデータを用いて,各作品の名詞の構成比を横軸に,動詞・形容詞・形容動詞の構成比を縦軸にプロットしてみると次のグラフのような結果が得られる。
動詞・形容詞・形容動詞が直線的に並んでいるのが読み取れる。これが視覚化された「大野の語彙法則」である。
◆ ◆ ◆
さて,古典9作品については法則が成立しているように見えるが,他の作品ではどうなるのか?
小生は古くから親しんでいる『更級日記』で実験してみることにした。手元に『更級日記』の総索引がついているような本がないのと,時間がかかりそうなので,冒頭の3センテンス:
「あづま路の道のはてよりも,なほ奥つ方に生ひ出たる人…見捨てたてまつる悲しくて,人知れずうち泣かれぬ。」
の範囲を対象にして挑戦。
大野晋・佐竹昭広・前田金五郎編『岩波古語辞典』を片手に単語を分類してみた結果,冒頭3センテンスに関しては以下の結果となった:
語数(助詞・助動詞を除く)
- 名詞: 44
- 形容動詞: 3
- 形容詞: 7
- 動詞: 37
- その他: 11
- 合計: 102
構成比
- 名詞: 43%
- 形容動詞: 3%
- 形容詞: 7%
- 動詞: 36%
- その他: 11%
分類の時に困ったのは「人知れず」のような連語である。名詞や動詞に分解した場合,意味が変わってしまう。仕方がないので,連語はその他に分類した。多分,こういう操作によって,それぞれ品詞の数が変動すると思う。
さて,以上の結果を先ほどのグラフに加えてプロットしてみると以下の通りとなる。オレンジ色が『更級日記』冒頭部分を表している:
動詞・形容詞・形容動詞のいずれも,若干,直線から外れているように見えるが,大外れというほどでもないと思う。わずか3センテンスだけで実験したため,このような結果になったが,『更級日記』全文でやれば「大野の語彙法則」により近づく可能性もある。
![]() | 日本語練習帳 (岩波新書) 大野 晋 岩波書店 1999-01-20 売り上げランキング : 6664 Amazonで詳しく見る by G-Tools |
![]() | 曲り角の日本語 (岩波新書) 水谷 静夫 岩波書店 2011-04-21 売り上げランキング : 231839 Amazonで詳しく見る by G-Tools |
※『讃岐典侍日記』にβを付けた理由だが,これは修正後のデータという意味である。大野晋が使った『讃岐典侍日記』の総索引では複合動詞を認めなかったため,動詞の数が424個となっていたのだが,大野晋は複合動詞を認め,633個と動詞の数を増やしたのである。
語数の数え方は非常に重要な問題である。小生の場合も「連語」をどう扱うか困ったわけである。
| 固定リンク
「アカデミック」カテゴリの記事
- 『<学知史>から近現代を問い直す』所収の「オカルト史研究」を読む(2024.05.23)
- データ主導時代に抗して(2023.11.08)
- モンゴル語の"Л (L)"の発音(2022.11.18)
- 『学術出版の来た道』を読む(2021.12.10)
- Proton sea | 陽子の海(2021.06.03)
コメント
「枕草子」などは極端に形容詞が多いような印象がありましたが、こうしてみるとそうでもないのですね。
古典的名文のスタイルを直感的な印象ではなく数値に置き換えて分析するとは大変興味深い試みと思います。
黄金律のごとき美のイデアが千年の時代を超えて日本文学の底流に一貫して流れている、と言うのが大野晋の言わんとするところなのでしょうか。
近世以降、たとえば近代文学の名文とされるもの(鴎外や三島など)で試みてみたらどんな結果が得られるのか・・・とも思いましたが、数える気力がないので思うだけにしておきますw
投稿: 拾伍谷 | 2013.04.03 20:24
古典というのは,選りすぐられて生き残った作品群です。日本人の感性に適した作品のみ生き残るとすれば,それらの間にはある一定の品詞の構成比が保たれている筈…ということかもしれません。
投稿: fukunan | 2013.04.04 00:11