思索の遊び場 > 高杉親知の日本語内省記 > 倍速言語

倍速言語


IPA 非対応版

人間の話す文はいくつかの語からなり、語はいくつかの音素からなる。この二段階の構造を二重分節といい、人間の言語の重要な特徴である。動物の声で二重分節を持つものは一つもない。しかし人間は音素をそのまま聞くのではないことが分かっている。脳が処理する音の単位は音節だ。

音節とは、中心に聞こえ度の高い音素がある、ひとまとまりの音素である。音節の中心の音素を核という。一般には母音が核になるが、言語によってはそれ以外の聞こえ度の高い音素が核になることもある。母音の中でも、広母音ひろぼいんのほうが狭母音せまぼいんより聞こえ度が高い。

日本語では音節は拍(モーラ)とほぼ同じだが、例外的に「ン」と促音と長音は音節にならない。「オンセツ(音節)」という語の音素 /onsecu/ の聞こえ度を棒グラフにしてみよう。

聞こえ度音素の種類音素
/o//n//s//e//c//u/






広母音
中母音
狭母音・半母音
弾き音
側音
鼻音
有声摩擦音
無声摩擦音
有声破裂音
無声破裂音

/o/, /e/, /u/ の 3 個の聞こえ度の山があるのが分かる。つまり音節が 3 個ある。聞こえ度の谷は音節の境界だが、前後どちらの音節に属すかはその言語の規則で決まる。この場合は /on/, /se/, /cu/ に分かれる。「オンセツ」は 4 拍だが、「ン」は直前の拍とつながって一つの音節になるので全部で 3 音節だ。

次に英語の "syllable" という語の聞こえ度を見てみよう。

聞こえ度音素の種類音素
/s//ɪ//l//ə//b//l/






広母音
中母音
狭母音・半母音
弾き音
側音
鼻音
有声摩擦音
無声摩擦音
有声破裂音
無声破裂音

/sɪl/, /ə/, /bl/ の 3 音節に分かれる。最後の音節は母音ではなく /l/ が核になっている。なお、母音のつながりには限度があるため、聞こえ度の山が 1 個に見えても複数の音節に分かれることがある。"seeing" という語の聞こえ度を以下に示す。

聞こえ度音素の種類音素
/s//i//ɪ//ŋ/






広母音
中母音
狭母音・半母音
弾き音
側音
鼻音
有声摩擦音
無声摩擦音
有声破裂音
無声破裂音

英語では /i//ɪ/ は一つにならないため、"seeing" は /si//ɪŋ/ の 2 音節からなる。



人間が音素ではなく音節を処理単位としていることは実験で明らかにされている。人間の長期記憶は無制限だが、短期記憶には限界があり、一度に 6 ~ 8 個の情報しか記憶できない。この限界を魔法の数 7 という。それ以上記憶するには、反復学習して長期記憶に移すしかない。電話の市内番号は最大 8 桁なので短期記憶で対応できるが、それに数桁の見慣れない市外番号が加わると短期記憶の限界を超えるため、メモを見ないで電話するのは難しい。

魔法の数は記憶の種類によって分かれている。人間が言葉を聞くとき、音を処理する部分と意味を処理する部分が同時に働く。それに応じて、音のための短期記憶と意味のための短期記憶がある。そして人間は 7 個の音素ではなく 7 個の音節まで短期記憶できることが分かっている。つまり音の処理単位は音素ではなく音節なのだ。

短期記憶できる音節の数が一定なので、短期記憶できる音の情報量は音節の種類で決まることになる。音節の種類が多ければ最大 7 個の音節が持つ情報量も多くなり、音節の種類が少なければ情報量も少なくなる。音節の種類を増やすには二つの方法がある。一つは音素を増やすこと、もう一つは音節を複雑にすることだ。

音素が多いので有名なのはアフリカ南部のコイサン諸語だ。コイサン諸語には吸着音(クリック音)という不思議な発音がある。「チェッ」という舌打ちの音、「チュッ」というキスの真似の音、あるいは「ラッ」という感じで舌を吸い付けてから離して出す音、これらが吸着音で、普通の子音として言葉の中に表れるのだ。子音なので当然、母音と続けて発音される。日本人は吸着音を単独で出すのはできるが、これを母音とつなげて発音するのは訓練しないとできない。吸着音はコイサン諸語と、それから取り入れた周辺のバンツー諸語にあるだけで、世界の他の地域には見当たらない。

コイサン諸語がどれだけ音素が多いかを、グイ語 (Gwi) を例に見てみよう。グイ語には 52 個の吸着音、38 個の吸着音でない子音、10 個の母音、6 個の声調があり、合計すると 106 個の音素がある。一番簡単な、子音 + 母音という音節だけを考えてみても、90 個の子音× 10 個の母音× 6 個の声調 = 5400 個の音節がある。日本語は二十数個の音素があり、これから百数十個の音節が作られるだけである。7 個の音節で生まれる情報の種類は、グイ語が少なくとも 1026 であるのに対し、日本語は 1015 程度に過ぎない。

最近の研究によると、コイサン諸語が人間の最初の言語に最も近いらしい。つまり我々の先祖は皆、吸着音を使っていたのだ。その後、音素を徐々に失っていったと考えられる。おおざっぱに言って、音素の数はアフリカを出て東に行くほど少なくなる。日本語には二十数個しかないし、太平洋地域やアメリカ先住民の間にはもっと音素が少ない言語がある。一番音素が少ないのはニューギニアの近くのブーゲンビル島で話されるロトカス語 (Rotokas) とアマゾン川上流で話されるピラハー語 (Pirahã) で、どちらも音素が 11 個しかない。大人になってから新しい音素を学ぶのは難しいが、すでにある音素を捨てるのは誰でもできる。アフリカから離れるにつれて発音が簡単になるのは、人類の歩いた道を示しているのだ。

今度は音節を複雑にすることを考えてみよう。音節の核の周りに子音を数多くつなげれば、音節が複雑になり種類が増える。子音連続が多いことで有名なのはコーカサス諸語だが、その近くのヨーロッパの言語もなかなか多い。例として、よく知っている英語を取り上げる。英語で一番複雑な音節は strengths と twelfths だろう。どちらも 1 音節で、音素はそれぞれ /strɛŋθs//twɛlfθs/ である。前者は 3 子音 + 1 母音 + 3 子音、後者は 2 子音 + 1 母音 + 4 子音である。理論的には 3 子音 + 1 母音 + 4 子音の音節があっても良いが、見付からない。子音連続があると、音節の種類は飛躍的に増える。子音が n 種類あるなら、子音 2 個で n2 組を作れる。20 種類なら 400 組だ。子音 3 個なら n3 組を作れる。

日本語は音素が少なく、しかも音節構造が単純なので、他の言語と比べると 7 個の音節で生み出せる情報量が極端に少ない。これで問題は無いのだろうか。実は、日本語は全く別の方法で情報量を増やしているのである。



人間が連続して作業するにはリズムが必要である。人間は二種類の異なるリズムを持っていることが知られている。速いリズムは一拍 0.33 秒以下で、一拍一拍が独立しているのではなく、全体として認識される。機関銃の銃声は速いリズムだ。それを真似ることはできるが、一発一発を聞き分けることはできない。一方、遅いリズムは一拍 0.45 秒以上で、拍と拍の間の長さが認識される。手拍子は一般に遅いリズムで、一拍ごとに速い遅いを調整できる。速いリズムと遅いリズムの境界は人によって違うらしい。

音声は連続して処理されるので、当然リズムがある。音の処理単位は音節なので、音節を一定の速いリズムで発音するのが普通だ。例えばスペイン語では izquierda という語の音節は /is/, /kjer/, /da/ なので、速いリズムの 3 拍で発音される。一方、音節構造が複雑だと全ての音節を同じ長さでは発音できない。英語で一番簡単な a と、一番複雑な strengths や twelfths はどうしても発音する長さが違う。そこで英語は音節ではなくもっと間隔の広い強勢を、遅いリズムに乗せて発音する。例えば I want to go to America with my friends という文なら、遅く発音すると I want to go to America with my friends という感じで 2 音節に 1 個くらい強勢があり、これを遅いリズムに乗せるが、速く発音すると I wanna go to America wit' my friends というように、遅いリズムを変えないで強勢の数を減らして合わせる。弱い音節は曖昧あいまいに発音するので、慣れないと聞き取りづらい。

スペイン語のように音節を速いリズムで送る言語では、リズムを速くするほど、時間当たりの情報量は増える。そのため、どうやってリズムを速くするかが重要になる。吸着音のように難しい子音は、発音に時間がかかる。音素の数が少ないと一般に難しい発音が無くなるので、リズムは速くなる。

また、音節構造が複雑になるほど発音する時間は長くなるので、音節を全て同じ長さで発音するなら、一番複雑な音節がリズムを律速する。先ほどのスペイン語の例では /is/, /kjer/, /da/ の 3 音節の中で /kjer/ が一番複雑なので、全体の長さはそれの 3 倍ほどになる。母音だけの言語は無いので、言語の中で 1 子音 + 1 母音が最も複雑な音節であればリズムは極限まで速くなる。しかしそれより複雑な音節構造があったら高速化はできないのだろうか。

それができるのだ。/hon/ という音節を考えよう。母音 /o/ の前後に子音があるので、1 子音 + 1 母音の音節より発音が長くなる。そこで /n/ を切り離し、/ho/ を 1 拍で発音し、/n/ は次の 1 拍で発音するようにする。1 拍で発音していたのが 2 拍になるので発音が長くなるが、その分 1 拍の長さが短くなればリズムが速くなる。音節の多くが単純な 1 子音 + 1 母音であれば、時々 2 倍の長さの音節が交じるにしても、全体としては短い時間で発音できる。

次に /sjo/ という音節を考える。母音の前に子音が 2 個あるので、普通なら子音 1 個より発音が長くなる。これを回避するには、/s//j/ を同時に発音すれば良い。つまり音素 /sj/[sj] ではなく [ɕ] という 1 個の子音として発音されれば、[s] と発音の長さが同じになる。

この高速化を行っているのが日本語なのだ。日本語では一般に子音と母音の間に入る音素は /j/ だけだが、この /j/ は前の子音を口蓋化こうがいかして自らは消えてしまう。/kj/[kʲ] に、/nj/[nʲ] に、/hj/[ç] になる。これにより、日本語の実際の発音は 1 子音 + 1 母音、または切り離された音節末の音素 /n/ (/ɴ/), /H/, /t/ (/Q/) だけになる。リズムは最高速になっている。

実際の音節の平均の長さ(日本語では拍の長さ)を比べてみると、英語は 0.244 秒、スペイン語は 0.201 秒、日本語は 0.145 秒である。日本語が一番速いことが分かる。しかしそれだけではない。拍の長さが 0.145 秒なら、2 拍でも 0.29 秒である。これは速いリズムの上限 0.33 秒より短い。つまり速いリズムの 1 拍分で日本語の 2 拍を送れるということだ。

日本語話者の短期記憶を調べると、驚くべきことに音節ではなく 2 拍語を 7 個まで保持できることが分かっている。つまり日本語話者は最大 14 音節まで短期記憶に詰め込めるのだ。これは日本語の 2 拍が速いリズム 1 拍にすっぽり収まるからに他ならない。たとえ音節の種類が少なくても、2 倍の音節を記憶できるなら不足はない。日本語話者は、リズムの速さを 2 倍にすることで、人間本来の限界と思えた 7 音節の壁を突破した。日本語は倍速言語なのだ。


参考文献:
目次に戻る

Copyright(C) 高杉親知 (tssf.airnet.ne.jp)