音声学はすごい

情報生成システムという講義、どんな内容かというと人工音声合成についての講義です。いまやっているのは合成の前提になる音声の性質について。
人間が発声するときはどんな音波を出しているのか、それをどう聴き取っているのかと言うこと。音声学と聴覚心理学ってやつですね。
これがすごい参考になります。・・・歌の。
まずピッチ(音程)とは何か、子音と母音とは何か、これって一般の歌い手は直感的に理解しているだけでしょう。これが意外に、思っていることと違うのです。

音程って何?

そりゃ、音の周波数のことだろうと思った人。違うんです。少なくとも、人間は音の周波数で音程を判断していません。ラの音は440Hzというけど、ラの音の波形から440Hzの成分だけを消去しても、それはやっぱり同じ高さのラの音に聞こえるのです(音色は少しだけ違って聞こえる)。
じゃあ何を聞いているのか? 倍音の間隔を感じているのです。ラの音だったら、倍音のピークは880,1320,1760,・・・と440の倍数で続いているけど、このピークの間隔の440という数字を感じているんです。
面白いですね。これ自体はあんまり発声技術の参考にはならないけど、母音と子音を理解するのに必要な知識。

母音と子音って何?

簡単に言うと、音程のない、つまり倍音のピークが並んでいない音が子音。音程があるのが母音。なんHzくらいの倍音ピークが特に大きいかによってaiueoなどそれぞれの母音に分類されます。
だけど、しゃべり声から子音を発した瞬間だけを切り出して再生しても(たとえば『サ』のsの部分)、特定の子音(s)には聞こえないんです。逆に、子音が終わった直後、母音の出だしの部分だけを切り出して再生すると・・・子音と母音(サ)が聞こえる。
人間は子音そのものよりも、子音によって変化した母音を聞き取っているんです。
なんで子音によって母音が変化するか。aiueoなど母音の違いは舌の位置の違いによって口腔の共鳴特性が変化してできるんだけど、子音もそれぞれ舌の位置があります。実際に続けて発声するときには、子音を発したときの舌の位置から母音固有の位置まで、舌が動きますよね。このときに、母音が連続的に変化しているんです。これを人間の耳はとらえて子音がついたと感じる。
すると、「子音を立て」たいときには、「k!」とか「t!」とかみたいに無理矢理子音部分を発声しようとする必要はないことがわかります。子音に特徴的な口の形をしっかり作ることで、そこからの母音の変化を十分に作り出せば、子音が良く聞こえるってわけです。
実はこの事実は、ひらがなとカタカナの合理性も示しています。ローマ字でka,sa,ta,naと書いたときのそれぞれのaは実は別の音なわけであって、カ、サ、タ、ナと別々の文字で表すカナは音声学的に正しいわけなんです。