狸系の里 シーズン2

はじめの一歩、二歩、散歩・・

4-Vocaloidとテキスト読み上げの間に

自分向けの説明と他人向けの説明とは違う、ということを最近ようやく意識する。「情報民族音楽学」と言っているが、一言で言って何なのか?こういう問いかけは、記号としての「情報民族音楽学」が指すはずの内容について、先方がもっている内容(指示対象)で言うとどうなるかを聞いている。この問いかけに、自分のもっている内容を書き連ねた作業リストを示しても納得してはもらえない。言い過ぎとは思いつつも、「上代の歌詠み人を仮想的に再現する」位に言った方がイメージ的には伝わる。

もっともこう、ある対象を具体化することが目標である、と言ってしまうと、先行研究との差異をきちんと言わなければならない。先行研究にはVocaloid (歌う機械)とテキスト読み上げ(読む機械)とがある。これらと、音声の自動生成技術という範疇を共有しつつ、こんな差異があると考えている。

1) 主要な結果はシステムではなく要件

歌を詠む機能をもつシステムが最終成果ではなく、歌を読むと言う機能に関する要件が成果となる。対してVocaloidは、システムが結果となる。

音楽に関する知見を得ることが目的であり、その知見が妥当であることを示すシステムは構成が明示された参照システムであるとする。

2) 特定の歌人の模擬でなく仮説の検証例としての読み上げ

上代日本語の音声は未だに仮説という位置づけなので、特定の歌人の模擬には音声生成機能に関する仮説の塊以上の意義を認めにくい。何を仮説として、どう検証したかが判る構成とする。*1対してVocaloidでは、特定の歌手らしさを強調したシステムを目標としているように見える。

3) 歌と語りの中間的な表現が可能

上代歌謡では、メロディをつけて発声し、音の長さが自由に伸縮し、繰り返し的な拍節構造をもたない。これは歌と語りとの双方の特徴をもつ。この特徴の捉え方によって歌と語りとのどちらかに近づくことになる。まずここから明確にする必要がある。

 

今年はここまで。

*1:仮説を差し替えられることが必要になる。