nomurahideto's blog

http://researchmap.jp/nomurahideto/

SATデータベースをみっくみくにしてやんよプロジェクト案

引き続き、次世代のSATデータベースを妄想してみます。CHISEとのコラボにとどまらず、ボーカロイドともコラボしちゃいました。というのはいかが。そわかちゃんならぬSATちゃんをマスコットキャラとして任命するのは当然ですw

さて、まじめなプロジェクト名は「人文学データベースのユニバーサルデザインを目指して−仏典の自動読み上げ情報データベースの構築−」とかそういったのではどうでしょうか。人文学の社会還元として、SATのデータベースを、音声による検索、結果の読み上げができるようにするという、非常に政治的に正しい試みです。
もちろん大蔵経のテキストすべてを誰かに朗読させて、というんではおもしろくありません。通常のページ上に「みっくみく」ボタンが設置され、それを選択することで自動的にテキストが読み上げられる、というのが基本的な実装で、できれば検索も音声入力で可能にする。そのために、CHISEのサブセットとして、仏典の音声読み上げ情報を文字素性として積み上げていくというものです。ポイントは声明のデータベース化(伝統芸能を記録するってやつですね)のようなプロジェクトを立ち上げ、たんなる読みの音でなく、読経特有の音程やリズムなども素性として登録し、これまで読経されたことがないようなテキストですら、自動的にそれっぽく読み上げてくれるようにする、というものです。電子読経ですよ、功徳テラバイト級!