研究めも

今月の作業 : 質問応答システムの作り直し


研究室で外部に公開するための質問応答システムを2年前に作ったわけです。
で、その時に作ったものだと長時間動かしてるとバグがあったりとか、去年改修した際にバグがちょっと出始めたのでこの機会に作り直したわけです。
ちなみにこのシステムPerlで作ってる。


処理の流れとしては以下みたいな感じ。


QADBを読み込んでハッシュに投げる

QADBの形態素解析mecab

Juliusへの接続待機状態へ移行
↓ (ここからループ処理)
音声入力の取り込み

音声入力を形態素解析

QADBの質問例と入力の類似度算出
 (2年前と去年の研究のメインここ)

システムの応答を選択

音声合成用のサーバへ接続

テキストを元に音声合成

音声出力

Julius音声入力待機状態へ
↓ (ループ最初に)
終了


こんな感じ。
今はLinux上で動かしてるのでそのうちWinやAndroidに移植できたらなーみたいな。

基本的に全部メモリ上で動作させて、ファイルに出力したりっていうのは音声合成の際にどうしてもwavファイルを出力しないといけないので、それだけ。基本的にメモリ上で動作するようにしたので、以前よりは応答速度が上がってる。満足。
(その分データベースが増えればメモリ食いまくるけど、現状そこまで問題ない作り)

以上研究めもでした。
たまにはこういう日記も。