OpenHRIVoiceパッケージ

コンポーネント

JuliusRTC

Juliusを用いた日本語・英語音声認識コンポーネント

Vendor:AIST
Version:1.05
Category:communication

Ports

Ports
Name Type DataType Description
data DataInPort TimedOctetSeq 認識する音声データ(パケット形式)
activegrammar DataInPort TimedString 有効化する文法ID
status DataOutPort TimedString 音声認識器の状態 (‘LISTEN [音声入力受付中]’, ‘STARTREC [音声認識処理開始]’, ‘ENDREC [音声認識処理終了]’, ‘REJECTED [入力棄却]’)
result DataOutPort TimedString 音声認識結果(XML形式)
log DataOutPort TimedOctetSeq 音声データのログ

digraph comp {
rankdir=LR;
JuliusRTC [shape=Mrecord, label="JuliusRTC"];
data [shape=plaintext, label="data"];
data -> JuliusRTC;
activegrammar [shape=plaintext, label="activegrammar"];
activegrammar -> JuliusRTC;
status [shape=plaintext, label="status"];
JuliusRTC -> status;
result [shape=plaintext, label="result"];
JuliusRTC -> result;
log [shape=plaintext, label="log"];
JuliusRTC -> log;
}

Configuration parameters

Configuration parameters
Name Description
phonemodel  
voiceactivitydetection  
language  

FestivalRTC

英語音声合成コンポーネント

Vendor:AIST
Version:1.05
Category:communication

Ports

Ports
Name Type DataType Description
text DataInPort TimedString 合成されるテキストデータ
result DataOutPort TimedOctetSeq 合成された音声データ
status DataOutPort TimedString 音声合成の状態 (‘started’か’finished’)
duration DataOutPort TimedString 各音韻の時間情報(リップシンクに使用)

digraph comp {
rankdir=LR;
FestivalRTC [shape=Mrecord, label="FestivalRTC"];
text [shape=plaintext, label="text"];
text -> FestivalRTC;
result [shape=plaintext, label="result"];
FestivalRTC -> result;
status [shape=plaintext, label="status"];
FestivalRTC -> status;
duration [shape=plaintext, label="duration"];
FestivalRTC -> duration;
}

Configuration parameters

Configuration parameters
Name Description
rate 出力される音声の周波数(16kHzに固定)
character 音声のキャラクタ(男性に固定)
format 出力される音声のフォーマット(16bitに固定)

OpenJTalkRTC

日本語音声合成コンポーネント

Vendor:AIST
Version:1.05
Category:communication

Ports

Ports
Name Type DataType Description
text DataInPort TimedString 合成されるテキストデータ
result DataOutPort TimedOctetSeq 合成された音声データ
status DataOutPort TimedString 音声合成の状態 (‘started’か’finished’)
duration DataOutPort TimedString 各音韻の時間情報(リップシンクに使用)

digraph comp {
rankdir=LR;
OpenJTalkRTC [shape=Mrecord, label="OpenJTalkRTC"];
text [shape=plaintext, label="text"];
text -> OpenJTalkRTC;
result [shape=plaintext, label="result"];
OpenJTalkRTC -> result;
status [shape=plaintext, label="status"];
OpenJTalkRTC -> status;
duration [shape=plaintext, label="duration"];
OpenJTalkRTC -> duration;
}

Configuration parameters

Configuration parameters
Name Description
rate 出力される音声の周波数(16kHzに固定)
character 音声のキャラクタ(男性に固定)
format 出力される音声のフォーマット(16bitに固定)

XSLTRTC

XSLTを用いたXML変換コンポーネント

Vendor:AIST
Version:1.05
Category:communication

Ports

Ports
Name Type DataType Description
text DataInPort TimedString XML形式のテキストデータ
result DataOutPort TimedString XML形式のテキストデータ(変換後)

digraph comp {
rankdir=LR;
XSLTRTC [shape=Mrecord, label="XSLTRTC"];
text [shape=plaintext, label="text"];
text -> XSLTRTC;
result [shape=plaintext, label="result"];
XSLTRTC -> result;
}

ユーティリティスクリプト

validatesrgs

Usage: validatesrgs [grammarfile]

SRGS文法ファイルの文法間違いをチェックする

Options:
--version プログラムのバージョンを表示して終了する
-h, --help このヘルプ画面を表示して終了する
-v, --verbose デバッグ情報を出力する
-g, --gui ファイルを開くダイアログをGUIで表示する

Examples:

  • SRGS文法ファイルの文法間違いをチェックする

    $ validatesrgs sample.grxml

srgstopls

Usage: srgstopls [grammarfile]

W3C-SRGS形式の文法からW3C-PLS形式の発音辞書を生成する

Options:
--version プログラムのバージョンを表示して終了する
-h, --help このヘルプ画面を表示して終了する
-v, --verbose デバッグ情報を出力する
-r TARGETRULE, --target-rule=TARGETRULE
 対象とするルールのIDを指定する
-g, --gui ファイルを開くダイアログをGUIで表示する

Examples:

  • W3C-SRGS形式の文法からW3C-PLS形式の発音辞書を生成する

    $ srgstopls sample.grxml > sample-lex.xml

plstosinglewordgrammar

Usage: plstosinglewordgrammar [lexiconfile]

W3C-PLS形式の発音辞書からW3C-SRGS形式の文法を生成する

Options:
--version プログラムのバージョンを表示して終了する
-h, --help このヘルプ画面を表示して終了する
-v, --verbose デバッグ情報を出力する

Examples:

  • PLS形式の発話辞書からSRGS形式の文法を生成する

    $ plstosinglewordgrammar sample-lex.xml > sample.grxml

srgstojulius

Usage: srgstojulius [grammarfile]

W3C-SRGS形式の文法からJulius形式の文法を生成する

Options:
--version プログラムのバージョンを表示して終了する
-h, --help このヘルプ画面を表示して終了する
-v, --verbose デバッグ情報を出力する
-r TARGETRULE, --target-rule=TARGETRULE
 対象とするルールのIDを指定する

Examples:

  • W3C-SRGS形式の文法からJulius形式の文法を生成する

    $ srgstojulius sample.grxml > sample.julius

juliustographviz

Usage: juliustographviz < [julius grammar]

Julius形式の文法をグラフにする

Options:
--version プログラムのバージョンを表示して終了する
-h, --help このヘルプ画面を表示して終了する
-v, --verbose デバッグ情報を出力する

Examples:

  • SRGS形式の文法をグラフにする

    $ srgstojulius sample.grxml | juliustographviz | dot -Txlib

bundlexinclude

Usage: bundlexinclude [grammarfile]

xincludeタグで指定された複数のXMLをまとめて一つにする

Options:
--version プログラムのバージョンを表示して終了する
-h, --help このヘルプ画面を表示して終了する
-v, --verbose デバッグ情報を出力する