Featured Posts

ライセンスについて OpenHRIのライセンスは、Eclipse Public License (EPL)です。 http://www.eclipse.org/legal/epl-v10.html EPLは、コードの改変や再配布、営利利用を許可するオープンソースライセンスですが、場合によっては改変内容をライセンス元に開示する必要があります。 OpenHRIが内部で用いているJuliusやOpen...

Readmore

OpenHRIとは OpenHRIは、音声認識・音声合成・対話制御など、ロボットのコミュニケーション機能の実現に必要な各要素を実現するコンポーネント群です。 フリーで利用できる各オープンソースソフトウェアを使い易いコンポーネントとしてまとめました。

Readmore

ソフトウェアのインストール方法 ソフトウェアのインストールおよび利用方法については、チュートリアルの各ページを参考にしてください。http://openhri.net/tutorial

Readmore

公開しました OpenHRIのソフトウェアおよびWebページの公開を開始しました。

Readmore

  • Prev
  • Next

PortAudioInput

 

1.概説

音声入力デバイスからPortAudioライブラリを使用して音声データを取得します。
PortAudioは移植性の高い音声入出力ライブラリです。 Windows / Mac / Linixで互換性があるコードを書くことができます。

ubuntu9.10以降では、システムの音声入出力にPulseAudioが用いられるようになりました。PortAudioはPulseAudioとの互換性に問題があるため、PulseAudioを用いたコンポーネントを使用してください。

2.動作環境

当RTCの動作に必要な環境を表2-1に記します。

表2-1 動作環境詳細表

区分 要求環境 参考
動作OS Linux

Ubuntuバージョン9.04以上を推奨

Ubuntu Linux バージョン8.04以前での動作未確認
Windows

XP sp3以上を推奨

Windows2000以前での動作未確認

(Kinectを使用する場合、SDKの仕様により

Windows7以上が必要)

OpenRTM

OpenRTM-aist-1.0.0-RELEASE(C++)

OpenRTMの動作に必要なパッケージを含む
ライブラリ libportaudio2 v19以上 v18以下では動作しません。

開発用にはdevelopment files(portaudio19-dev)が必要です。


3.コンポーネントのインストール方法

PortAudioInputコンポーネントはopenhriaudioパッケージに含まれます。コマンドラインで以下のコマンドを入力してください。

% sudo apt-get install openhriaudio

上記コマンドを入力する前にapt-sourceの設定が必要で す。以下のコマンドでリポジトリ登録が可能です。既に登録済みであれば必要ありま せん。

% sudo apt-add-repository ppa:openhri/ppa

パッケージマネージャからのインストールはチュートリアルの「step1 インストール」を 参照してください。

4.コンポーネントの起動方法

コンフィグレーションファイル(ファイル名:rtc.conf)を用意し、カレントディレクトリを同ファイルのあるフォルダへ移動してOpenHRIAuidoManagerを起動します。

OpenHRIAuidoManagerの実行コマンド

% openhriaudiomanager -d

(OpenHRIAuidoManagerのショートカットを作成して、リンク先に-dオプションを追加することで直接起動できます。)

メニューからPortAudioInputを選択してください。

5.入出力ポート情報

各入出力ポートのイメージを図5−1に示します。

図 5-1 入出力ポートイメージ図

5.1.データポート

データポートの詳細を表5.1-1に記します。

表5.1-1 データポート詳細一覧表

入出力 ポート名 データ型 説明
入力 GainDataIn TimedLong オートゲインコントロール用のゲインデータ入力
出力 AudioDataOut TimedOctetSeq 録音した音声データ出力

TimedOctetSeq:バイトデータの配列

6.コンフィグレーションパラメータ情報

各コンフィグレーションパラメータの詳細を表6-1に記します。

表6-1 コンフィグレーションパラメータ詳細一覧表

名前 データ型 デフォルト値 設定範囲 反映タイミング 説明
InputSampleRate int 16000 0以上 アクティブ時 録音音声のサンプリング周波数を設定します。
InputSampleByte string 16bit 8bit,16bit,

24bit,

32bit

アクティブ時 録音音声のフォーマット(ビット深度)を設定します。
InputChannelNumbers int 1 1以上 アクティブ時 録音音声のチャンネル数を設定します。1の場合モノラル、2の場合ステレオになります。

(注)OpenRTM-1.0.0では、コンフィグレーションパラメータは常時変更可能だが、コンフィグレーションパラメータの変更が反映されるのは、上表内に記述のタイミング時のみである。