Featured Posts

ライセンスについて OpenHRIのライセンスは、Eclipse Public License (EPL)です。 http://www.eclipse.org/legal/epl-v10.html EPLは、コードの改変や再配布、営利利用を許可するオープンソースライセンスですが、場合によっては改変内容をライセンス元に開示する必要があります。 OpenHRIが内部で用いているJuliusやOpen...

Readmore

OpenHRIとは OpenHRIは、音声認識・音声合成・対話制御など、ロボットのコミュニケーション機能の実現に必要な各要素を実現するコンポーネント群です。 フリーで利用できる各オープンソースソフトウェアを使い易いコンポーネントとしてまとめました。

Readmore

ソフトウェアのインストール方法 ソフトウェアのインストールおよび利用方法については、チュートリアルの各ページを参考にしてください。http://openhri.net/tutorial

Readmore

公開しました OpenHRIのソフトウェアおよびWebページの公開を開始しました。

Readmore

  • Prev
  • Next

NoiseReduction

 

1.概説

音声信号から指定した周波数の周辺帯域を強調するコンポーネントです。

中心周波数と強調倍率はコンフィグレーションパラメータにより指定できます。

2.動作環境

当RTCの動作に必要な環境を表2-1に記します。

表2-1 動作環境詳細表

区分 要求環境 参考
動作OS Linux

Ubuntuバージョン10.04以上を推奨

Ubuntu Linux バージョン8.04以前での動作未確認
Windows

XP sp3以上を推奨

Windows2000以前での動作未確認

(Kinectを使用する場合、SDKの仕様により

Windows7以上が必要)

OpenRTM

OpenRTM-aist-1.0.0-RELEASE(C++)

OpenRTMの動作に必要なパッケージを含む
ライブラリ fftw3.2.2以上 fftw3.1.2以下の動作未確認

3.コンポーネントのインストール方法

NoiseReductionコンポーネントはopenhriaudioパッケージに含まれます。コマンドラインで以下のコマンドを入力してくださ い。

% sudo apt-get install openhriaudio

上記コマンドを入力する前にapt-sourceの設定が必要で す。以下のコマンドでリポジトリ登録が可能です。既に登録済みであれば必要ありま せん。

% sudo apt-add-repository ppa:openhri/ppa

パッケージマネージャからのインストールはチュートリアルの「step1 インストール」を 参照してください。

4.コンポーネントの起動方法

コンフィグレーションファイル(ファイル名:rtc.conf)を用意し、カレントディレクトリを同ファイルのあるフォルダへ移動してOpenHRIAuidoManagerを起動します。

OpenHRIAuidoManagerの実行コマンド

% openhriaudiomanager -d

(OpenHRIAuidoManagerのショートカットを作成して、リンク先に-dオプションを追加することで直接起動できます。)

メニューからNoiseReductionを選択してください。

5.入出力ポート情報

各入出力ポートのイメージを図5−1に示します。

図 5-1 入出力ポートイメージ図

5.1.データポート

データポートの詳細を表5.1-1に記します。

表5.1-1 データポート詳細一覧表

入出力 ポート名 データ型 説明
入力 AudioDataIn TimedOctetSeq 入力音声データ
出力 AudioDataOut TimedOctetSeq ノイズ除去した音声データ

6.コンフィグレーションパラメータ情報

各コンフィグレーションパラメータの詳細を表6-1に記します。

表6-1 コンフィグレーションパラメータ詳細一覧表

名前 データ型 デフォルト値 設定範囲 反映タイミング 説明
SampleRate int 16000 1以上 onExecute毎 サンプリング周波数を設定します。
ModeSelect string premp premp,

deemp,

bpf

onExecute毎 コンポーネントの動作を設定します。

premp:プリエンファシス

deemp:ディエンファシス

bpf:バンドパスフィルタ

CenterFrequency int 500 1以上 onExecute毎 強調する中心の周波数を設定します。上記ModeSelectでpremp、deempを選択したときに使用します。
FrequencyMax,

FrequencyMin

int 700、300 1以上 onExecute毎 強調する周波数の最大値と最小値を設定します。上記ModeSelectでbpfを選択したときに使用します。
Power int 1 1以上 onExecute毎 強調倍率を設定します。

動作モード

premp:プリエンファシス

指定した中心周波数(コンフィグレーションパラメータCenterFrequency)を頂点とした重み関数をかけて強調します。

deemp:ディエンファシス

プリエンファシスの逆関数をかけ、プリエンファシスで強調した信号を元に戻します。

bpf:バンドパスフィルタ

指定した区間の周波数(コンフィグレーションパラメータFrequencyMax,FrequencyMin)成分を強調し、それ以外を減衰します。

参考

声の周波数 男性:300~550Hz、女性:400~700Hz