SOX

speech memo

音声波形を加工したい．そのために，soxコマンドというものがある．その使い方のメモ．音声をステレオ(2ch)からモノラル(1ch)に変換 sox -c 2 stere.wav -c 1 monaural.wav 音声ファイルのサンプリング周波数を変換するこの例だとサンプリング周波数が48kH…

2011-02-12

音響モデル

memo speech

音響特徴量を抽出したり，音響モデルを作ったりするのに使う．適当ですいません，そのうち整理します．． HTK Speech Recognition Toolkit HTK 3.0 HOWTO (工事中) HTK : The Hidden Markov Model Toolkit [ja.nishimotz.com] 音声メディア研究室 HMM 作成 …

2011-02-10

speech

memo speech paper research

IEEE Xplore Abstract - Automatic lecture transcription by exploiting presentation slide information for language model adap... 講義音声認識講義全体のトピックを適応させたPLSAモデル*1（グローバルに適応） satomacoto: PythonでPLSAを実装してみ…

2010-10-19

Human auditory system

memo speech

マスキング temporal masking ref ´oÌ¶ÆS æ12ñ ®oS 音声データのデータ圧縮 PCM パルス符号変調 - Wikipedia Log PCM DPCM ADPCM ref http://www.wide.ad.jp/project/document/reports/pdf1989/part12.pdf CELP CS-ACLP ref Mobile：CELP【…

2010-10-08

韻律学というか音声全般

memo speech

韻律学(metrics)について韻律と音声言語情報処理という本で勉強してる．まぁちょっと難しい．自分は音声に関してド素人もいいところ*1なので，もっと音声一般に関する初歩的な用語から勉強する必要性を感じている．なので今これの1章を読んでいる．韻律(pros…