memo

LDAの実装リンク

適宜更新。 Supervised latent Dirichlet allocation for classification GibbsLDA++: A C/C++ Implementation of Latent Dirichlet Allocation (LDA) using Gibbs Sampling for Parameter Estimation and Inference Latent Dirichlet Allocation in C iir/l…

情報理論の復習

情報理論作者: 今井秀樹出版社/メーカー: 昭晃堂発売日: 1984/01メディア: 単行本購入: 1人 クリック: 16回この商品を含むブログ (4件) を見る第3章 情報源と通信路のモデルの 3.1, 3.2 の復習。 記憶のない情報源 各時点における情報源記号の発生確率が、…

人工知能学会2011で気になる発表メモ

jsai2011 Schedule からザーッと見て探してみた。 1J3-5 命題論理に基づく確率モデルのためのベイズ推定 https://kaigi.org/jsai/webprogram/2011/paper-372.html 規則性と不確実性が入り交る世界をモデル化するため,論理の記述力と確率モデルの モデリング…

2011-05-18の作業メモ

音声認識におけるトピックモデル周りを軽くサーベイ。まだどれも読んでないし、多分読んでもわからない。。 Topic tracking language model for speech recognition - gologo13の日記 TOPIC CACHE LANGUAGE MODEL FOR SPEECH RECOGNITION - gologo13の日記 L…

topic model

topic model 周辺の論文のメモ。 topic model topic detection topic tracking Topic-based language models using EM D. Gildea and T. Hofmann Proceedings of the 6th European Conference on Speech Communication and Technology (Eurospeech '99), Bud…

動的ダブル配列

動的にキーの追加ができるTrieを探していたが、動的ダブル配列でできるということでメモ。大雑把に他のデータ構造との性能比較すると、次のような感じ。 ハッシュ(C++で言う std::map, std::tr1::unordered_map)よりも検索が速い 静的ダブル配列よりもデータ…

IPC::Open2 'open2'

IPC::Open2 'open2' はPerl上であるコマンドに好きな入力を与えて、その出力を利用したいという時に使える。 標準の open では open(COMMAND, "command |"); open(COMMAND, "| command"); みたいに、どちらか片方しか扱えない。IPC::Open2 'open' の使い方 u…

コマンドライン上でapeファイルをmp3にエンコード

コマンドライン上でapeファイルをmp3にエンコードしたかったので調べた。Linuxユーザを想定しているけど、GUIでやりたい人は Linux Salad: SoundConverterでオーディオファイルを変換する を参考にすればできると思う。Windowsユーザはググれば何か見つかる…

vimtutor

vimtutor を最後までやってみて、新しく覚えたことをメモ。 U: 行全体の取り消し e: 空白も含めた単語の範囲。wよりも広い単位 r: カーソルにある文字を置換する cw: カーソル位置から単語の一部、もしくは全体を変更する c$: カーソル位置から行の最後まで…

Mercurial

最近気になってたMercurialについて調べてみた. Mercurialとは Mercurial SCM 分散ソースコード管理ツール.複数人で別々に開発するときにソースコードを管理するためのツール.とは言うものの,1人で開発するときでもかなり使える. 基本的な用語 まずソー…

SOX

音声波形を加工したい.そのために,soxコマンドというものがある.その使い方のメモ. 音声をステレオ(2ch)からモノラル(1ch)に変換 sox -c 2 stere.wav -c 1 monaural.wav 音声ファイルのサンプリング周波数を変換する この例だとサンプリング周波数が48kH…

音響モデル

音響特徴量を抽出したり,音響モデルを作ったりするのに使う. 適当ですいません,そのうち整理します.. HTK Speech Recognition Toolkit HTK 3.0 HOWTO (工事中) HTK : The Hidden Markov Model Toolkit [ja.nishimotz.com] 音声メディア研究室 HMM 作成 …

「平べったい説明しかできない」から始まる「言語技術」の話

Togetter - 「「平べったい説明しかできない」から始まる「言語技術」の話」 私も平べったい説明しかできない学生の1人だが,マジで何とかしたい.気になった発言をちょっとだけメモる.興味ある人は絶対↑のtogetterを読んだほうがいいです. 物事を構造化…

speech

IEEE Xplore Abstract - Automatic lecture transcription by exploiting presentation slide information for language model adap... 講義音声認識 講義全体のトピックを適応させたPLSAモデル*1(グローバルに適応) satomacoto: PythonでPLSAを実装してみ…

言語バインディング

mixi Engineers' Blog mixi Engineers' Blog

2010年に読んだ本

某集まりで昨年に読んだ本の数が話題になったので,私も調べてみた.以下,読書メーターからの出力.2010年の読書メーター読んだ本の数:22冊読んだページ数:9262ページ夏のレプリカ (講談社文庫)読了日:11月29日 著者:森 博嗣幻惑の死と使途 (講談社文庫…

tips

図 図の挿入 - [物理のかぎしっぽ] ちいさくなーれ☆ - Seeking for my unique color. タイトルを小さくする: \usepackage[small,compact]{titlesec}図のキャプションを小さくする: \usepackage[small]{caption}行間のサイズを小さくする: \baselineskip=0…

wat-array

この素晴らしいであろうライブラリをどのように自分のために活かせるのかはまだわからない. wat-array : wavelet木を利用した高速配列処理ライブラリ | Preferred Research 話題のwat-arrayを使ってBurrows-Wheeler変換(BWT)してみた wat-arrayでラクラク実…

混ぜ書き変換

ddskk で交ぜ書き変換をしたい - とりあえず暇だったし何となく始めたブログより 通常の仮名漢字変換では、変換元となる文字列は、「ひらがな」や「数字」のみです。 それに対して、交ぜ書き変換は、変換元となる文字列に「漢字」が含まれる事を許容します。…

分割誤り,読み推定誤りしそうな例

カリー化 リー環 関手(せきしゅ) 開核(かいかく) 圏論にはこういういい例がたくさんあって良いね.しかも例として用いると頭良さそうな感じだし.

誤変換例

ウェブにたくさんあった.おもしろいな.誤変換起こしやすいとされる文を集めたコーパスを手作業で作っても良いかもしれない. 話が変わるけど,何かの精度が上がったことを専門家ではなく一般人に主張したければ,具体的にうまくいった例を与えなければ納得…

プロジェクト管理ツールメモ

チケット管理システム チケット管理システムをつかってみよう!:An Agile Way:ITmedia オルタナティブ・ブログ Redmine.JP — Redmine日本語情報サイト http://1-byte.jp/2010/11/30/team_development/

learning to rank

使うかもしれないのでメモ.まだランキング学習が何のことなのかさっぱりわからない. Learning to rank - Wikipedia, the free encyclopedia Large Scale Learning to Rankを読んだ - 射撃しつつ前転 言語処理学会 NLP 2010 本会議初日: 係り受け解析の新展…

ls -1

ls -1 で1行1エントリでの表示を強制させる.標準出力でない場合は勝手にこのオプションがついていることになっていたらしい.よくできてる. On-line Manual of "ls"

google検索のパラメータ

q 検索したいことば ex) q=ほげ gl その指定した国から検索したことになる ex) gl=JP hl 使用言語 ex) hl=ja num 最大表示件数 ex) num=20 oe 検索結果の文字コード ex) oe=utf-8 まとめると http://www.google.co.jp/search?q=ほげ&gl=JP&hl=ja&num=20&oe=u…

メモ

日付の挿入 [vim] 日付の挿入

c++の連想配列

STLにstd::mapがあるけど遅いし出来る限りstd::tr1::unordered_mapを使いましょう 罠 ユーザ定義型をキーに持つとき,その型の比較operatorを定義する必要がある []でmapにアクセスすると,そのキーが勝手に追加される この仕様にクソはまった.errorとかwar…

分割コンパイル

ようやく理解した.要点は ヘッダファイルとソースファイルをきちんと分けましょう そうしないとコンパイル時に multiple definitions とか言われてコンパイルできない 関数はプロトタイプ宣言 変数は extern を付けて宣言 インクルードガードをしましょう r…

gdb

gdb の使い方 Debugging with GDB - Table of Contents tips タブで色々補間できる ref Linux のデバッグ手法をマスターする $BBh(B5$B2s!'(BGDB$B$G%G%P%C%0(B

Human auditory system

マスキング temporal masking ref Š´Šo‚̐¶—‚ƐS— ‘æ12‰ñ ’®ŠoS— 音声データのデータ圧縮 PCM パルス符号変調 - Wikipedia Log PCM DPCM ADPCM ref http://www.wide.ad.jp/project/document/reports/pdf1989/part12.pdf CELP CS-ACLP ref Mobile:CELP【…