読者です 読者をやめる 読者になる 読者になる

memo

LDAの実装リンク

適宜更新。 Supervised latent Dirichlet allocation for classification GibbsLDA++: A C/C++ Implementation of Latent Dirichlet Allocation (LDA) using Gibbs Sampling for Parameter Estimation and Inference Latent Dirichlet Allocation in C iir/l…

情報理論の復習

情報理論作者: 今井秀樹出版社/メーカー: 昭晃堂発売日: 1984/01メディア: 単行本購入: 1人 クリック: 16回この商品を含むブログ (4件) を見る第3章 情報源と通信路のモデルの 3.1, 3.2 の復習。 記憶のない情報源 各時点における情報源記号の発生確率が、…

人工知能学会2011で気になる発表メモ

jsai2011 Schedule からザーッと見て探してみた。 1J3-5 命題論理に基づく確率モデルのためのベイズ推定 https://kaigi.org/jsai/webprogram/2011/paper-372.html 規則性と不確実性が入り交る世界をモデル化するため,論理の記述力と確率モデルの モデリング…

2011-05-18の作業メモ

音声認識におけるトピックモデル周りを軽くサーベイ。まだどれも読んでないし、多分読んでもわからない。。 Topic tracking language model for speech recognition - gologo13の日記 TOPIC CACHE LANGUAGE MODEL FOR SPEECH RECOGNITION - gologo13の日記 L…

topic model

topic model 周辺の論文のメモ。 topic model topic detection topic tracking Topic-based language models using EM D. Gildea and T. Hofmann Proceedings of the 6th European Conference on Speech Communication and Technology (Eurospeech '99), Bud…

動的ダブル配列

動的にキーの追加ができるTrieを探していたが、動的ダブル配列でできるということでメモ。大雑把に他のデータ構造との性能比較すると、次のような感じ。 ハッシュ(C++で言う std::map, std::tr1::unordered_map)よりも検索が速い 静的ダブル配列よりもデータ…

IPC::Open2 'open2'

IPC::Open2 'open2' はPerl上であるコマンドに好きな入力を与えて、その出力を利用したいという時に使える。 標準の open では open(COMMAND, "command |"); open(COMMAND, "| command"); みたいに、どちらか片方しか扱えない。IPC::Open2 'open' の使い方 u…

コマンドライン上でapeファイルをmp3にエンコード

コマンドライン上でapeファイルをmp3にエンコードしたかったので調べた。Linuxユーザを想定しているけど、GUIでやりたい人は Linux Salad: SoundConverterでオーディオファイルを変換する を参考にすればできると思う。Windowsユーザはググれば何か見つかる…

vimtutor

vimtutor を最後までやってみて、新しく覚えたことをメモ。 U: 行全体の取り消し e: 空白も含めた単語の範囲。wよりも広い単位 r: カーソルにある文字を置換する cw: カーソル位置から単語の一部、もしくは全体を変更する c$: カーソル位置から行の最後まで…

Mercurial

最近気になってたMercurialについて調べてみた. Mercurialとは Mercurial SCM 分散ソースコード管理ツール.複数人で別々に開発するときにソースコードを管理するためのツール.とは言うものの,1人で開発するときでもかなり使える. 基本的な用語 まずソー…

SOX

音声波形を加工したい.そのために,soxコマンドというものがある.その使い方のメモ. 音声をステレオ(2ch)からモノラル(1ch)に変換 sox -c 2 stere.wav -c 1 monaural.wav 音声ファイルのサンプリング周波数を変換する この例だとサンプリング周波数が48kH…

音響モデル

音響特徴量を抽出したり,音響モデルを作ったりするのに使う. 適当ですいません,そのうち整理します.. HTK Speech Recognition Toolkit HTK 3.0 HOWTO (工事中) HTK : The Hidden Markov Model Toolkit [ja.nishimotz.com] 音声メディア研究室 HMM 作成 …

「平べったい説明しかできない」から始まる「言語技術」の話

Togetter - 「「平べったい説明しかできない」から始まる「言語技術」の話」 私も平べったい説明しかできない学生の1人だが,マジで何とかしたい.気になった発言をちょっとだけメモる.興味ある人は絶対↑のtogetterを読んだほうがいいです. 物事を構造化…

speech

IEEE Xplore Abstract - Automatic lecture transcription by exploiting presentation slide information for language model adap... 講義音声認識 講義全体のトピックを適応させたPLSAモデル*1(グローバルに適応) satomacoto: PythonでPLSAを実装してみ…

言語バインディング

mixi Engineers' Blog mixi Engineers' Blog

2010年に読んだ本

某集まりで昨年に読んだ本の数が話題になったので,私も調べてみた.以下,読書メーターからの出力.2010年の読書メーター読んだ本の数:22冊読んだページ数:9262ページ夏のレプリカ (講談社文庫)読了日:11月29日 著者:森 博嗣幻惑の死と使途 (講談社文庫…

tips

図 図の挿入 - [物理のかぎしっぽ] ちいさくなーれ☆ - Seeking for my unique color. タイトルを小さくする: \usepackage[small,compact]{titlesec}図のキャプションを小さくする: \usepackage[small]{caption}行間のサイズを小さくする: \baselineskip=0…

wat-array

この素晴らしいであろうライブラリをどのように自分のために活かせるのかはまだわからない. wat-array : wavelet木を利用した高速配列処理ライブラリ | Preferred Research 話題のwat-arrayを使ってBurrows-Wheeler変換(BWT)してみた wat-arrayでラクラク実…

混ぜ書き変換

ddskk で交ぜ書き変換をしたい - とりあえず暇だったし何となく始めたブログより 通常の仮名漢字変換では、変換元となる文字列は、「ひらがな」や「数字」のみです。 それに対して、交ぜ書き変換は、変換元となる文字列に「漢字」が含まれる事を許容します。…

分割誤り,読み推定誤りしそうな例

カリー化 リー環 関手(せきしゅ) 開核(かいかく) 圏論にはこういういい例がたくさんあって良いね.しかも例として用いると頭良さそうな感じだし.

誤変換例

ウェブにたくさんあった.おもしろいな.誤変換起こしやすいとされる文を集めたコーパスを手作業で作っても良いかもしれない. 話が変わるけど,何かの精度が上がったことを専門家ではなく一般人に主張したければ,具体的にうまくいった例を与えなければ納得…

プロジェクト管理ツールメモ

チケット管理システム チケット管理システムをつかってみよう!:An Agile Way:ITmedia オルタナティブ・ブログ Redmine.JP — Redmine日本語情報サイト http://1-byte.jp/2010/11/30/team_development/

learning to rank

使うかもしれないのでメモ.まだランキング学習が何のことなのかさっぱりわからない. Learning to rank - Wikipedia, the free encyclopedia Large Scale Learning to Rankを読んだ - 射撃しつつ前転 言語処理学会 NLP 2010 本会議初日: 係り受け解析の新展…

ls -1

ls -1 で1行1エントリでの表示を強制させる.標準出力でない場合は勝手にこのオプションがついていることになっていたらしい.よくできてる. On-line Manual of "ls"

google検索のパラメータ

q 検索したいことば ex) q=ほげ gl その指定した国から検索したことになる ex) gl=JP hl 使用言語 ex) hl=ja num 最大表示件数 ex) num=20 oe 検索結果の文字コード ex) oe=utf-8 まとめると http://www.google.co.jp/search?q=ほげ&gl=JP&hl=ja&num=20&oe=u…

メモ

日付の挿入 [vim] 日付の挿入

c++の連想配列

STLにstd::mapがあるけど遅いし出来る限りstd::tr1::unordered_mapを使いましょう 罠 ユーザ定義型をキーに持つとき,その型の比較operatorを定義する必要がある []でmapにアクセスすると,そのキーが勝手に追加される この仕様にクソはまった.errorとかwar…

分割コンパイル

ようやく理解した.要点は ヘッダファイルとソースファイルをきちんと分けましょう そうしないとコンパイル時に multiple definitions とか言われてコンパイルできない 関数はプロトタイプ宣言 変数は extern を付けて宣言 インクルードガードをしましょう r…

gdb

gdb の使い方 Debugging with GDB - Table of Contents tips タブで色々補間できる ref Linux のデバッグ手法をマスターする $BBh(B5$B2s!'(BGDB$B$G%G%P%C%0(B

Human auditory system

マスキング temporal masking ref Š´Šo‚̐¶—‚ƐS— ‘æ12‰ñ ’®ŠoS— 音声データのデータ圧縮 PCM パルス符号変調 - Wikipedia Log PCM DPCM ADPCM ref http://www.wide.ad.jp/project/document/reports/pdf1989/part12.pdf CELP CS-ACLP ref Mobile:CELP【…

Unicode 6.0

絵文字が使えるようになるんだとか. 「Unicode 6.0」が策定、絵文字が国際標準に - ケータイ Watch Unicode 6.0: Popular Symbols for Asia Unicode 6.0.0

WWW::Curl, LWPとJSONに関するドキュメント

man curl_easy_setopt perldoc WWW::Curl WWW::Curlで進捗表示しつつダウンロード : blog.nomadscafe.jp curlでメモリへの取り込み(perl編): Xo式 実験室(labo.xo-ox.net) LWP - PerlでのWWWアクセスのためのライブラリ http://d.hatena.ne.jp/tokuhirom/2…

コードを書くコツ

自分にあった方法 これから書くコードの処理の流れを絵に書いてみる コードを眺めてうーんどうしよっかなーとか考え込むよりも,全然いい 実装がめんどくさいと思ったり,ここちょっと書くの時間かかりそう…っていう箇所があったら,とりあえずその部分にそ…

韻律学というか音声全般

韻律学(metrics)について韻律と音声言語情報処理という本で勉強してる.まぁちょっと難しい.自分は音声に関してド素人もいいところ*1なので,もっと音声一般に関する初歩的な用語から勉強する必要性を感じている.なので今これの1章を読んでいる.韻律(pros…

IMEへのちょっとした不満

「すべてがFになる」という間にローマ字を挟む日本語をIMEで出したいときに,文字通りタイプするとmozcでは「すべてがFninaru」という感じになる.で,「すべてがFになる」という正しい出力を一発で出すためには 「すべてが」までタイプして,IMEをオフにし…

変な変換候補

mozcで何か変換して感じたらメモる. 入力:いっていた 変換候補の順序が変な気がした.「言っていた」が1番目か2番目ぐらいに来て欲しかった.なんでこうなるんだろう.「一定た」や「一定他」のスコアが「言っていた」のスコアよりも大きかったとしかわ…

ファイル入出力系

seekg std::ios::beg ファイルの先頭 std::ios::cur ファイルの今見ている位置 std::ios::end ファイルの最後 tellg 現在の位置を取得する ファイルの先頭では 0 を返す EOFでは -1 を返す リンク3より,EOFになったファイルディスクリプタを最初に巻戻して…

クラスタリング

K-means++ K-meansと違って,初期値選択を確率的に行う. 収束が高速になるという. k-means++: The Advantages of Careful Seeding - Stanford InfoLab Publication Server K-means++ - Wikipedia, the free encyclopedia http://noble-gas.blogspot.com/20…

10章

Prml 10 1 PRML10.6 変分ロジスティック回帰 PRML 読書会 #12 9章 EMアルゴリズム&10章 変分ベイズ - Mi manca qualche giovedi`? 近似推論法(10章) - きちめも PRML 10章の変分ベイズによる混合ガウス分布推論の検証(フォロー編) - Mi manca qualche…

メモ

最近c++に関して調べたことのメモ. デフォルト引数 defaultargment 関数の実体にデフォルト引数のデフォルト値を書いてはいけない.プロトタイプ宣言にだけ書く 今日の日記: なつたん クラス内クラスが定義できる(内部クラス) http://www.geocities.jp/ky…

gcc, make, ビルドツール, プロファイラ

最近c++でコードを書く事が多くなり,gcc,makeやその他のビルドツール,プロファイラについて浅く調べたのでメモ.かなり初歩的な内容. gcc gccの使い方 UNIXの部屋 コマンド検索:gcc (*BSD/Linux) 最低限知っておくべき Using and Porting the GNU Compil…

CW, AROWメモ

ノイズに強い学習器というAROWについて調べる.Koby Crammerさんらの仕事に目が離せない.機械学習,自然言語処理だけでなく音声系の論文も書いてるらしく,ICASSP, Interspeech にも通している. 読むフェーズ(2010-10-14 完了) 実装フェーズ(未完) CW 論文…