読者です 読者をやめる 読者になる 読者になる

Node v0.10.33 (Stable)

Node v0.10.33 (Stable) 最近世間を騒がせているPOODLE攻撃ですが、node.jsがこの脆弱性に対応されたようです。 SSLv2とSSLv3によるセキュアプロトコルがデフォルトで無効になりました。 もし SSLv2, SSLv3 をサポートさせたい場合、node 起動時に --enable-…

始めました

node.js周りのこと書いていければと考えている。

LDAの実装リンク

適宜更新。 Supervised latent Dirichlet allocation for classification GibbsLDA++: A C/C++ Implementation of Latent Dirichlet Allocation (LDA) using Gibbs Sampling for Parameter Estimation and Inference Latent Dirichlet Allocation in C iir/l…

情報理論の復習

情報理論作者: 今井秀樹出版社/メーカー: 昭晃堂発売日: 1984/01メディア: 単行本購入: 1人 クリック: 16回この商品を含むブログ (4件) を見る第3章 情報源と通信路のモデルの 3.1, 3.2 の復習。 記憶のない情報源 各時点における情報源記号の発生確率が、…

人工知能学会2011で気になる発表メモ

jsai2011 Schedule からザーッと見て探してみた。 1J3-5 命題論理に基づく確率モデルのためのベイズ推定 https://kaigi.org/jsai/webprogram/2011/paper-372.html 規則性と不確実性が入り交る世界をモデル化するため,論理の記述力と確率モデルの モデリング…

2011-05-18の作業メモ

音声認識におけるトピックモデル周りを軽くサーベイ。まだどれも読んでないし、多分読んでもわからない。。 Topic tracking language model for speech recognition - gologo13の日記 TOPIC CACHE LANGUAGE MODEL FOR SPEECH RECOGNITION - gologo13の日記 L…

LATENT DIRICHLET LANGUAGE MODEL FOR SPEECH RECOGNITION

著者:Jen-Tzung Chien and Chuang-Hua Chueh アブストラクト:LDAは文書のモデリングと分類に成功している。LDAは単語の連鎖を考慮せずに、bag-of-wordsの枠組みに基づいて文書確率を計算する。このモデルは音声認識において、単語予測の確かさから異なる、…

TOPIC CACHE LANGUAGE MODEL FOR SPEECH RECOGNITION

ICCASP 2010 著者:Chuang-Hua Chueh and Jen-Tzung Chien アブストラクト:伝統的なN-Gram言語モデルは長距離の文脈情報を考慮できない。キャッシュモデルはこの弱点を補うのに適している。この論文では、音声認識タスクにおいて潜在ディリクレ言語モデル(l…

Topic tracking language model for speech recognition

http://portal.acm.org/citation.cfm?id=1879661 年:2011 著者:Shinji Watanabe, Tomoharu Iwata, Takaaki Hori, Atsushi Sako and Yasuo Ariki*1 アブストラクト:実際の環境で、音響や言語の特徴は話者、話し方、話題の変化に大きく依存する。これらの変…

topic model

topic model 周辺の論文のメモ。 topic model topic detection topic tracking Topic-based language models using EM D. Gildea and T. Hofmann Proceedings of the 6th European Conference on Speech Communication and Technology (Eurospeech '99), Bud…

動的ダブル配列

動的にキーの追加ができるTrieを探していたが、動的ダブル配列でできるということでメモ。大雑把に他のデータ構造との性能比較すると、次のような感じ。 ハッシュ(C++で言う std::map, std::tr1::unordered_map)よりも検索が速い 静的ダブル配列よりもデータ…

Kindle雑感

Kindle を1週間ぐらい使った感想。Kindleを買おうか迷っている人、どのKindleにするか選ぶのに迷っている人に参考になれば。買ったのは これ。値段は $379.00。通称は Kindle DXg らしい。Kindle を買った理由は、PDFをPCで読みたくなかったから。というの…

IPC::Open2 'open2'

IPC::Open2 'open2' はPerl上であるコマンドに好きな入力を与えて、その出力を利用したいという時に使える。 標準の open では open(COMMAND, "command |"); open(COMMAND, "| command"); みたいに、どちらか片方しか扱えない。IPC::Open2 'open' の使い方 u…

コマンドライン上でapeファイルをmp3にエンコード

コマンドライン上でapeファイルをmp3にエンコードしたかったので調べた。Linuxユーザを想定しているけど、GUIでやりたい人は Linux Salad: SoundConverterでオーディオファイルを変換する を参考にすればできると思う。Windowsユーザはググれば何か見つかる…

英和辞書/和英辞書プログラム

https://github.com/laysakura/jisho コマンドライン上で引ける英和辞書/和英辞書プログラムを見つけた。 ブラウザを介さないので、ネットサーフィンで時間を無駄にするのを回避できるかもしれない! でも、仕様上ネットワークと接続している必要があるので…

vimtutor

vimtutor を最後までやってみて、新しく覚えたことをメモ。 U: 行全体の取り消し e: 空白も含めた単語の範囲。wよりも広い単位 r: カーソルにある文字を置換する cw: カーソル位置から単語の一部、もしくは全体を変更する c$: カーソル位置から行の最後まで…

Mercurial

最近気になってたMercurialについて調べてみた. Mercurialとは Mercurial SCM 分散ソースコード管理ツール.複数人で別々に開発するときにソースコードを管理するためのツール.とは言うものの,1人で開発するときでもかなり使える. 基本的な用語 まずソー…

SOX

音声波形を加工したい.そのために,soxコマンドというものがある.その使い方のメモ. 音声をステレオ(2ch)からモノラル(1ch)に変換 sox -c 2 stere.wav -c 1 monaural.wav 音声ファイルのサンプリング周波数を変換する この例だとサンプリング周波数が48kH…

音響モデル

音響特徴量を抽出したり,音響モデルを作ったりするのに使う. 適当ですいません,そのうち整理します.. HTK Speech Recognition Toolkit HTK 3.0 HOWTO (工事中) HTK : The Hidden Markov Model Toolkit [ja.nishimotz.com] 音声メディア研究室 HMM 作成 …

「平べったい説明しかできない」から始まる「言語技術」の話

Togetter - 「「平べったい説明しかできない」から始まる「言語技術」の話」 私も平べったい説明しかできない学生の1人だが,マジで何とかしたい.気になった発言をちょっとだけメモる.興味ある人は絶対↑のtogetterを読んだほうがいいです. 物事を構造化…

speech

IEEE Xplore Abstract - Automatic lecture transcription by exploiting presentation slide information for language model adap... 講義音声認識 講義全体のトピックを適応させたPLSAモデル*1(グローバルに適応) satomacoto: PythonでPLSAを実装してみ…

言語バインディング

mixi Engineers' Blog mixi Engineers' Blog

2010年に読んだ本

某集まりで昨年に読んだ本の数が話題になったので,私も調べてみた.以下,読書メーターからの出力.2010年の読書メーター読んだ本の数:22冊読んだページ数:9262ページ夏のレプリカ (講談社文庫)読了日:11月29日 著者:森 博嗣幻惑の死と使途 (講談社文庫…

tips

図 図の挿入 - [物理のかぎしっぽ] ちいさくなーれ☆ - Seeking for my unique color. タイトルを小さくする: \usepackage[small,compact]{titlesec}図のキャプションを小さくする: \usepackage[small]{caption}行間のサイズを小さくする: \baselineskip=0…

何とかしたい英語

昨年の私の英語の学習について振り返り,今年はどのようにreading, listening, speaking, writingを学習していくかを考える. reading 昨年の冬頃からLinux JournalやLinux InsiderをRSSリーダーで定期購読するようになった.これらの更新頻度は1日に1,2…

wat-array

この素晴らしいであろうライブラリをどのように自分のために活かせるのかはまだわからない. wat-array : wavelet木を利用した高速配列処理ライブラリ | Preferred Research 話題のwat-arrayを使ってBurrows-Wheeler変換(BWT)してみた wat-arrayでラクラク実…

混ぜ書き変換

ddskk で交ぜ書き変換をしたい - とりあえず暇だったし何となく始めたブログより 通常の仮名漢字変換では、変換元となる文字列は、「ひらがな」や「数字」のみです。 それに対して、交ぜ書き変換は、変換元となる文字列に「漢字」が含まれる事を許容します。…

分割誤り,読み推定誤りしそうな例

カリー化 リー環 関手(せきしゅ) 開核(かいかく) 圏論にはこういういい例がたくさんあって良いね.しかも例として用いると頭良さそうな感じだし.

誤変換例

ウェブにたくさんあった.おもしろいな.誤変換起こしやすいとされる文を集めたコーパスを手作業で作っても良いかもしれない. 話が変わるけど,何かの精度が上がったことを専門家ではなく一般人に主張したければ,具体的にうまくいった例を与えなければ納得…

11月の読書メーター

11月の読書メーター読んだ本の数:7冊読んだページ数:2755ページ夏のレプリカ (講談社文庫)読了日:11月29日 著者:森 博嗣幻惑の死と使途 (講談社文庫)やっぱり犀川先生と萌絵の2人の会話が最高に楽しいわぁ.物質や情報,それに経済量などの流入と流出の…

プロジェクト管理ツールメモ

チケット管理システム チケット管理システムをつかってみよう!:An Agile Way:ITmedia オルタナティブ・ブログ Redmine.JP — Redmine日本語情報サイト http://1-byte.jp/2010/11/30/team_development/

learning to rank

使うかもしれないのでメモ.まだランキング学習が何のことなのかさっぱりわからない. Learning to rank - Wikipedia, the free encyclopedia Large Scale Learning to Rankを読んだ - 射撃しつつ前転 言語処理学会 NLP 2010 本会議初日: 係り受け解析の新展…

ls -1

ls -1 で1行1エントリでの表示を強制させる.標準出力でない場合は勝手にこのオプションがついていることになっていたらしい.よくできてる. On-line Manual of "ls"

scraping

use URI URLに対して色々な処理をするモジュール URIモジュールのメモ - Unknown::Programming perl-mongers.org URIをエスケープ Perlメモ use HTML::TreeBuilder http://hwat.sakura.ne.jp/hpod/200511/15-233956/ これが一番やくにたったかも use Web::Sc…

google検索のパラメータ

q 検索したいことば ex) q=ほげ gl その指定した国から検索したことになる ex) gl=JP hl 使用言語 ex) hl=ja num 最大表示件数 ex) num=20 oe 検索結果の文字コード ex) oe=utf-8 まとめると http://www.google.co.jp/search?q=ほげ&gl=JP&hl=ja&num=20&oe=u…

メモ

日付の挿入 [vim] 日付の挿入

touch -r

いいね.touch -t で直接指定するのは面倒くさいし. UNIX「ファイル日付変更」コマンド(Hishidama's UNIX-command "touch" Memo)

c++の連想配列

STLにstd::mapがあるけど遅いし出来る限りstd::tr1::unordered_mapを使いましょう 罠 ユーザ定義型をキーに持つとき,その型の比較operatorを定義する必要がある []でmapにアクセスすると,そのキーが勝手に追加される この仕様にクソはまった.errorとかwar…

分割コンパイル

ようやく理解した.要点は ヘッダファイルとソースファイルをきちんと分けましょう そうしないとコンパイル時に multiple definitions とか言われてコンパイルできない 関数はプロトタイプ宣言 変数は extern を付けて宣言 インクルードガードをしましょう r…

gdb

gdb の使い方 Debugging with GDB - Table of Contents tips タブで色々補間できる ref Linux のデバッグ手法をマスターする $BBh(B5$B2s!'(BGDB$B$G%G%P%C%0(B

Human auditory system

マスキング temporal masking ref Š´Šo‚̐¶—‚ƐS— ‘æ12‰ñ ’®ŠoS— 音声データのデータ圧縮 PCM パルス符号変調 - Wikipedia Log PCM DPCM ADPCM ref http://www.wide.ad.jp/project/document/reports/pdf1989/part12.pdf CELP CS-ACLP ref Mobile:CELP【…

Unicode 6.0

絵文字が使えるようになるんだとか. 「Unicode 6.0」が策定、絵文字が国際標準に - ケータイ Watch Unicode 6.0: Popular Symbols for Asia Unicode 6.0.0

WWW::Curl, LWPとJSONに関するドキュメント

man curl_easy_setopt perldoc WWW::Curl WWW::Curlで進捗表示しつつダウンロード : blog.nomadscafe.jp curlでメモリへの取り込み(perl編): Xo式 実験室(labo.xo-ox.net) LWP - PerlでのWWWアクセスのためのライブラリ http://d.hatena.ne.jp/tokuhirom/2…

コードを書くコツ

自分にあった方法 これから書くコードの処理の流れを絵に書いてみる コードを眺めてうーんどうしよっかなーとか考え込むよりも,全然いい 実装がめんどくさいと思ったり,ここちょっと書くの時間かかりそう…っていう箇所があったら,とりあえずその部分にそ…

韻律学というか音声全般

韻律学(metrics)について韻律と音声言語情報処理という本で勉強してる.まぁちょっと難しい.自分は音声に関してド素人もいいところ*1なので,もっと音声一般に関する初歩的な用語から勉強する必要性を感じている.なので今これの1章を読んでいる.韻律(pros…

IMEへのちょっとした不満

「すべてがFになる」という間にローマ字を挟む日本語をIMEで出したいときに,文字通りタイプするとmozcでは「すべてがFninaru」という感じになる.で,「すべてがFになる」という正しい出力を一発で出すためには 「すべてが」までタイプして,IMEをオフにし…

ビルド

ビルドに必要なライブラリの存在を完全に失念していた.scimはいらない. sudo aptitude install g++ python libibus-dev libcurl4-openssl-dev libssl-dev zlib1g-dev libdbus-1-dev libglib2.0-dev libprotobuf-dev protobuf-compiler libgtest-dev subver…

変な変換候補

mozcで何か変換して感じたらメモる. 入力:いっていた 変換候補の順序が変な気がした.「言っていた」が1番目か2番目ぐらいに来て欲しかった.なんでこうなるんだろう.「一定た」や「一定他」のスコアが「言っていた」のスコアよりも大きかったとしかわ…

error: variable ‘std::ifstream hoge’ has initializer but incomplete type

c++

インクルードし忘れ... #include

ファイル入出力系

seekg std::ios::beg ファイルの先頭 std::ios::cur ファイルの今見ている位置 std::ios::end ファイルの最後 tellg 現在の位置を取得する ファイルの先頭では 0 を返す EOFでは -1 を返す リンク3より,EOFになったファイルディスクリプタを最初に巻戻して…