Node v0.10.33 (Stable)

Node v0.10.33 (Stable) 最近世間を騒がせているPOODLE攻撃ですが、node.jsがこの脆弱性に対応されたようです。 SSLv2とSSLv3によるセキュアプロトコルがデフォルトで無効になりました。 もし SSLv2, SSLv3 をサポートさせたい場合、node 起動時に --enable-…

始めました

node.js周りのこと書いていければと考えている。

LDAの実装リンク

適宜更新。 Supervised latent Dirichlet allocation for classification GibbsLDA++: A C/C++ Implementation of Latent Dirichlet Allocation (LDA) using Gibbs Sampling for Parameter Estimation and Inference Latent Dirichlet Allocation in C iir/l…

情報理論の復習

情報理論作者: 今井秀樹出版社/メーカー: 昭晃堂発売日: 1984/01メディア: 単行本購入: 1人 クリック: 16回この商品を含むブログ (4件) を見る第3章 情報源と通信路のモデルの 3.1, 3.2 の復習。 記憶のない情報源 各時点における情報源記号の発生確率が、…

人工知能学会2011で気になる発表メモ

jsai2011 Schedule からザーッと見て探してみた。 1J3-5 命題論理に基づく確率モデルのためのベイズ推定 https://kaigi.org/jsai/webprogram/2011/paper-372.html 規則性と不確実性が入り交る世界をモデル化するため,論理の記述力と確率モデルの モデリング…

2011-05-18の作業メモ

音声認識におけるトピックモデル周りを軽くサーベイ。まだどれも読んでないし、多分読んでもわからない。。 Topic tracking language model for speech recognition - gologo13の日記 TOPIC CACHE LANGUAGE MODEL FOR SPEECH RECOGNITION - gologo13の日記 L…

LATENT DIRICHLET LANGUAGE MODEL FOR SPEECH RECOGNITION

著者:Jen-Tzung Chien and Chuang-Hua Chueh アブストラクト:LDAは文書のモデリングと分類に成功している。LDAは単語の連鎖を考慮せずに、bag-of-wordsの枠組みに基づいて文書確率を計算する。このモデルは音声認識において、単語予測の確かさから異なる、…

TOPIC CACHE LANGUAGE MODEL FOR SPEECH RECOGNITION

ICCASP 2010 著者:Chuang-Hua Chueh and Jen-Tzung Chien アブストラクト:伝統的なN-Gram言語モデルは長距離の文脈情報を考慮できない。キャッシュモデルはこの弱点を補うのに適している。この論文では、音声認識タスクにおいて潜在ディリクレ言語モデル(l…

Topic tracking language model for speech recognition

http://portal.acm.org/citation.cfm?id=1879661 年:2011 著者:Shinji Watanabe, Tomoharu Iwata, Takaaki Hori, Atsushi Sako and Yasuo Ariki*1 アブストラクト:実際の環境で、音響や言語の特徴は話者、話し方、話題の変化に大きく依存する。これらの変…

topic model

topic model 周辺の論文のメモ。 topic model topic detection topic tracking Topic-based language models using EM D. Gildea and T. Hofmann Proceedings of the 6th European Conference on Speech Communication and Technology (Eurospeech '99), Bud…

動的ダブル配列

動的にキーの追加ができるTrieを探していたが、動的ダブル配列でできるということでメモ。大雑把に他のデータ構造との性能比較すると、次のような感じ。 ハッシュ(C++で言う std::map, std::tr1::unordered_map)よりも検索が速い 静的ダブル配列よりもデータ…

Kindle雑感

Kindle を1週間ぐらい使った感想。Kindleを買おうか迷っている人、どのKindleにするか選ぶのに迷っている人に参考になれば。買ったのは これ。値段は $379.00。通称は Kindle DXg らしい。Kindle を買った理由は、PDFをPCで読みたくなかったから。というの…

IPC::Open2 'open2'

IPC::Open2 'open2' はPerl上であるコマンドに好きな入力を与えて、その出力を利用したいという時に使える。 標準の open では open(COMMAND, "command |"); open(COMMAND, "| command"); みたいに、どちらか片方しか扱えない。IPC::Open2 'open' の使い方 u…

コマンドライン上でapeファイルをmp3にエンコード

コマンドライン上でapeファイルをmp3にエンコードしたかったので調べた。Linuxユーザを想定しているけど、GUIでやりたい人は Linux Salad: SoundConverterでオーディオファイルを変換する を参考にすればできると思う。Windowsユーザはググれば何か見つかる…

英和辞書/和英辞書プログラム

https://github.com/laysakura/jisho コマンドライン上で引ける英和辞書/和英辞書プログラムを見つけた。 ブラウザを介さないので、ネットサーフィンで時間を無駄にするのを回避できるかもしれない! でも、仕様上ネットワークと接続している必要があるので…

vimtutor

vimtutor を最後までやってみて、新しく覚えたことをメモ。 U: 行全体の取り消し e: 空白も含めた単語の範囲。wよりも広い単位 r: カーソルにある文字を置換する cw: カーソル位置から単語の一部、もしくは全体を変更する c$: カーソル位置から行の最後まで…

Mercurial

最近気になってたMercurialについて調べてみた. Mercurialとは Mercurial SCM 分散ソースコード管理ツール.複数人で別々に開発するときにソースコードを管理するためのツール.とは言うものの,1人で開発するときでもかなり使える. 基本的な用語 まずソー…

SOX

音声波形を加工したい.そのために,soxコマンドというものがある.その使い方のメモ. 音声をステレオ(2ch)からモノラル(1ch)に変換 sox -c 2 stere.wav -c 1 monaural.wav 音声ファイルのサンプリング周波数を変換する この例だとサンプリング周波数が48kH…

音響モデル

音響特徴量を抽出したり,音響モデルを作ったりするのに使う. 適当ですいません,そのうち整理します.. HTK Speech Recognition Toolkit HTK 3.0 HOWTO (工事中) HTK : The Hidden Markov Model Toolkit [ja.nishimotz.com] 音声メディア研究室 HMM 作成 …

「平べったい説明しかできない」から始まる「言語技術」の話

Togetter - 「「平べったい説明しかできない」から始まる「言語技術」の話」 私も平べったい説明しかできない学生の1人だが,マジで何とかしたい.気になった発言をちょっとだけメモる.興味ある人は絶対↑のtogetterを読んだほうがいいです. 物事を構造化…

speech

IEEE Xplore Abstract - Automatic lecture transcription by exploiting presentation slide information for language model adap... 講義音声認識 講義全体のトピックを適応させたPLSAモデル*1(グローバルに適応) satomacoto: PythonでPLSAを実装してみ…

言語バインディング

mixi Engineers' Blog mixi Engineers' Blog

2010年に読んだ本

某集まりで昨年に読んだ本の数が話題になったので,私も調べてみた.以下,読書メーターからの出力.2010年の読書メーター読んだ本の数:22冊読んだページ数:9262ページ夏のレプリカ (講談社文庫)読了日:11月29日 著者:森 博嗣幻惑の死と使途 (講談社文庫…

tips

図 図の挿入 - [物理のかぎしっぽ] ちいさくなーれ☆ - Seeking for my unique color. タイトルを小さくする: \usepackage[small,compact]{titlesec}図のキャプションを小さくする: \usepackage[small]{caption}行間のサイズを小さくする: \baselineskip=0…

何とかしたい英語

昨年の私の英語の学習について振り返り,今年はどのようにreading, listening, speaking, writingを学習していくかを考える. reading 昨年の冬頃からLinux JournalやLinux InsiderをRSSリーダーで定期購読するようになった.これらの更新頻度は1日に1,2…

wat-array

この素晴らしいであろうライブラリをどのように自分のために活かせるのかはまだわからない. wat-array : wavelet木を利用した高速配列処理ライブラリ | Preferred Research 話題のwat-arrayを使ってBurrows-Wheeler変換(BWT)してみた wat-arrayでラクラク実…

混ぜ書き変換

ddskk で交ぜ書き変換をしたい - とりあえず暇だったし何となく始めたブログより 通常の仮名漢字変換では、変換元となる文字列は、「ひらがな」や「数字」のみです。 それに対して、交ぜ書き変換は、変換元となる文字列に「漢字」が含まれる事を許容します。…

分割誤り,読み推定誤りしそうな例

カリー化 リー環 関手(せきしゅ) 開核(かいかく) 圏論にはこういういい例がたくさんあって良いね.しかも例として用いると頭良さそうな感じだし.

誤変換例

ウェブにたくさんあった.おもしろいな.誤変換起こしやすいとされる文を集めたコーパスを手作業で作っても良いかもしれない. 話が変わるけど,何かの精度が上がったことを専門家ではなく一般人に主張したければ,具体的にうまくいった例を与えなければ納得…

11月の読書メーター

11月の読書メーター読んだ本の数:7冊読んだページ数:2755ページ夏のレプリカ (講談社文庫)読了日:11月29日 著者:森 博嗣幻惑の死と使途 (講談社文庫)やっぱり犀川先生と萌絵の2人の会話が最高に楽しいわぁ.物質や情報,それに経済量などの流入と流出の…