誤変換例

ウェブにたくさんあった.おもしろいな.誤変換起こしやすいとされる文を集めたコーパスを手作業で作っても良いかもしれない.
話が変わるけど,何かの精度が上がったことを専門家ではなく一般人に主張したければ,具体的にうまくいった例を与えなければ納得してもらえないと思う.たった少しの良くなった例を見せて,全体的に何が言えるのかという話だけど,あるとないとでは全然違うはず.

書籍

11月の読書メーター

11月の読書メーター
読んだ本の数:7冊
読んだページ数:2755ページ

夏のレプリカ (講談社文庫)夏のレプリカ (講談社文庫)
読了日:11月29日 著者:森 博嗣
幻惑の死と使途 (講談社文庫)幻惑の死と使途 (講談社文庫)
やっぱり犀川先生と萌絵の2人の会話が最高に楽しいわぁ.物質や情報,それに経済量などの流入と流出の話とか全然意味不明だけど楽しいわー.
読了日:11月28日 著者:森 博嗣
怖いくらい通じるカタカナ英語の法則 (ブルーバックス)怖いくらい通じるカタカナ英語の法則 (ブルーバックス)
ピーキングの学習にいい本だと思う.日常でよく使うフレーズを自由に使えるようになるためには,例文暗唱は必須.とりあえず自分はこの本を信じてやってみる
読了日:11月25日 著者:池谷 裕二
英会話ヒトリゴト学習法英会話ヒトリゴト学習法
読了日:11月25日 著者:酒井 穣
陽気なギャングが地球を回す (祥伝社文庫)陽気なギャングが地球を回す (祥伝社文庫)
おもしろい.行儀のいい展開な気がした.メインの登場人物もいい味を出していて好きになれる.特に響野が良い!
読了日:11月14日 著者:伊坂 幸太郎
封印再度 (講談社文庫)封印再度 (講談社文庫)
ミステリーはおまけでラブコメがメイン!
読了日:11月04日 著者:森 博嗣
レイクサイド (文春文庫)レイクサイド (文春文庫)
最後はパパになっちゃたんだね.本当に子供がそんなことするのかなぁと釈然としなかったけど,東野圭吾はさらっと残酷なこと書いちゃうんだよね.そこが急展開でおもしろいん
読了日:11月01日 著者:東野 圭吾

読書メーター

learning to rank

使うかもしれないのでメモ.まだランキング学習が何のことなのかさっぱりわからない.

scraping

use URI

URLに対して色々な処理をするモジュール

URIをエスケープ

use HTML::TreeBuilder

これが一番やくにたったかも

google検索のパラメータ

  • q
    • 検索したいことば
    • ex) q=ほげ
  • gl
    • その指定した国から検索したことになる
    • ex) gl=JP
  • hl
    • 使用言語
    • ex) hl=ja
  • num
    • 最大表示件数
    • ex) num=20
  • oe

まとめると

http://www.google.co.jp/search?q=ほげ&gl=JP&hl=ja&num=20&oe=utf-8

ref