Python

gensim で LDA 回してみた。

gensim を使えば簡単に topic model が使えるみたい。 適当なテキストが転がってたので LDA (Latent Dirichlet Allocation) を回してみた。 LDA 簡単すぎて吹いた。 でも、パラメータをどうしたらいいのか分からないのでトピック数以外はデフォルト。 https:…

Debian Wheezy に MeCab と CaboCha を入れた。

ソースから入れた。めも。 MeCab wget https://mecab.googlecode.com/files/mecab-0.996.tar.gz tar xvf mecab-0.996.tar.gz cd mecab-0.996/ ./configure --prefix=$HOME/local --with-charset=utf8 --enable-utf8-only make make install mecab -v IPADIC …

Pythonで自然言語処理をするために入れたものメモ

環境を整えただけ。まだ何もしてない。とりあえずメモ代わり。てきとーに入れたのでなんかまずいかもしれない。 MacPorts 'sudo port selfupdate'を忘れずに Python 2.7.3 sudo port install python27 sudo port select --set python python27 NLTK sudo por…