2015-10-11から1日間の記事一覧

scikit-learn で TFIDF

TFIDF ぐらいなら自分で書いても簡単だけど、実際に使う時は面倒くさいし変なバグを生みたくないので sklearn にやってもらおう。 // gist.github.com sklearn の CountVectorizer や TfidfVectorizer は、デフォルトでは、一文字のトークンが除外されてしま…

scikit-learn で kmeans

自分用メモ sklearn 様様です。 最初に k を決めないといけないが、ざっくりと分類したい時には便利。 // gist.github.com