2015-10-11から1日間の記事一覧
TFIDF ぐらいなら自分で書いても簡単だけど、実際に使う時は面倒くさいし変なバグを生みたくないので sklearn にやってもらおう。 // gist.github.com sklearn の CountVectorizer や TfidfVectorizer は、デフォルトでは、一文字のトークンが除外されてしま…
自分用メモ sklearn 様様です。 最初に k を決めないといけないが、ざっくりと分類したい時には便利。 // gist.github.com