2013-01-01から1年間の記事一覧

Debian Wheezy に MeCab と CaboCha を入れた。

ソースから入れた。めも。 MeCab wget https://mecab.googlecode.com/files/mecab-0.996.tar.gz tar xvf mecab-0.996.tar.gz cd mecab-0.996/ ./configure --prefix=$HOME/local --with-charset=utf8 --enable-utf8-only make make install mecab -v IPADIC …

SPARQL であそぼう。

SPARQL を使って DBpedia から NBA player に関する情報を取得してみた。 SELECT ?person ?team ?position ?height WHERE { ?person a dbpedia-owl:BasketballPlayer; dbpedia-owl:team ?team. ?person dbpedia-owl:height ?height. ?person dbpedia-owl:pos…

入門機械学習

まだ、2章までしか読んでないけどなかなかおもしろい。 まだ、Rをインストールしてないのであとでまた読む。 ちょっとづつ読んでいこう。 この本の原題は「Machine Learning for Hackers」なんだけど、「入門」って誤訳だろ。 と思っていたが数式が全然出て…

Ruby で XML をパース

REXML は遅いので Nokogiri を使おう。 class Twitter def self.read_xml *filenames tweets = [] filenames.each do |filename| xml = Nokogiri::XML(open(filename)) xml.search('feed/entry/title').each do |title| tweets.push title.text.gsub(/\n/, '…