Ruby

Debian Wheezy に MeCab と CaboCha を入れた。

ソースから入れた。めも。 MeCab wget https://mecab.googlecode.com/files/mecab-0.996.tar.gz tar xvf mecab-0.996.tar.gz cd mecab-0.996/ ./configure --prefix=$HOME/local --with-charset=utf8 --enable-utf8-only make make install mecab -v IPADIC …

SPARQL であそぼう。

SPARQL を使って DBpedia から NBA player に関する情報を取得してみた。 SELECT ?person ?team ?position ?height WHERE { ?person a dbpedia-owl:BasketballPlayer; dbpedia-owl:team ?team. ?person dbpedia-owl:height ?height. ?person dbpedia-owl:pos…

Ruby で XML をパース

REXML は遅いので Nokogiri を使おう。 class Twitter def self.read_xml *filenames tweets = [] filenames.each do |filename| xml = Nokogiri::XML(open(filename)) xml.search('feed/entry/title').each do |title| tweets.push title.text.gsub(/\n/, '…