読者です 読者をやめる 読者になる 読者になる

R Graphical Manualsから画像を引っぱってくる

Ruby R

Rでどんなプロットができるかの具体例が超大量に載ってるR Graphical Manualsというサイトがありました。

で、ここがWeb APIを提供しているので使ってみた。graphicsのパッケージの例の画像を片っ端から取ってくる。この例だと200枚くらい。「こんなのができるんだ」というのを知ってるだけで結構違うところもあると思うので、取ってきた画像をtouchに突っ込むなどするとよいかと思う。

#!/usr/bin/ruby
require 'rubygems'
require 'hpricot'
require 'mechanize'

url = "http://cged.genes.nig.ac.jp/RGM2/REST.php?method=searchImagesByPackageName&pkg_name=graphics"

agent = WWW::Mechanize.new
agent.max_history = 1
source = Hpricot(agent.get_file(url))
(source/"img_path").each{ |item|
  file = agent.get(item.inner_text)
  file.save
  sleep 1
}

スクレイピングしてくるときに、どのくらい時間を空けてやればいいかとはいまいち分からない。。。