読者です 読者をやめる 読者になる 読者になる

ゆーすけべー日記

はてなBlogってどーなの!?

Plagger使ってデイリーベイスターズのRSSを吐き出す

Perl

横浜ベイスターズの試合情報はデイリーベイスターズというサイトがウェブでは一番充実している。 けど、RSS吐いてない。というわけでPlaggerのFilter::EntryFullTextっての使ってRSS吐き出してみた。 これ、

うまくマッチさせるのがだるいので、extractの設定せずに、description空。 更新情報とタイトルがわかればいいやと、という主義なのでこれでよし。 なんとなくPlaggerがわかってきた。 Filter::EntryFullTextってのはRSS吐いてないページとかを対象として、 そのページのリンクをたどってページ更新情報&サマライズをまとめてRSSにしてくれたり、 するんだな。便利だ。

以下assetsディレクトリに入れたyaml

http://www.kanaloco.jp/sports/bay/back.htm
author: Yusuke Wada
custom_feed_handle: http://www¥.kanaloco¥.jp/sports/bay/back¥.htm$
custom_feed_follow_link: yb¥d+.html
handle: http://www.kanaloco.jp/sports/bay/yb¥d+.html
#extract: <p><font color="#FF6600" size="5">(.*?)<table width="360"
#extract_capture: body

コンフィグyaml

global:
  assets_path: /path_to/assets
  timezone: Asia/Tokyo
plugins:
  - module: Subscription::Config
    config:
      feed:
         - url: http://www.kanaloco.jp/sports/bay/back.htm
  - module: Filter::EntryFullText
  - module: Publish::Feed
    config:
      format: RSS
      dir: ./
      filename: dailybaysters.xml