友人がこんな情報を見つけてきた。
IRCを使ったニュースとBlog情報の自動配信
やおら、PerlでXMLを解析すべくチョコチョコ触りだしたら。。。
plumというIRCボットを使っている関係上、PerlにてRSSを解析しないといけない。
ちょっとgoogleったら、簡単なサンプルが見つかった。
しかし、単純なparserでは途中で解析を失敗して落ちてしまう。
もうちょっとしっかりやってもらえそうなのをさらに探して
Perl XMLでencoding='Shift_JIS'や'euc-jp'を使うにたどりついた。
このサイトを参考に、システム設定も含めて見直したところ、ノードを分析して展開できた。
ほほ〜〜
以下は、パースしたノードを表示したもの。
===========Smilezoneのファイル
DOCUMENT_NODE :#document
> ELEMENT_NODE :rdf:RDF
> > TEXT_NODE :#text =>:
> > ELEMENT_NODE :channel
> > > TEXT_NODE :#text =>:
> > > ELEMENT_NODE :title
> > > > TEXT_NODE :#text =>: Smilezone::blog
> > > TEXT_NODE :#text =>:
> > > ELEMENT_NODE :link
> > > > TEXT_NODE :#text =>: http://www.smilezone.biz/mt/
> > > TEXT_NODE :#text =>:
> > > ELEMENT_NODE :description
> > > TEXT_NODE :#text =>:
> > > ELEMENT_NODE :dc:language
> > > > TEXT_NODE :#text =>: ja
> > > TEXT_NODE :#text =>:
> > > ELEMENT_NODE :dc:creator
> > > TEXT_NODE :#text =>:
> > > ELEMENT_NODE :dc:date
> > > > TEXT_NODE :#text =>: 2004-01-22T06:55:15+09:00
> > > TEXT_NODE :#text =>:
> > > ELEMENT_NODE :admin:generatorAgent
> > > TEXT_NODE :#text =>: