Dstarusers.orgのlist加工 Edit

USTRUST系のログサイトhttp://http://www.dstarusers.org/ の中で知りたい情報のみlist UPするプログラムを作成してみた。

  1. Webページからの切り取り。最初っから時間でソートした画面を利用。
    use strict;
    use warnings;
    use LWP::UserAgent;
    use HTML::TreeBuilder;
    
    # urlを指定する
    my $url = 'http://www.dstarusers.org/?lastheardsort=4';
    
    # IE8のフリをする
    my $user_agent = "Mozilla/4.0 (compatible; MSIE 8.0; Windows NT 6.1;  Trident/4.0)";
    
    # LWPを使ってサイトにアクセスし、HTMLの内容を取得する
    my $ua = LWP::UserAgent->new('agent' => $user_agent);
    my $res = $ua->get($url);
    my $content = $res->content;
# HTML::TreeBuilderで解析する
my $tree = HTML::TreeBuilder->new;
$tree->parse($content);
DOM操作してトピックの部分だけ抜き出す。
<div id='topicsfb'><ul><li>....の部分を抽出する

open (OUT, ">> dstarlist.txt");
my @items = $tree->look_down('class', 'systemtbl')->find('td');
print OUT $_->as_text.":" for @items;
close(OUT);


URL B I U SIZE Black Maroon Green Olive Navy Purple Teal Gray Silver Red Lime Yellow Blue Fuchsia Aqua White


Reload   New Lower page making Edit Freeze Diff Upload Copy Rename   Front page List of pages Search Recent changes Backup Referer   Help   RSS of recent changes