/yotogicrawler

2020/12/31で閉鎖する東方夜伽話の投稿作品回収スクリプト

Primary LanguagePerlMIT LicenseMIT

yotogicrawler

東方夜伽話とねちょこんの作品回収するやつ。

必要なものと使い方

  • Perl処理系

WindowsならStrawberry Perl。他のOSなら自分でどうにかして。*nix系ならだいたい入ってる気もするけど。 多分標準で入ってないモジュール使ってるので、何か足りなかったらターミナルで

cpan install HTML::TreeBuilder::XPath

とかしてインストールすること。

あとは

perl yotogi.pl
perl comp.pl

で全部回収します。comp1~14.json, otokogi.json, cache.json は更新確認用のキャッシュなので削除しないこと。更新があれば同じコマンド実行してやればキャッシュ確認した上で新規・更新作品だけ回収します。

回収時にターミナルが文字化けするなら config.json の term_encoding を変えてみるといいかも。Windowsなら cp932、あとは utf8 とか。太古の化石Linuxだと eucjp とかまだあるかもしれないけど。

License

MIT。