第20回山陰ITPro勉強会「Webからのデータ抽出自由自在」に参加してきました。

Pocket

第20回山陰ITPro勉強会 ハンズオンセッション「Webからのデータ抽出自由自在」」に参加しました。

 ちょうど、Amazon KDPの管理でウェブスクレイピングやってみるかなと思っていたところだったので、この勉強会はありがたかったです。

 多岐にわたる内容を短時間で学べ、講師の橋本将さん(ネットワーク応用通信研究所)のご準備にかかった時間はものすごいだろうなと思いました。また足を向けて眠れない人が増えました。ありがとうございます。

 この勉強会以前だと、Wgetでファイルを引っ張ってきて、なでしこで正規表現使った処理をして、とかやっていたと思いますが、rubyとnokogiriとか使うともっと試行錯誤の時間が短縮できそうなことがわかりました。正規表現って難しいですから。

 やり方はわかったので、他のWebスクレイピング手法もいろいろ試してみたいと思っています。といっても、巡回頻度は低く、低く。

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です