前の関連記事:Blogger:バックアップ(6)Web巡回ソフトGetHTMLW:フィルタ設定
新規投稿のみの取得はできず
新規投稿を公開したあとにこの設定でWebPage取得をしてみました。
するとすべての投稿のhtmlファイルが新規ダウンロードされてしまいました。
結構時間がかかります。
「9:更新チェックを厳密に行う」をチェックしても結果は同じでした。
ブログなので新規投稿をすると各投稿ページにリンクでも貼られて全ての投稿ページが更新されてしまうのでしょうか。
「取得しない」に設定すると新規投稿すら取得されません。
「Textのみ取得」にしていても新規投稿の画像はダウンロードされました。
結局このままの設定で運用することにしました。
画像をダウンロードするためには「3:ページ上オブジェクト全取得」をチェックしておかないといけません。
投稿を下書きに戻して非公開にしてもすでに取得したhtmlファイルは削除されませんでした。
データディレクトリを設定する
私は保存データをまるごとzipファイルにして残しておきたいのでダウンロードデータを1つのフォルダにまとめておきたいです。
設定→環境設定、このダイアログの一番下でデータディレクトリを指定しました。
0 件のコメント:
コメントを投稿