Blog

【WordPress】投稿記事のURLだけを抽出する方法

はてなブログからの移転の際、URLがちゃんと合っているか確認するため

WordPressの投稿記事のURLだけを抽出してみました。

エクスポート

WordPress管理画面>ツール>エクスポートから投稿にチェック

エクスポートファイルをダウンロードのボタンを押してデータを抽出。

cg.wordpress.2018-04-22.xml

正規表現で置換して、URLだけを抽出

Atomでファイルを開き、Ctrl+Fで置換メニューを開く。

.*の正規表現ボタンを点灯させてから

検索:^(?!.*<link>).+$
置換;空白

で、に含まれるURLだけにする

次に

検索:^\r\n
置換;空白

空行を削除。

最後にや残っている空行などを削除して整えるだけです。

はてなブログとWordPressの記事URLを比較

もとからはてなブログのURLはスプレッドシートでスクレイピングしていたので、その後に先程抽出したURLをペースト

【GAS】ブログ記事をスクレイピングして投稿!Twitter Botの作成方法 ブログ記事をスクレイピングして投稿するTwitter Botの作成方法の紹介です。 少し手を加えて、記事に関するハッシュタグと時報...

条件付き書式で=COUNTIF(A:A,A:A)>1としてやれば、重複箇所が塗り潰されるので、それ以外のパスを見直せば、見事パーマリンクが一致できるのを確認できます。

まとめ記事の紹介

参考記事

参考書籍

gitの入門書です。

created by Rinker
¥2,484
(2019/02/19 01:22:01時点 Amazon調べ-詳細)

LifeHackに。

ABOUT ME
すいみん
東京在住。デザイナー寄りのテクニカルアーティスト。 ブログは技術検証の備忘録として書いています。