WordPress

【WordPress】投稿記事のURLだけを抽出する方法

はてなブログからの移転の際、URLがちゃんと合っているか確認するため

WordPressの投稿記事のURLだけを抽出してみました。

エクスポート

WordPress管理画面>エクスポートからエクスポートファイルをダウンロードのボタンを押してデータを抽出。

cg.wordpress.2018-04-22.xml

正規表現で置換して、URLだけを抽出

Atomでファイルを開き、Ctrl+Fで置換メニューを開く。

.*の正規表現ボタンを点灯させてから

検索:^(?!.*<link>).+$
置換;空白

で、に含まれるURLだけにする

次に

検索:^\r\n
置換;空白

空行を削除。

最後にや残っている空行などを削除して整えるだけです。

はてなブログとWordPressの記事URLを比較

もとからはてなブログのURLはスプレッドシートでスクレイピングしていたので、その後に先程抽出したURLをペースト

あわせて読みたい
【GAS】ブログ記事をスクレイピングして投稿!Twitter Botの作成方法 ブログ記事をスクレイピングして投稿するTwitter Botの作成方法の紹介です。 少し手を加えて、記事に関するハッシュタグと時報の記...

条件付き書式で=COUNTIF(A:A,A:A)>1としてやれば、重複箇所が塗り潰されるので、それ以外のパスを見直せば、見事パーマリンクが一致できるのを確認できます。

ABOUT ME
すいみん
名前:すいみん 東京在住のデザイナー DTP・映像・3D・プログラミングまで、 なんでも自分で試して作ることが好きです。 ブログはその備忘録です。