WXR Parser

WXR Parser 可用來分析 WordPress.com 匯出的 XML 檔案,是為了這次要搬出來然後用 Wintersmith 靜態產生 blog 頁面寫的,目前可以匯 出適合 Wintersmith 使用的目錄結構。不過因為設計上 parser 跟 backend 分 開,所以要擴充來產生其他格式也蠻簡單。

A simple WXR parser written in Python to parse the XML export from WordPress and store the information it in in Python’s basic data structures, i.e. dictionaries and lists. It also goes with a backend to export it in Markdown syntax suitable for Wintersmith. In its current form, it can simplify the migration from WordPress to Wintersmith, but it’s easy to be extended to export more formats.

It’s created because the author failed to find a simple one to use.

至於本來想讓 Wintersmith 支援 org-mode,這部份就不打算弄了。主要由於幾個原因:

  1. org-mode 輸出成 html 預設是 standalone 的,也就是會匯出一個結構完整 的 html 檔案。這在當成文件匯出時很不錯,但並不符合這類 static site generator 的預期。

  2. org-mode 新版本支援直接輸出為 markdown。