Simon Szustkowski

Ein Blog über alles, was mir gerade so durch den Kopf geht

Mar 29, 2013

Octopress to Wordpress

Ich habe mich letzte Woche dazu entschieden, wieder von Octopress zurück zu WordPress zu switchen. So ganz PHP-frei kriege ich meinen Server ja doch nicht, und der Workflow bei WordPress sagt mir mehr zu. ;)
Außerdem habe ich mich nach dem Google Reader Fuckup dazu entschlossen, vermehrt auf selbstgehostete Systeme zu setzen, da kam mir die Kommentarfunktionalität über disqus eher ungelegen.

Ich hatte aber nun das Problem, dass ich irgendwie meine Posts aus Octopress wieder zurück in eine WordPressinstallation konvertieren musste. WordPress hat zwar sehr schicke Importerfunktionen, u.a. auch einen Import eines Atom-Feeds, aber das reichte mir nicht. Der Atomfeed transportiert im Octopress-Default keine Kategorien, und der Importer kam auf die Titel nicht zurecht. Also alles eher unglücklich.

Ich habe daher das WXR-Format, was WordPress selbst zum Im- und Export von Daten nutzt mal genauer angesehen. Auch dies ist eigentlich nur simples XML. Als ich dann rausfand, wie man den Atomfeed von Octopress so generieren lässt, dass er sämtliche Posts anzeigt, und da auch noch eben die Kategorien mit reingehackt habe, war es ein leichtes, einen Parser zu schreiben, der den Atomfeed nimmt, und daraus ein WXR-File generiert.

Es lief nicht zu 100%, mir bereitete etwas sorgen, dass die quadratischen Thumbnails von Picasa komisch angezeigt werden, aber da ich eh auf kurz oder lang von Picasa wegwill, bevor Google das ggf auch noch abschaltet, werden die Galerien irgendwo auf den hinteren Seiten verschwinden.

Da ich hoffe, dem ein oder anderen zu helfen, habe ich das Script mal vergistet: Gist