そろそろユニコードにしようかと思っていたところにタイムリーな記事が、本家の記事(
http://www.geeklog.net/article.php/200410120657418)でアップされた。tokyoaheadさんが書いたものを和訳しておいたので参考にどうぞ。
Geeklogをある言語用に設定して使い始めてから、多言語対応に変えようと言うのはとても難しい。使っている文字セットが異なっている場合には特にそうだ。UTF-8を使っていれば、すべての言語と文字セットを同時に何の問題もなく表示することが出来る。
だから、一番いい方法はデータをすべて一気にユニコードに変えてしまうことだ。記事やコメントの文字コードを一つ一つ手作業でページのエンコードを変えてからいじりたくはないだろう。
このためには、(1)notepad.exeのような、保存時にエンコードを指定できるエディタ(2)MySQLを直接操作できること(WindowsのcmdとかLinuxのシェルとか)(3)PHPEdit(または、Linuxのシェルエディターとか、僕の知ってる限りだけど)のように、ユニコードを扱えないエディタ。使っているエディタがユニコードを使えるかどうかは、ユニコードが使えるエディタで"xx?xx"とか言う感じの文字を入力したファイルを作成して、これをユニコードが使えなさそうなエディタで開いてみるといい。先ほどの文字”?”が、”?¶”になっていたら大丈夫だ。
これで準備は完了。変換を始めよう。
追記:1.3.10では、UTF-8用の言語ファイルが用意されているので、ステップ10の変換は不要だ。
ちなみに日本語のファイルは、japanese_UTF-8.php。euc-jpのものをemacsで機械的に変換しただけだからうまくいくかどうかは、ちょっと自信がない。
このサイトをutf-8化したら改めて報告する予定だ。