POST された日本語 - 日々ごちゃごちゃと考える

結論:<--python のフォルダ-->/LIB/site-packages/sitecustomize.py に

import sys
sys.setdefaultcoding('utf-8')

手順：

cgi.FieldStorage() .getfirst('name') で取り出す
文字コード判定して unicode に変換
ごにょごにょする
utf-8（でも Shift-JIS でも EUC-JP でも）に変換して出力

文字コード判定が謎、というかこれでおｋみたいな方法は無いみたい。一応 jcode.py なるもんを見つけて使ってるが、ググって使用例が多いのは pykf というのな感じ。ただし古いようだ。割と最近 UniversalEncodingDetector なるのが mozilla の文字コード判定を移植したものだそうで、お疲れ様です。まだ使ってないけど文字列ブチ込めるんだろうか。