POST された日本語

結論:<--python のフォルダ-->/LIB/site-packages/sitecustomize.py に

import sys
sys.setdefaultcoding('utf-8')

手順:

  1. cgi.FieldStorage() .getfirst('name') で取り出す
  2. 文字コード判定して unicode に変換
  3. ごにょごにょする
  4. utf-8(でも Shift-JIS でも EUC-JP でも)に変換して出力

文字コード判定が謎、というかこれでおkみたいな方法は無いみたい。一応 jcode.py なるもんを見つけて使ってるが、ググって使用例が多いのは pykf というのな感じ。ただし古いようだ。割と最近 UniversalEncodingDetector なるのが mozilla文字コード判定を移植したものだそうで、お疲れ様です。まだ使ってないけど文字列ブチ込めるんだろうか。