ブラウザで波ダッシュの文字化け

以下、途中で文字化けして何を書いているかわからなかったらごめんなさい。


お客さんから渡されたWordのテキストをコピー&ペーストしてサーバーにアップしたら文字化けしていると指摘があった。〜が?になっていた。

実際に、文字化けする〜を貼り付けて自分で入力した~とでテキストファイルにしてみて

〜~

をバイナリで見てみると、

$ cat namitest.txt
〜~
$ od -t x1 -c namitest.txt
0000000 e3 80 9c ef bd 9e
343 200 234 357 275 236
0000006

と波ダッシュ(e3809c)や全角チルダ(efbd9e)になる。

調べてみると、これは波ダッシュ全角チルダ問題と言われるものらしい。自分の中では、波ダッシュやチルダのことは、まとめて “から” とか “ニョロ” とか呼んでいるけど。

波ダッシュとチルダは意味が違うので使い分けろという意見もあるけど、ブラウザで文字化けしたら元も子もないので、主義主張に関係なく表示できる全角チルダにしておく。

でも、お客さんのところで最初のWordのファイルはどうやって波ダッシュを入力できたのだろう。

お客さんのサイトはShift-JISだから、ブラウザで文字化けするのはこの辺りが怪しい。気を付けないと、また文字化けしそうだなと、以上覚え書きを書いておく。

投稿者:

avatar

ando

50過ぎてもプログラマーの気持ちを忘れない。