にしし ふぁくとりー(西村文宏 個人サイト)

Presented by Nishishi via Movable Type. Last Updated: 2015/09/22. 13:24:12.

Jcode.pmを使って文字コードを変換する

日本語文字コードの変換がとっても楽チンにできるPerlモジュールが「Jcode.pm」。これが活用されているフリーCGIは結構あります。

Perl 5.8.0以降では、Encodeモジュールが標準搭載されて、文字コードの変換が標準でできるようになったので、Jcode.pmを使う必要はなかったりするんですけども、フリーCGIの場合、Perl 5.8.0未満の環境で実行されるかも知れない可能性を考えて、(もしくは最初に作った時期がPerl 5.8.0リリース以前だったかで)Jcode.pmが使われてるCGIはたくさんあります。

# もっと古いCGIだと、jcode.pl が使われてるかも知れません。jcode.pl はJcode.pmの前のもので、Perl 4でも動きます。

さて、Jcode.pmを使うのはとっても簡単。
まず、Jcode.pmを使えるようにするには、Perlソースに以下の1行を書きます。

use Jcode;

これだけ。んで、例えば、変数$str1に変換したい元の文字列が格納されているとすると、次のように書くだけで、望みの文字コードに変換した結果が変数$str2に入ります。

$str2 = Jcode->new( $str1, "utf8")->sjis;

上記の場合は、元々UTF-8だった文字列をSHIFT-JISに変更したい場合。
文字コードの指定には、"jis"、"sjis"、 "euc"、"ucs2"、"utf8"が使えます。
で、実は、次のようにも書けます。

$str2 = Jcode::convert( $str1 , "sjis", "utf8" );

この書き方は、jcode.pl と同じ書き方です。第2引数が欲しい(変換後の)文字コード。第3引数が元の文字コードです。なんとなく、感覚的に順序が逆のような感じもするので注意が必要です。(^^;) 上記は、UTF-8な文字列をSHIFT-JISに変換してるのであって、SHIFT-JISをUTF-8にしてるわけではありません。

Perl 5.8.0以降で実行することを前提にするなら、標準のEncodeモジュールを使うことでも変換できます。

use Encode;

としておいて、

from_to($str, 'utf8', 'shiftjis');

と書けば、変数$strに格納されているUTF-8な文字列が、SHIFT-JISに変換されます。(変数$strの中身が書き換えられます。)

まあ、配布するCGIを書くんなら、Jcode.pmを使っとけばいいんではないかと。
標準のEncodeモジュールは日本語以外も扱えますけど。

参考:
Jcode.pm
日本語 Perl ガイド

=== 追記 ===
モジュール名は Jcode です。JCode とかじゃないので気を付けましょう。(^^;;;
大文字なのは J だけです。あとは小文字。
これを間違えると、「そんなモジュールはねえ!」と怒られますので…。(笑)
…誰も間違えないか。^^;;;
私はこれを間違えて、ずいぶん煮詰まっちゃったよ。

=== さらに追記 ===
(メモ) Perl 5.8.x における日本語コード変換のメモ

コメント

$str2 = Jcode::convert( $str1 , "sjis", "utf8" );

このことで、ず~と悩んでいました。
引数が逆だったんですね。
タイムリーな情報感謝です。

投稿者 疾風 : 2006年05月06日 20:07

疾風さん、こんにちは。

この第2引数と第3引数、感覚的に逆ですよね?やっぱり。(笑)

投稿者 にしし : 2006年05月07日 00:04

コメント数: 2件

コメント投稿欄 この日記に対するコメント投稿を歓迎します。

保存しますか?



※本文中にURLは書けません。(書くと投稿が拒否されますのでご注意下さい。)

※投稿内容は、実際にページ上に掲載される前に、管理者によって確認される設定にしている場合があります。その場合は、投稿後にその旨が表示されます。たいてい1~2日以内には表示されるはずですので、気長にお待ち願います。m(_ _)m

トラックバック

このエントリーへのトラックバックURLを表示するにはここをクリック
※スパム防止のため、トラックバックURLは別ウインドウで表示します。(JavaScriptが有効でないと表示されません。)

このリストは、次のエントリーを参照しています: Jcode.pmを使って文字コードを変換する:

» PCトラブル from はろーねっと
興味深い内容で、とても楽しく読ませていただきました。

トラックバック時刻: 2006年03月04日 08:05

--- 当サイト内を検索 ---