| perljp Dokumentation zu Perl 5.10.1 | Download als POD | Wie kann ich hier etwas ändern? |
7bit-jis AdobeStandardEncoding AdobeSymbol AdobeZdingbat ascii big5 big5-hkscs cp1006 cp1026 cp1047 cp1250 cp1251 cp1252 cp1253 cp1254 cp1255 cp1256 cp1257 cp1258 cp37 cp424 cp437 cp500 cp737 cp775 cp850 cp852 cp855 cp856 cp857 cp860 cp861 cp862 cp863 cp864 cp865 cp866 cp869 cp874 cp875 cp932 cp936 cp949 cp950 dingbats euc-cn euc-jp euc-kr gb12345-raw gb2312-raw gsm0338 hp-roman8 hz iso-2022-jp iso-2022-jp-1 iso-8859-1 iso-8859-10 iso-8859-11 iso-8859-13 iso-8859-14 iso-8859-15 iso-8859-16 iso-8859-2 iso-8859-3 iso-8859-4 iso-8859-5 iso-8859-6 iso-8859-7 iso-8859-8 iso-8859-9 iso-ir-165 jis0201-raw jis0208-raw jis0212-raw johab koi8-f koi8-r koi8-u ksc5601-raw MacArabic MacCentralEurRoman MacChineseSimp MacChineseTrad MacCroatian MacCyrillic MacDingbats MacFarsi MacGreek MacHebrew MacIcelandic MacJapanese MacKorean MacRoman MacRomanian MacRumanian MacSami MacSymbol MacThai MacTurkish MacUkrainian nextstep posix-bc shiftjis symbol UCS-2BE UCS-2LE UTF-16 UTF-16BE UTF-16LE UTF-32 UTF-32BE UTF-32LE utf8 viscii(全114種類) 例えば、文字コードFOOのファイルをUTF-8に変換するには、以下のようにします。
perl -Mencoding=FOO,STDOUT,utf8 -pe1 < file.FOO > file.utf8
また、Perlには、全部がPerlで書かれた文字コード変換ユーティリティ、piconvも付属しているので、以下のようにすることもできます。
piconv -f FOO -t utf8 < file.FOO > file.utf8 piconv -f utf8 -t FOO < file.utf8 > file.FOO
入出力
以下の例はいづれもShift_JISの入力をEUC-JPに変換して出力します。
# jcode.pl
require "jcode.pl";
while(<>){
jcode::convert(*_, 'euc', 'sjis');
print;
}
# Jcode.pm
use Jcode;
while(<>){
print Jcode->new($_, 'sjis')->euc;
}
# Perl 5.8
use Encode;
while(<>){
from_to($_, 'shiftjis', 'euc-jp');
print;
}
# Perl 5.8 - encoding を利用して
use encoding 'euc-jp', STDIN => 'shiftjis';
while(<>){
print;
}
Jperl 互換スクリプト
いわゆる"shebang"を変更するだけで、Jperl用のscriptのほとんどは変更なしに利用可能だと思われます。 #!/path/to/jperl ↓ #!/path/to/perl -Mencoding=euc-jp 詳しくは perldoc encoding を参照してください。
perldoc perlunicode # PerlのUnicodeサポート全般 perldoc Encode # Encodeモジュールに関して perldoc Encode::JP # うち日本語文字コードに関して
Perl ホームページ (O'Reilly and Associates)
CPAN (Comprehensive Perl Archive Network)
Perl メーリングリスト集
O'Reilly 社のPerl関連書籍(繁体字中国語)
O'Reilly 社のPerl関連書籍(簡体字中国語)
オライリー社のPerl関連書籍(日本語)
中国(中華人民共和国)
日本
韓国(大韓民国)
台湾(中華民国)
Unicode コンソーシアム (Unicode規格の選定団体)
UTF-8 and Unicode FAQ for Unix/Linux
UTF-8 and Unicode FAQ for Unix/Linux (ハングル訳)
| I | Attachment | Action | Size | Date | Who | Comment |
|---|---|---|---|---|---|---|
| |
perljp-5.10.1.pod | manage | 7.6 K | 2010-02-05 - 21:07 | HaraldBongartz | perljp von Perl 5.10.1, konvertiert von EUC-JP in UTF-8 |