読者です 読者をやめる 読者になる 読者になる

nkfメモ

たまに使いますが、毎回使い方忘れているのでメモ。

文字コードを推定(guess)する


試したファイルの文字コードShift_JISでした。
(ちなみに日本全国の郵便番号データです)

$ nkf -g KEN_ALL.CSV
Shift_JIS

文字コードを変換する


ファイルの文字コードを変換します。

EUC-JPに変換する
$ nkf -e < original.csv > translate.csv
Shift_JISに変換する
$ nkf -s < original.csv > translate.csv
UTF-8に変換する
$ nkf -w < original.csv > translate.csv


上の例は別ファイルに出力するやり方です。元ファイルに上書きでよければ「--overwrite」オプションを使えばOK

$ nkf -w --overwrite original.csv


まとめて変換する事もできます。

$ nkf -w --overwrite *.csv

改行コードを変更する


ファイルの改行コードが「-Lu」で「LF」、「-Lw」で「CRLF」、「-Lm」で「CR」になります。

$ nkf -w -Lu < KEN_ALL.CSV > unix.csv
$ file unix.csv 
unix.csv: UTF-8 Unicode text

$ nkf -w -Lw < KEN_ALL.CSV > windows.csv
$ file windows.csv 
windows.csv: UTF-8 Unicode text, with CRLF line terminators

$ nkf -w -Lm < KEN_ALL.CSV > mac.csv
$ file mac.csv 
mac.csv: UTF-8 Unicode text, with CR line terminators


今日はこんなところで。