テキスト処理
テキスト処理:記事リスト
テキスト処理のカテゴリーには以下の記事がリストされています。
\x(¥x)から始まるUnicode文字列を読めるようにする
\x(¥x)から始まるUnicode文字列を読めるようにする方法を紹介します。
例えば、下記のようなログが出力された場合、
Perlを利用することで 読むことが出来るようなります。
File system error. Filename: /usr/bin/pdgyjqltyz \xe3\x81\x9d\xe3\x81\xae\xe3\x82\x88\xe3\x81\x86\xe3\x81\xaa\xe3\x83\x95\ xe3\x82\xa1\xe3\x82\xa4\xe3\x83\xab\xe3\x82\x84\xe3\x83\x87\xe3\x82\xa3\xe3\x8 3\xac\xe3\x82\xaf\xe3\x83\x88\xe3\x83\xaa\xe3\x81\xaf\xe3\x81\x82\xe3\x82\x8a\ xe3\x81\xbe\xe3\x81\x9b\xe3\x82\x93
Zip形式で圧縮されたファイルから特定の文字列を含む行を抽出する
gzipコマンドを使用して圧縮保存されたファイルに文字列検索を行う場合、
grepやegrepコマンドでは検索できません。
圧縮ファイルを検索するには、zgrepコマンド、zegrepコマンドを使用します。
両コマンドとも、基本操作はgrepコマンドと変わりません。
引数にマッチさせたいパターン、検索したいファイルを指定して実行します。
grepコマンド圧縮ファイルを検索する
[pakira@Tiger work]$ grep -i 'new' country_list.txt.gz
↑圧縮ファイル「country_list.txt.gz」をgrepコマンドで大文字小文字を区別せずに「new」で検索します。
[pakira@Tiger work]$ ←圧縮ファイルなので検索できません。
zgrepコマンド圧縮ファイルを検索する
[pakira@Tiger work]$ zgrep -i "new" country_list.txt.gz
↑圧縮ファイル「country_list.txt.gz」をzgrepコマンドで大文字小文字を区別せずに「new」で検索します。
New Zealand
Papua New Guinea
↑条件にマッチした行が表示されます。
zegrepコマンド圧縮ファイルを検索する
[pakira@Tiger work]$ zegrep -i "new" country_list.txt.gz
↑圧縮ファイル「country_list.txt.gz」をzegrepコマンドで大文字小文字を区別せずに「new」で検索します。
New Zealand
Papua New Guinea
↑条件にマッチした行が表示されます。
MIMEでエンコードされたテキストを読めるように変換する
MIMEとは電子メールを拡張するための仕様ですが、その中でメールのSubjectに
日本語を使えるようにする拡張があります。
MIMEで記述された(エンコード)メールは、テキストで見ると意味不明なASCII文字の羅列ですが、
このMIMEをコード変換(デコード)すると通常の文字としてみることが出来ます。
-m MIMEエンコード文字をデコードする
-M 文字列をMIMEエンコードする
テキストを他のOSとの間でやりとりできるように変換する
テキストは使用しているOS(WindowsやMac)によって、文字コードや
改行コードが異なっている為、それらのOS間でテキストをやりとりすると
文字化けが発生してしまいます。
このような場合には、nkfコマンド使用して正しく読み込めるコードへの
変換を行います。
-s シフトJISコードで表示する
-e EUCコードで表示する
-j JISコードで表示する
-S 入力データをシフトJISコードとして扱う
-E 入力データをEUCコードとして扱う
-J 入力データをJISコードとして扱う
vi(vim)で文字列を検索する方法|次へ移動・ハイライト消去・置換まで
「検索して黄色くハイライトされた色を消す方法が分からない」
Linuxを触り始めたばかりの方が、vi(vim)エディタで必ず直面する悩みです。
この記事では、Linuxの標準エディタであるvi(vim)で文字列を検索・置換する実践的なコマンドを解説します。基本的な検索から、次の候補への移動、ハイライトの消し方まで、現場のエンジニアが息をするように使っている必須の操作手順をまとめました。
1. viエディタでの基本的な検索コマンド(/ と ?)
viエディタで検索を行うには、必ず「コマンドモード(文字入力ができない状態)」になっている必要があります。もし文字入力中(挿入モード)であれば、一度Esc キーを押してください。下方向(ファイルの終わりに向かって)検索する
現在のカーソル位置から下に向かって検索するには、/(スラッシュ) を入力してから検索したい文字列を打ち込み、Enter を押します。/error
上方向(ファイルの先頭に向かって)検索する
逆に、現在のカーソル位置から上に向かって検索したい場合は、?(ハテナ) を使います。ログファイルの末尾から過去に遡ってエラーを探す際などによく使います。?warning
