テキスト処理

HOMELinuxtips > テキスト処理

テキスト処理:記事リスト

テキスト処理のカテゴリーには以下の記事がリストされています。

columnコマンドでテキストを表形式に整形する方法|TSVやログをきれいに揃える実践例も

「ログファイルをcatで見ると列がズレていて読みにくい」
「awkでCSVを処理したはいいが、出力がぐちゃぐちゃで確認しにくい」

こういった場面でサッと使えるのが column コマンドです。
パイプで繋ぐだけで、バラバラな列を整然と揃えてくれる地味ながら強力なツールです。

この記事では、columnコマンドの基本的な使い方から、TSV・CSV・ログ整形への応用、よく詰まるポイントまでを解説します。
RHEL 9.4 / Ubuntu 24.04 LTSで動作確認済みです。

この記事のポイント

・column -t でスペース区切りのテキストをテーブル整形できる
・-s オプションで区切り文字を指定しCSV・TSVにも対応できる
・パイプで繋ぐだけなので他コマンドと自由に組み合わせられる
・util-linux版とBSD版で -s オプションの挙動が異なる点に注意

続きを読む "columnコマンドでテキストを表形式に整形する方法|TSVやログをきれいに揃える実践例も"

\\x(¥x)から始まるUnicode文字列を読めるようにする

「Apacheのアクセスログに \xe3\x81\x9d のような文字化けした文字列が出ていて読めない」
「Tripwireの改ざん検知ログに \x から始まる謎の文字列が表示された」

このような \x から始まる文字列はUTF-8のバイト列をエスケープした形式で、
Perlを使えば日本語に変換して読むことができます。

この記事では、\x から始まるUnicode文字列をPerlで読めるようにする方法を解説します。
【この記事でわかること】
\x 始まりの文字列はUTF-8バイト列のエスケープ表現
perl -e 'print "\xe3\x81\x9d..."' で日本語に変換して表示できる
・Pythonを使う方法も同様に利用できる

続きを読む "\\x(¥x)から始まるUnicode文字列を読めるようにする"

Zip形式で圧縮されたファイルから特定の文字列を含む行を抽出する方法|zgrepとzegrepの使い方

「gzip圧縮されたファイルをgrepで検索しようとしたが、結果が出ない」
「.gzファイルを解凍せずにそのまま文字列検索したい」
gzip圧縮ファイル(.gz)に対して通常の grep コマンドを実行しても、バイナリデータとして認識されて正しく検索できません。
そのような場合は zgrepzegrep コマンドを使うと、解凍せずにそのまま文字列を検索できます。

この記事では、zgrepコマンドを使ってgzip圧縮ファイルを検索する方法を解説します。

【この記事でわかること】
・zgrepコマンドで.gzファイルを解凍せずに検索する方法
・zegrepとzfgrepとの違い
・grep・zgrep・zgrepの使い分け
・ローテートされたログファイルを横断検索する実務的な方法

続きを読む "Zip形式で圧縮されたファイルから特定の文字列を含む行を抽出する方法|zgrepとzegrepの使い方"

vi/vimのコマンドモードとインサートモードを切り替える方法|ESC・i・a・o操作と保存・終了まで

「viを起動したけど、文字が入力できない」「どうやって保存して終了するの?」
vi/vimを初めて使ったとき、多くの方がこの壁にぶつかります。

viには「コマンドモード」と「インサートモード」の2つのモードがあり、
この切り替えを理解しないと、文字入力も保存も終了もできません。

この記事では、vi/vimのモード切り替えの仕組みから、
基本操作(i・a・o・ESC)、保存・終了(:wq・:q!)まで、
ひととおりの操作を実際のコマンド例で解説します。

【この記事でわかること】

・vi/vimには「コマンドモード」と「インサートモード」の2種類がある
・インサートモードへの切り替えはi・a・o・Oキーで行う
・ESCキーでコマンドモードに戻り、:wqで保存終了・:q!で破棄終了できる
・現在のモードはvimの画面下部の表示(-- INSERT --など)で確認できる

続きを読む "vi/vimのコマンドモードとインサートモードを切り替える方法|ESC・i・a・o操作と保存・終了まで"

Linux無料マニュアル(図解60P) 名前とメールで30秒登録