Linuxでは、次のファイルコンテンツ検索コマンドが必要です。
- md、txt、htm などの指定されたファイルを検索します。
- フォルダとそのサブフォルダで繰り返し実行します(例:)。
- コンテンツ検索は正規表現パターンである可能性があります(例:tomat。* es)。
- 一致する項目の周囲のテキストを出力します。
- 出力は次の形式です。、各ファイルを空行で区切ります。
file1 lineNr1:text1 lineNr2:text2 file2 lineNr1:text1 lineNr2:text2
6/最後の基準である出力は視覚的に明確でなければなりません。したがって、端末でgrepなどのカラースキームを使用してください。
- ファイルの色はcolor_1(紫色など)です。
- color_2のlineNr(例:緑)
- テキスト出力の場合:
- color_3のテキストを一致させます(例:赤)。
- 残りのテキストはcolor_4です(たとえば、白)。
もともと、grepはこれを行いますが、出力形式を変更したいと思います。、今すぐ:
file1:lineNr1:text1
file1:lineNr2:text2
file2:lineNr1:text1
file2:lineNr2:text2
私が望むのは検索結果に集中することですが、ディレクトリ検索を行うときに検索結果の前にファイルパス名があると検索がより複雑になります。ファイルに一致する項目が複数ある場合。私が望むのは、各ファイルが自分が探しているものを直接見ることができることです。ファイル、サブフォルダ、一致が多いほど、明確なフォーカスが重要になります。
したがって、grepは長い出力を提供し、フォーカスを失います。おそらくgrepコマンドの新機能として要求する必要があります。
欲しいものに近いです。
test.txtに次の2つの文があるとします。
2023-09-25: after colon char does not output the sentence.
2023-09-25 outputs line as there is NO colon preceding match.
次に、次のcliを実行します。
grep -rwn --include=\*.{md,txt} -ie "output.*" --color=always | awk -F: '{if(f!=$1)print "\n"$1; f=$1; print $2 ":" $3;}'
この例では、1行目の出力は「:」で停止し、2行目では美しい出力が表示されます。添付ファイルを参照
したがって、一致するテキストにコロン ":" が含まれていない場合、このクエリは操作を実行します。一致の周りにテキスト出力がないため、検索出力の使い勝手が悪くなります。
より複雑な例(txtファイルを添付できません):
utf-8 encoded
# We're interested in searching on the word: tomato or tomate in french
In markdown file it can be put in bold using **tomatoes**
In a html file, content is full of tags, put a word in bold can be put in many way, such as <b>tomato</b>
Let's see what the search will return on these combinations:
1. At 6:45 will eat tomato soup.
2. Tomatoes were cooked for the soup recipe, but what time do we eat tomato soup? Isn't it six forty-five, aka 6:45?
3. Tomate en français
4. tomates: pluriel du mot tomate.
Could be tricky to restrict search only on bilingual TOMATO's variation, as for instance in automatically, there is auTOMATically.
Regular expression are of help.
一致が2つのサブフォルダにあると仮定すると、このCLIは次のように明確に説明します。
grep -rn --include=\*.{md,txt} -iP "tomat[eo]s*" --color=always | awk -F: '{if(f!=$1)print "\n"$1; f=$1; print $2 ":" $3;}'
ただし、追加出力コロン文字 ":" 以降の内容は出力には現れません。、コロン ":" を ";" に変更すると、違いを見ることができます。
出力検索結果をプレーンテキストファイルにダンプしようとすると、カラースキームが失われると視覚情報が失われます。したがって、タグを含むhtmlファイルは色情報を回復します。これは、次のhtml出力で実行できます。:
<div class="grep">
<p class="grep_file">file_1</p>
<span class="grep_line">lineNr1</span>:beginning of surrounding match<span class="grep_match">SEARCH_PATTERN</span>end of surrounding match<br>
<span class="grep_line">lineNr2</span>:beginning of surrounding match<span class="grep_match">SEARCH_PATTERN</span>end of surrounding match<br>
</div>
<div class="grep">
<p class="grep_file">file_2</p>
<span class="grep_line">lineNr1</span>:beginning of surrounding match<span class="grep_match">SEARCH_PATTERN</span>end of surrounding match<br>
<span class="grep_line">lineNr2</span>:beginning of surrounding match<span class="grep_match">SEARCH_PATTERN</span>end of surrounding match<br>
</div>
スタイルクラスでカラースキームを取得できます。
さて、grepとawkを試してみましたが、他の組み合わせが仕事にとってより良いアイデアかもしれません。
ありがとう
ベストアンサー1
私考えるあなたが望むものは次のとおりです。
$ grep -rwn --include=\*.{md,txt} -ie "output.*" --color=always | awk -F: '{if(f!=$1){print "\n"$1;}f=$1; $1=""; }1'
file.txt
1 2023-09-25 after colon char does not output the sentence.
2 2023-09-25 outputs line as there is NO colon preceding match.
file1.txt
1 2023-09-25 after colon char does not output the sentence.
2 2023-09-25 outputs line as there is NO colon preceding match.
次のようになります。
アプローチの問題は、:
フィールド区切り文字として使用し、フィールド2と3のみを明示的に印刷することです。したがって、:
行にさらに多くのフィールドがある場合は、残りのフィールドを見逃す可能性があります。ここで行うことは、最初のフィールド($1=""
)をクリアしてから行全体を印刷することです(1;
行を印刷します)。awk
1
awk
わかりやすくするために、コードを次のように拡張できます。
awk -F: '
{
## If this is a new file name, print the file name
if ( f != $1 ){
print "\n"$1
}
## save the 1st field in the variable f
f=$1
## clear the first field
$1=""
## print the line
print
}'
重要:ファイル名自体に:
。file:weird.txt
これを処理することは可能ですが、より多くのスクリプトが必要なので、これが問題の場合は、より多くのサンプルファイル名を含めるように質問を更新するか、新しい質問を投稿してください。