CSVファイルから二重引用符で囲まれた数字のカンマのみを削除します。

Question

Perlが大丈夫なら、ここに短い（必ずしも簡単ではありませんが、おそらく高速です：））方法があります：

perl -pe 's:"(\d[\d,]+)":$1=~y/,//dr:eg' file

e演算子のフラグ（s:::作成する別の方法s///）は、置換が毎回評価される式として処理されるようにします。この式は$1正規表現（すでに引用符がありません）からキャプチャを取得し、すべてのカンマ（y///、で書くこともできます）を削除（）して変換します。（翻訳数の代わりに）翻訳された文字列の値を取得するには、toフラグを使用する必要があります。tr////dry

Perlに汚染されていると感じる人のために、Pythonと同等のものがあります。 Pythonは実際には1行のシェルではありませんが、時には協力するように導くことができます。以下は1行で書くことができますが（forできないループとは異なり）、水平スクロールを使用すると読み取りが（さらに）難しくなります。

python -c '
import re;
import sys;
r=re.compile("\"(\d+(,\d+)*)\"");
all(not sys.stdout.write(r.sub(lambda m:m.group(1).replace(",",""),l))
    for l in sys.stdin)
' < file

Answer 1

Perlが大丈夫なら、ここに短い（必ずしも簡単ではありませんが、おそらく高速です：））方法があります：

perl -pe 's:"(\d[\d,]+)":$1=~y/,//dr:eg' file

e演算子のフラグ（s:::作成する別の方法s///）は、置換が毎回評価される式として処理されるようにします。この式は$1正規表現（すでに引用符がありません）からキャプチャを取得し、すべてのカンマ（y///、で書くこともできます）を削除（）して変換します。（翻訳数の代わりに）翻訳された文字列の値を取得するには、toフラグを使用する必要があります。tr////dry

Perlに汚染されていると感じる人のために、Pythonと同等のものがあります。 Pythonは実際には1行のシェルではありませんが、時には協力するように導くことができます。以下は1行で書くことができますが（forできないループとは異なり）、水平スクロールを使用すると読み取りが（さらに）難しくなります。

python -c '
import re;
import sys;
r=re.compile("\"(\d+(,\d+)*)\"");
all(not sys.stdout.write(r.sub(lambda m:m.group(1).replace(",",""),l))
    for l in sys.stdin)
' < file

CSVファイルから二重引用符で囲まれた数字のカンマのみを削除します。

ベストアンサー1

おすすめ記事