データの最後の行の下に不要な空き領域があるファイルをクリーンアップするのに問題があります。 Excelからデータをコピーしてテキストに貼り付けると生成されます。私のテキストファイルが私のデータにのみ合うようにしたいです。これにより、モデルの実行時に計算時間が短縮されます。データの最後の行の下に余分な空き領域があるため、ファイルサイズが大きいことがわかりました。
不要な行を整理する方法を助けてほしいです。
ベストアンサー1
awk '{l=l$0 RT};NF{printf "%s",l;l=""}' < your-file
末尾の空白行が削除されます。
ファイルが大きい場合は、空白ではなく最初の行が見つかるまで最後から読む必要があります。
GNUツールの使用:
tac your-file | sed -ne '/[^[:blank:]]/!{p;d;}' -e q | wc -c
末尾の空行のサイズを返します。
これを使用してファイルを切り取ることができます。
例えばbash
:
find . -type f -name '*.txt' -print0 |
while IFS= read -rd '' file; do
n=$(tac "$file" | sed -ne '/[^[:blank:]]/!{p;d;}' -e q | wc -c)
[ "$n" -eq 0 ] || truncate -r "$file" "-s-$n" "$file"
done