Unixでforループを使用してファイルサイズを見つける

Unixでforループを使用してファイルサイズを見つける

次のスクリプトを実行して、forループを使用してディレクトリ内の各ファイルのサイズを取得しようとします。

#!/bin/bash
FILE=/home/cloudera/Desktop/new
for    file in $FILE
do
       size=`du -b ${file} | cut -f1`
       echo $size
done

次のエラーが発生します。

du cannot access /home/cloudera/Desktop/new/a.txt 
du cannot access /home/cloudera/Desktop/new/b.txt 
du cannot access /home/cloudera/Desktop/new/c.txt

そのうち、a.txtとb.txt.c.txtは新しいディレクトリにあるファイルです。

ベストアンサー1

du -b代わりに find と printf を使用することをお勧めします。ここで最大の問題は、duが見つけたすべてのディレクトリに再帰することです。ループforでは個々のファイルを見ることはできません。

find /home/cloudera/Desktop/new -type f -printf "%s %p\n"

見つかった項目に printf がない場合は、次のようにします。

-exec stat -c "%s %n" {} \;

次に、出力をwhileスクリプトにパイプします。

find <what you do above> | 
while read size ; do 
   # whatever
done

編集:SOURCEDIRで各ファイルを見つけて、DESTDIRにファイルが存在しないか存在するがサイズが異なる場合は、ファイルをコピーしたいようです。

CP="echo /bin/cp -f"
sizeof() { stat -c %s "%1" ; }
cd $SOURCEDIR
find . -type f -print |
  while read name; do
    source_size=$(sizeof $SOURCEDIR/$name)
    if [[ -f $DESTDIR/$name ]]; then
      dest_size=$(sizeof $DESTDIR/$name)
      if [[ $source_size == $dest_size ]]; then
        next # do not copy
      fi
    fi
    $CP $SOURCEDIR/$name $DESTDIR/$name
  done

しかし、これは醜く遅いです。cdfindの出力がすべて相対パスであることを確認する必要があります。以降の使用は明確にする$SOURCEDIRために重複します。別の名前sizeofに変更できるようにエイリアスを指定しましたdu -b。出力が正しい場合は、$CP実際のコマンド(remove echo)に変更してください。

これを行う別の方法があります。勉強がうまくいけば、UNIXについてたくさん学ぶことになります。

CP="echo cp"
{ cd $SOURCEDIR ; find . -type f -printf "%s %p\n" |sort -k 2 ; } >/tmp/source.lst
{ cd $DESTDIR   ; find . -type f -printf "%s %p\n" |sort -k 2 ; } >/tmp/dest.lst
awk 'FNR==NR { f[$2]=$1 } !length(f[$2]) || f[$2]!=$1 { print $2 }' /tmp/dest.lst /tmp/source.lst >/tmp/copythese.lst
cat /tmp/copythese.lst | xargs -n 1 -I ^ $CP $SOURCEDIR/^ $DESTDIR/^ 

テストを見てください。その後、リストが正しいと思われる場合は、前のコマンドCPに変更して繰り返します。/bin/cp -f上記の手順を実行しますが、リストを使用しています。 awk コマンドは、ターゲットに存在しないファイルまたはサイズの異なるファイルをソースから検索します。 ($1 はサイズ、$2 はファイル名、$f[$2] はファイルサイズ目的地)。次に、各行に対してxargs1つのインスタンスを実行します。$CPcopythese.lst

おすすめ記事