'dd' I / O読み取りエラーは常にハードウェアエラーを表しますか?

'dd' I / O読み取りエラーは常にハードウェアエラーを表しますか?

2TBドライブ2個を購入しました。そのうちの1つはHFS +(ジャーナリングされていない)ファイルシステムでフォーマットされていますrsyncdd

root@deb-server:/home/adm_user# dd if=/dev/sdb bs=32M | pv -s 2000G | dd of=/dev/sdc bs=32M
dd: error reading ‘/dev/sdb’: Input/output error              ]  0% ETA 28:24:40
75+1 records in
75+1 records out
2519728128 bytes (2.5 GB) copied2.35GiB 0:02:00 [19.9MiB/s] [>                                ]  0%             
, 120.663 s, 20.9 MB/s
0+36998 records in
0+36998 records out
2519728128 bytes (2.5 GB) copied, 125.599 s, 20.1 MB/s

root@deb-server:/home/adm_user# dd if=/dev/sdb bs=1M | pv -s 2000G | dd of=/dev/sdc bs=1M
dd: error reading ‘/dev/sdb’: Input/output error              ]  0% ETA 26:07:44
10333+1 records in
10333+1 records out
10.1GiB 0:07:57 [21.6MiB/s] [>                                ]  0%             
10835591168 bytes (11 GB) copied, 477.965 s, 22.7 MB/s
0+152209 records in
0+152209 records out
10835591168 bytes (11 GB) copied, 478.852 s, 22.6 MB/s

root@deb-server:/home/adm_user# dd if=/dev/sdb bs=1M | pv -s 2000G | dd of=/dev/sdc bs=1M
dd: error reading ‘/dev/sdb’: Input/output error              ]  0% ETA 25:55:35
13796+1 records in136KiB/s] [>                                ]  0% ETA 25:58:01
13796+1 records out
14466285568 bytes (14 GB) copied13.5GiB 0:10:34 [21.7MiB/s] [>                                ]  0%             
, 634.609 s, 22.8 MB/s
0+202579 records in
0+202579 records out
14466285568 bytes (14 GB) copied, 635.957 s, 22.7 MB/s

root@deb-server:/home/adm_user# dd if=/dev/sdb of=/dev/sdc
dd: error reading ‘/dev/sdb’: Input/output error
186677728+0 records in
186677728+0 records out
95578996736 bytes (96 GB) copied, 13782 s, 6.9 MB/s

root@deb-server:/home/adm_user# dd if=/dev/sdb of=/dev/sdc
dd: error reading ‘/dev/sdb’: Input/output error
167896800+0 records in
167896800+0 records out
85963161600 bytes (86 GB) copied, 12391.2 s, 6.9 MB/s

エラーはまったく同じ場所では発生しません。これは、ディスクの不良セクタに当たらないことを意味します。ご覧のとおり、私は使用せずに、より適切なブロックサイズを試してみました。pvこれはさらに進歩しているように見えますが、それでもエラーが発生します。何度も試してみましたが、すべて異なる点で同じエラーが発生しました。

同様の問題について数十のフォーラムの投稿とStack Exchangeの記事を読みました。結論は常に「ddI / Oエラー==ディスクエラー」のようです。この問題を説明している他の人は通常、古いまたは既知の不良ディスクを回復しようとしますが、この場合、ハードウェア障害が発生する可能性はほとんどありません。これは2つの新しいディスク(HGSTのよく知られたモデル)とUSBエンクロージャでした。何はいディスク上のファイルは破損している可能性があります。さまざまな期間と条件を持つ12の異なるディスクでマージされました。私が理解したのは、ファイルシステムやファイルエラーはブロックコピーとは関係ありません(パーティションもディスクに複製されていません)。

エラーにコピーを続行するように指示できることがわかりますdd。次のステップは、rsyncを使用して(おそらくはるかに遅い)ファイルシステムレベルのバックアップを実行することです。しかし、まずディスクが良いかどうかをもっと確信したいと思います。私はいくつかの異なる説明を検討しましたが、このエラーを診断する方法についてのガイドラインを探しています。他の可能性:

  • 限られたリソース:Debianシステムには約6.5GBの空きRAMと2.4GBの空きディスク容量があります。
  • USB帯域幅:システムには、両方のドライブを接続するUSB​​ 2.0ポートのみがあります(外部電源)。ddリンクが許可するよりも早く読み込もうとしてエラーが発生した可能性がありますか?
  • hdparmまた、キャッシュサイズなどの一部の欠落情報も見つかりました。ディスクの一部のドライバのサポートが欠落している可能性はありますか?

    /dev/sdb:
    
    ATA device, with non-removable media
        Model Number:       Hitachi HUA723020ALA641                 
        Serial Number:      YGHJ32SD            
        Firmware Revision:  MK7OA840
        Transport:          Serial, ATA8-AST, SATA 1.0a, SATA II Extensions, SATA Rev 2.5, SATA Rev 2.6; Revision: ATA8-AST T13 Project D1697 Revision 0b
    Standards:
        Used: unknown (minor revision code 0x0029)
        Supported: 8 7 6 5 
        Likely used: 8
    Configuration:
        Logical             max     current
        cylinders   16383   16383
        heads               16      16
        sectors/track       63      63
        --
        CHS current addressable sectors:   16514064
        LBA    user addressable sectors:  268435455
        LBA48  user addressable sectors: 3907029168
        Logical  Sector size:                   512 bytes
        Physical Sector size:                   512 bytes
        device size with M = 1024*1024:     1907729 MBytes
        device size with M = 1000*1000:     2000398 MBytes (2000 GB)
        cache/buffer size  = unknown
        Form Factor: 3.5 inch
        Nominal Media Rotation Rate: 7200
        [...]
    
  • 編集する:私が確認した提案に基づいています/var/log/messages。これには、以下のように複数のシーケンスが含まれています。これは、読み取りプロセス中にUSBコントローラがクラッシュ/失敗し、ディスクが失われたことを示しますか?

    Dec 11 10:15:26 deb-server kernel: [409707.840187] usb 2-1.8: USB disconnect, device number 17
    Dec 11 10:15:26 deb-server kernel: [409707.847408] sd 19:0:0:0: [sdb] Unhandled error code
    Dec 11 10:15:26 deb-server kernel: [409707.847412] sd 19:0:0:0: [sdb]  
    Dec 11 10:15:26 deb-server kernel: [409707.847413] Result: hostbyte=DID_NO_CONNECT driverbyte=DRIVER_OK
    Dec 11 10:15:26 deb-server kernel: [409707.847414] sd 19:0:0:0: [sdb] CDB: 
    Dec 11 10:15:26 deb-server kernel: [409707.847415] Read(10): 28 00 00 5e 93 00 00 00 f0 00
    Dec 11 10:15:26 deb-server kernel: [409707.847423] quiet_error: 22 callbacks suppressed
    Dec 11 10:15:26 deb-server kernel: [409707.847473] sd 19:0:0:0: [sdb] Unhandled error code
    Dec 11 10:15:26 deb-server kernel: [409707.847474] sd 19:0:0:0: [sdb]  
    Dec 11 10:15:26 deb-server kernel: [409707.847475] Result: hostbyte=DID_NO_CONNECT driverbyte=DRIVER_OK
    Dec 11 10:15:26 deb-server kernel: [409707.847476] sd 19:0:0:0: [sdb] CDB: 
    Dec 11 10:15:26 deb-server kernel: [409707.847477] Read(10): 28 00 00 5e 93 f0 00 00 10 00
    Dec 11 10:15:27 deb-server kernel: [409708.303411] usb 2-1.8: new high-speed USB device number 18 using ehci-pci
    Dec 11 10:15:27 deb-server kernel: [409708.396916] usb 2-1.8: New USB device found, idVendor=2537, idProduct=1066
    Dec 11 10:15:27 deb-server kernel: [409708.396921] usb 2-1.8: New USB device strings: Mfr=1, Product=2, SerialNumber=3
    Dec 11 10:15:27 deb-server kernel: [409708.396924] usb 2-1.8: Product: NS1066
    Dec 11 10:15:27 deb-server kernel: [409708.396926] usb 2-1.8: Manufacturer: Norelsys
    Dec 11 10:15:27 deb-server kernel: [409708.396928] usb 2-1.8: SerialNumber: 0123456789ABCDE
    Dec 11 10:15:27 deb-server kernel: [409708.397214] usb-storage 2-1.8:1.0: USB Mass Storage device detected
    Dec 11 10:15:27 deb-server kernel: [409708.397573] scsi20 : usb-storage 2-1.8:1.0
    Dec 11 10:15:27 deb-server kernel: [409708.984090]  sdc: sdc1
    Dec 11 10:15:28 deb-server kernel: [409709.916622] scsi 20:0:0:0: Direct-Access     ATA      Hitachi HUA72302 A840 PQ: 0 ANSI: 6
    Dec 11 10:15:28 deb-server kernel: [409709.916953] sd 20:0:0:0: Attached scsi generic sg2 type 0
    Dec 11 10:15:28 deb-server kernel: [409709.917560] sd 20:0:0:0: [sdb] 3907029168 512-byte logical blocks: (2.00 TB/1.81 TiB)
    Dec 11 10:15:28 deb-server kernel: [409709.918568] sd 20:0:0:0: [sdb] Write Protect is off
    Dec 11 10:15:28 deb-server kernel: [409709.919565] sd 20:0:0:0: [sdb] Write cache: disabled, read cache: enabled, doesn't support DPO or FUA
    Dec 11 10:15:28 deb-server kernel: [409709.927455]  sdb: sdb1
    Dec 11 10:15:28 deb-server kernel: [409709.930559] sd 20:0:0:0: [sdb] Attached SCSI disk
    

ベストアンサー1

ハードウェアエラーが何を意味するかによって異なりますが、そうです。これは一種のハードウェアの問題です。

一時的な問題(電源装置、過熱、または単純な通信エラー)、または電源装置、ケーブル、ハードドライブ(またはまれに一部のコントローラチップ)の実際のハードウェアの問題です。

ディスクの問題が解決されるまで、ハードドライブのさらなる損傷を防ぐためにサービスを中断してdd使用してください。rescuedd

おすすめ記事