Linux - GPTを使用したRAID1アレイの不良ブロックの回復

Question

これらすべての「産業刺激」の答えは正直に言うべきではありません。（隠されている可能性がある）ファイルシステムが破損する危険性があります。ディスクに唯一のコピーが保存されているため、データが消えた場合、これは合理的です。しかし、鏡には完璧なコピーがあります。

mdraidに鏡をこすらせるだけです。不良セクタを発見し、自動的に書き換えます。

# echo 'check' > /sys/block/mdX/md/sync_action    # use 'repair' instead for older kernels

正しいデバイスを挿入する必要があります（例：mdXではなくmd0）。デフォルトでは配列全体を処理するため、時間がかかります。まったく新しいカーネルでは、最初にセクタ番号をsync_min / sync_maxに書き込むことで、アレイの一部にのみ制限できます。

これは安全な仕事です。すべてのmdraidデバイスでこれを行うことができます。実際にはしなければならないすべてのmdraidデバイスで定期的にこれを行います。あなたのディストリビューションには、それを処理するためのcronjobが付属している場合があります。これを有効にするには何をすべきですか？

システム内のすべてのRAIDデバイスのスクリプト

しばらく前に、私のシステム上のすべてのRAIDデバイスを「回復」するためにこのスクリプトを書いていました。これは、「修復」だけで不良セクタを修正できる古いカーネルバージョン用に書かれています。今は検査だけで十分です。（最新のカーネルではリカバリはまだうまく機能しますが、パリティを再度コピー/再構築することもあります。特に常に必要ではありません。フラッシュドライブにあります）

#!/bin/bash

save="$(tput sc)";
clear="$(tput rc)$(tput el)";
for sync in /sys/block/md*/md/sync_action; do
    md="$(echo "$sync" | cut -d/ -f4)"
    cmpl="/sys/block/$md/md/sync_completed"

    # check current state and get it repairing.
    read current < "$sync"
    case "$current" in
        idle)
            echo 'repair' > "$sync"
            true
            ;;
        repair)
            echo "WARNING: $md already repairing"
            ;;
        check)
            echo "WARNING: $md checking, aborting check and starting repair"
            echo 'idle' > "$sync"
            echo 'repair' > "$sync"
            ;;
        *)
            echo "ERROR: $md in unknown state $current. ABORT."
            exit 1
            ;;
    esac

    echo -n "Repair $md...$save" >&2
    read current < "$sync"
    while [ "$current" != "idle" ]; do
        read stat < "$cmpl"
        echo -n "$clear $stat" >&2
        sleep 1
        read current < "$sync"
    done
    echo "$clear done." >&2;
done

for dev in /dev/sd?; do
    echo "Starting offline data collection for $dev."
    smartctl -t offline "$dev"
done

check代わりに、repair次の（テストされていない）最初のブロックが機能します。

    case "$current" in
        idle)
            echo 'check' > "$sync"
            true
            ;;
        repair|check)
            echo "NOTE: $md $current already in progress."
            ;;
        *)
            echo "ERROR: $md in unknown state $current. ABORT."
            exit 1
            ;;
    esac

Answer 1

これらすべての「産業刺激」の答えは正直に言うべきではありません。（隠されている可能性がある）ファイルシステムが破損する危険性があります。ディスクに唯一のコピーが保存されているため、データが消えた場合、これは合理的です。しかし、鏡には完璧なコピーがあります。

mdraidに鏡をこすらせるだけです。不良セクタを発見し、自動的に書き換えます。

# echo 'check' > /sys/block/mdX/md/sync_action    # use 'repair' instead for older kernels

正しいデバイスを挿入する必要があります（例：mdXではなくmd0）。デフォルトでは配列全体を処理するため、時間がかかります。まったく新しいカーネルでは、最初にセクタ番号をsync_min / sync_maxに書き込むことで、アレイの一部にのみ制限できます。

これは安全な仕事です。すべてのmdraidデバイスでこれを行うことができます。実際にはしなければならないすべてのmdraidデバイスで定期的にこれを行います。あなたのディストリビューションには、それを処理するためのcronjobが付属している場合があります。これを有効にするには何をすべきですか？

システム内のすべてのRAIDデバイスのスクリプト

しばらく前に、私のシステム上のすべてのRAIDデバイスを「回復」するためにこのスクリプトを書いていました。これは、「修復」だけで不良セクタを修正できる古いカーネルバージョン用に書かれています。今は検査だけで十分です。（最新のカーネルではリカバリはまだうまく機能しますが、パリティを再度コピー/再構築することもあります。特に常に必要ではありません。フラッシュドライブにあります）

#!/bin/bash

save="$(tput sc)";
clear="$(tput rc)$(tput el)";
for sync in /sys/block/md*/md/sync_action; do
    md="$(echo "$sync" | cut -d/ -f4)"
    cmpl="/sys/block/$md/md/sync_completed"

    # check current state and get it repairing.
    read current < "$sync"
    case "$current" in
        idle)
            echo 'repair' > "$sync"
            true
            ;;
        repair)
            echo "WARNING: $md already repairing"
            ;;
        check)
            echo "WARNING: $md checking, aborting check and starting repair"
            echo 'idle' > "$sync"
            echo 'repair' > "$sync"
            ;;
        *)
            echo "ERROR: $md in unknown state $current. ABORT."
            exit 1
            ;;
    esac

    echo -n "Repair $md...$save" >&2
    read current < "$sync"
    while [ "$current" != "idle" ]; do
        read stat < "$cmpl"
        echo -n "$clear $stat" >&2
        sleep 1
        read current < "$sync"
    done
    echo "$clear done." >&2;
done

for dev in /dev/sd?; do
    echo "Starting offline data collection for $dev."
    smartctl -t offline "$dev"
done

check代わりに、repair次の（テストされていない）最初のブロックが機能します。

    case "$current" in
        idle)
            echo 'check' > "$sync"
            true
            ;;
        repair|check)
            echo "NOTE: $md $current already in progress."
            ;;
        *)
            echo "ERROR: $md in unknown state $current. ABORT."
            exit 1
            ;;
    esac

Linux - GPTを使用したRAID1アレイの不良ブロックの回復

編集1：

編集2

編集3

ベストアンサー1

システム内のすべてのRAIDデバイスのスクリプト

おすすめ記事