NumPy 2D配列のスライス、またはnxn配列（n>m）からmxmサブマトリックスを抽出するにはどうすればいいですか？質問する

Question

この質問に答えるには、Numpy で多次元配列のインデックス付けがどのように機能するかを確認する必要があります。まず、x質問の配列があるとします。に割り当てられたバッファには、x0 から 15 までの 16 個の昇順の整数が含まれます。 1 つの要素 (たとえば ) にアクセスする場合x[i,j]、NumPy はバッファの先頭を基準としたこの要素のメモリ位置を把握する必要があります。これは、実際にはを計算することによって行われますi*x.shape[1]+j(実際のメモリオフセットを取得するには、int のサイズを乗算します)。

のような基本的なスライスによってサブ配列を抽出するとy = x[0:2,0:2]、結果のオブジェクトは基になるバッファをと共有しますx。しかし、にアクセスするとどうなるでしょうか。に属するデータはメモリ内で連続していないため、NumPy はを使用して配列へのオフセットを計算することy[i,j]ができません。i*y.shape[1]+jy

NumPyは、この問題を次のように解決します。進歩にアクセスするためのメモリオフセットを計算する場合x[i,j]、実際に計算されるのは次のようになりますi*x.strides[0]+j*x.strides[1](これには、int のサイズの係数がすでに含まれています)。

x.strides
(16, 4)

上記のように抽出されるとy、NumPyは新しいバッファを作成しませんが、する同じバッファを参照する新しい配列オブジェクトを作成します (そうでない場合yはと等しくなりますx)。新しい配列オブジェクトは異なる形状になり、バッファへの開始オフセットも異なる可能性がありますが、ストライドは(少なくともこの場合は)xと共通になります。x

y.shape
(2,2)
y.strides
(16, 4)

この方法では、メモリオフセットを計算するとy[i,j]正しい結果が得られます。

しかし、NumPyはのような場合どうすればよいのでしょうかz=x[[1,3]]? 元のバッファがに使用されている場合、ストライドメカニズムでは正しいインデックス付けができませんz。NumPyは理論的にはできたストライドよりも洗練されたメカニズムを追加しますが、これにより要素へのアクセスが比較的高価になり、配列の全体的な概念に反することになります。さらに、ビューはもはや本当に軽量なオブジェクトではなくなります。

これについては、インデックスに関するNumPyドキュメント。

ああ、実際の質問を忘れるところでした。複数のリストでインデックスを期待どおりに機能させる方法は次のとおりです。

x[[[1],[3]],[1,3]]

これは、インデックス配列が放送された一般的な形状に。もちろん、この特定の例では、基本的なスライスでも十分です。

x[1::2, 1::2]

Answer 1