複素数 numpy ndarray の abs()**2 を計算する最もメモリ効率の良い方法質問する

Question

感謝numba.vectorizenumba の最近のバージョンでは、このタスク用の numpy ユニバーサル関数を作成するのは非常に簡単です。

@numba.vectorize([numba.float64(numba.complex128),numba.float32(numba.complex64)])
def abs2(x):
    return x.real**2 + x.imag**2

私のマシンでは、中間配列を作成する純粋な NumPy バージョンと比較して 3 倍の速度向上が見られました。

>>> x = np.random.randn(10000).view('c16')
>>> y = abs2(x)
>>> np.all(y == x.real**2 + x.imag**2)   # exactly equal, being the same operation
True
>>> %timeit np.abs(x)**2
10000 loops, best of 3: 81.4 µs per loop
>>> %timeit x.real**2 + x.imag**2
100000 loops, best of 3: 12.7 µs per loop
>>> %timeit abs2(x)
100000 loops, best of 3: 4.6 µs per loop

Answer 1

感謝numba.vectorizenumba の最近のバージョンでは、このタスク用の numpy ユニバーサル関数を作成するのは非常に簡単です。

@numba.vectorize([numba.float64(numba.complex128),numba.float32(numba.complex64)])
def abs2(x):
    return x.real**2 + x.imag**2

私のマシンでは、中間配列を作成する純粋な NumPy バージョンと比較して 3 倍の速度向上が見られました。

>>> x = np.random.randn(10000).view('c16')
>>> y = abs2(x)
>>> np.all(y == x.real**2 + x.imag**2)   # exactly equal, being the same operation
True
>>> %timeit np.abs(x)**2
10000 loops, best of 3: 81.4 µs per loop
>>> %timeit x.real**2 + x.imag**2
100000 loops, best of 3: 12.7 µs per loop
>>> %timeit abs2(x)
100000 loops, best of 3: 4.6 µs per loop

複素数 numpy ndarray の abs()**2 を計算する最もメモリ効率の良い方法質問する

ベストアンサー1

おすすめ記事