TensorFlow バッチ画像操作質問する

2024-07-07 • tag-icon

tensorflow

TensorFlow には、トレーニング中に入力画像を歪めるために使用される画像操作が多数あります。たとえば、tf.image.random_flip_left_right(image, seed=None)やtf.image.random_brightness(image, max_delta, seed=None)などがあります。

これらの関数は、単一の画像（つまり、形状 [高さ、幅、カラーチャネル] を持つ 3D テンソル）用に作成されています。これらを、画像のバッチ（つまり、形状 [バッチ、高さ、幅、カラーチャネル] を持つ 4D テンソル）で動作させるにはどうすればよいですか?

実際の実例をいただければ幸いです。

ベストアンサー1

一つの可能性としては、最近追加されたtf.map_fn()バッチの各要素に単一画像演算子を適用します。

result = tf.map_fn(lambda img: tf.image.random_flip_left_right(img), images)

これは実質的に同じグラフを構築しますケブマンは示唆する構築は簡単ですが、バッチサイズが大きい場合は、テンソルフローループのサポート。

ベストアンサー1

おすすめ記事