TensorFlow には、トレーニング中に入力画像を歪めるために使用される画像操作が多数あります。たとえば、tf.image.random_flip_left_right(image, seed=None)
やtf.image.random_brightness(image, max_delta, seed=None)
などがあります。
これらの関数は、単一の画像(つまり、形状 [高さ、幅、カラー チャネル] を持つ 3D テンソル)用に作成されています。これらを、画像のバッチ(つまり、形状 [バッチ、高さ、幅、カラー チャネル] を持つ 4D テンソル)で動作させるにはどうすればよいですか?
実際の実例をいただければ幸いです。
ベストアンサー1
一つの可能性としては、最近追加されたtf.map_fn()
バッチの各要素に単一画像演算子を適用します。
result = tf.map_fn(lambda img: tf.image.random_flip_left_right(img), images)
これは実質的に同じグラフを構築しますケブマンは示唆する構築は簡単ですが、バッチサイズが大きい場合は、テンソルフローループのサポート。