Imagenetから選択したクラスの画像を取得するにはどうすればいいですか? 質問する

Question

問題は、#50: 'American alligator, Alligator mississipiensis'ImageNet から選択したクラスの画像を取得する方法です。

へ移動https://www.image-net.org/。
へ移動ダウンロード。

202303: このガイドは古くなっています。

ウェブサイトが変更されたため、次の手順のようにダウンロードできなくなりました。現在は次のようになっています:

ImageNetで最もよく使われるサブセットはImageNet 大規模視覚認識チャレンジ (ILSVRC)2012-2017年の画像分類と位置特定データセット。このデータセットは1000のオブジェクトクラスにまたがり、1,281,167枚のトレーニング画像、50,000枚の検証画像、100,000枚のテスト画像が含まれています。このサブセットは以下から入手できます。カグル。

ImageNet データセット全体とその他のよく使用されるサブセットにアクセスするには、ログインするかアクセスをリクエストしてください。その際には、アクセス規約に同意する必要があります。

以下の手順は古くなっています。Web サイトが変更されました。

「画像 URL のダウンロード」の手順に従ってください。

ブラウザから synset の URL をダウンロードするにはどうすればいいですか?
1. Type a query in the Search box and click "Search" button

ワニは表示されません。ImageNet is under maintenance. Only ILSVRC synsets are included in the search results.問題ありません。この検索は WordNet ツリーマップの正しいブランチに到達することを目的としているため、類似の動物「ワニトカゲ」で問題ありません。メンテナンスが行われなかったとしても、ここで直接 ImageNet 画像を取得できるかどうかはわかりません。

2. Open a synset papge

下にスクロールします:

近隣の動物として、同じくトカゲ目双弓類爬虫類であるアメリカアリゲーターを探す:

3. You will find the "Download URLs" button under the left-bottom corner of the image browsing window.

選択したクラスのすべての URL が取得されます。ブラウザにテキストファイルがポップアップ表示されます。

http://image-net.org/api/text/imagenet.synset.geturls?wnid=n01698640

ここで、URL の末尾に配置する必要がある正しい WordNet ID を知ることが重要であることがわかります。

手動画像ダウンロード

テキストファイルは次のようになります。

出典: http://farm1.static.flickr.com/136/326907154_d975d0c944.jpg
http://weeksbay.org/photo_gallery/reptiles/American20Alligator.jpg
...
画像番号1261まで。

たとえば、最初の URL は次の URL にリンクします。

2 番目はリンク切れです:

3 番目のリンクは無効ですが、4 番目のリンクは機能しています。

これらの URL の画像は公開されていますが、多くのリンクは無効であり、画像の解像度も低くなっています。

自動画像ダウンロード

再び ImageNet ガイドから引用します:

HTTP プロトコルでダウンロードするには? HTTP リクエストで synset をダウンロードするには、まず synset の「WordNet ID」(wnid) を取得する必要があります。エクスプローラーを使用して synset を参照する場合、画像ウィンドウの下に WordNet ID が表示されます。(ここをクリックして「Synset WordNet ID」を検索すると、「Dog, domestic dog, Canis familiaris」synset の wnid が表示されます)。「WordNet ID」の詳細については、次を参照してください。
Mapping between ImageNet and WordNet
synsetのwnidがわかれば、その画像のURLは次の場所で取得できる。
http://www.image-net.org/api/text/imagenet.synset.geturls?wnid=[wnid]
wnid を指定して下位語の synset を取得することもできます。詳細については、API ドキュメントを参照してください。

それで、そこには何があるのでしょうかAPIドキュメント?

すべての WordNet ID (いわゆる「synset ID」) とすべての synset の単語を取得するために必要なものがすべて揃っています。つまり、任意のクラス名とその WordNet ID が無料で手に入ります。

シノセットの単語を取得する

synsetのwnidが与えられると、synsetの単語は次の式で得られる。
http://www.image-net.org/api/text/wordnet.synset.getwords?wnid=[wnid]
あなたもすることができますここをクリックすべてのシノニムセットのWordNet IDと単語間のマッピングをダウンロードするには、ここをクリックすべてのシノニムセットの WordNet ID と用語間のマッピングをダウンロードします。

選択したWordNet IDとそのクラス名がわかっている場合は、「nltk」（自然言語ツールキット）のnltk.corpus.wordnetを使用できます。WordNetインターフェース。

今回の場合、必要なのはクラスの画像だけです#50: 'American alligator, Alligator mississipiensis'。必要なものはすでにわかっているので、nltk.corpus.wordnet は無視できます (詳細についてはチュートリアルまたは Stack Exchange の質問を参照してください)。まだ有効な URL をループすることで、すべてのワニの画像のダウンロードを自動化できます。もちろん、すべての WordNet ID をループすることで、これを完全な WordNet に拡張することもできますが、これではツリーマップ全体に時間がかかりすぎます。また、毎日何千人もの人がダウンロードすると画像がなくなるため、お勧めできません。

残念ながら、ImageNet クラス番号「#50」を引数として受け入れるこの Python コードを書く時間はないと思いますが、WordNet から ImageNet へのマッピングテーブルを使用すれば、これも可能になるはずです。クラス名と WordNet ID があれば十分でしょう。

単一の WordNet ID の場合、コードは次のようになります。

import urllib.request 
import csv

wnid = "n01698640"
url = "http://image-net.org/api/text/imagenet.synset.geturls?wnid=" + str(wnid)

# From https://stackoverflow.com/a/45358832/6064933
req = urllib.request.Request(url, headers={'User-Agent': 'Mozilla/5.0'})
with open(wnid + ".csv", "wb") as f:
    with urllib.request.urlopen(req) as r:
        f.write(r.read())

with open(wnid + ".csv", "r") as f:
    counter = 1
    for line in f.readlines():      
        print(line.strip("\n"))
        failed = []
        try:
            with urllib.request.urlopen(line) as r2:
                with open(f'''{wnid}_{counter:05}.jpg''', "wb") as f2:
                    f2.write(r2.read())
        except:
            failed.append(f'''{counter:05}, {line}'''.strip("\n"))
        counter += 1
        if counter == 10:
            break

with open(wnid + "_failed.csv", "w", newline="") as f3:
    writer = csv.writer(f3)
    writer.writerow(failed)

結果：

リンク切れや元の品質の画像が必要で、プロジェクトが非営利である場合は、サインインして「画像のコピーを入手するにはどうすればいいですか？」を参照してください。ダウンロードに関するFAQ。

上記の URL では、wnid=n01698640URL の末尾に、ImageNet にマップされている WordNet ID が表示されます。
または、「Synset の画像」タブで、「Wordnet ID」をクリックします。

アクセス方法:

または右クリックして名前を付けて保存:

WordNet ID を使用して元の画像を取得できます。

商用の場合は、ImageNet チームに問い合わせることをお勧めします。

アドオン

コメントのアイデアを取り入れる: たくさんの画像ではなく、クラスをできるだけよく表す「単一のクラス画像」だけが必要な場合は、以下を参照してください。GoogLeNet クラスの視覚化代わりに、このメソッドを ImageNet の画像で使用してみます。これも deepdream コードを使用しています。

GoogLeNet クラスの視覚化

2015年7月

ディープニューラルネットワークがダルメシアンの見た目をどう考えているか考えたことがありますか? もう疑問に思う必要はありません。

最近Google投稿を公開しましたディープニューラルネットワークを使用してクラスの視覚化を生成し、いわゆる「インセプション主義」メソッドを使用して画像を変更する方法について説明しています。その後、インセプション主義メソッドを使用して画像を変更するためのコードを公開しましたが、同じ投稿で示すクラスの視覚化を生成するコードは公開しませんでした。

Googleがクラスの視覚化をどのように生成したのか正確にはわかりませんでしたが、ディープドリームコードこのiPythonノートブックカイル・マクドナルドから、私はGoogLeNetにこれらを描くように指導することができました:

... [他にもたくさんのサンプル画像が続きます]

Answer 1

問題は、#50: 'American alligator, Alligator mississipiensis'ImageNet から選択したクラスの画像を取得する方法です。

へ移動https://www.image-net.org/。
へ移動ダウンロード。

202303: このガイドは古くなっています。

ウェブサイトが変更されたため、次の手順のようにダウンロードできなくなりました。現在は次のようになっています:

ImageNetで最もよく使われるサブセットはImageNet 大規模視覚認識チャレンジ (ILSVRC)2012-2017年の画像分類と位置特定データセット。このデータセットは1000のオブジェクトクラスにまたがり、1,281,167枚のトレーニング画像、50,000枚の検証画像、100,000枚のテスト画像が含まれています。このサブセットは以下から入手できます。カグル。

ImageNet データセット全体とその他のよく使用されるサブセットにアクセスするには、ログインするかアクセスをリクエストしてください。その際には、アクセス規約に同意する必要があります。

以下の手順は古くなっています。Web サイトが変更されました。

「画像 URL のダウンロード」の手順に従ってください。

ブラウザから synset の URL をダウンロードするにはどうすればいいですか?
1. Type a query in the Search box and click "Search" button

ワニは表示されません。ImageNet is under maintenance. Only ILSVRC synsets are included in the search results.問題ありません。この検索は WordNet ツリーマップの正しいブランチに到達することを目的としているため、類似の動物「ワニトカゲ」で問題ありません。メンテナンスが行われなかったとしても、ここで直接 ImageNet 画像を取得できるかどうかはわかりません。

2. Open a synset papge

下にスクロールします:

近隣の動物として、同じくトカゲ目双弓類爬虫類であるアメリカアリゲーターを探す:

3. You will find the "Download URLs" button under the left-bottom corner of the image browsing window.

選択したクラスのすべての URL が取得されます。ブラウザにテキストファイルがポップアップ表示されます。

http://image-net.org/api/text/imagenet.synset.geturls?wnid=n01698640

ここで、URL の末尾に配置する必要がある正しい WordNet ID を知ることが重要であることがわかります。

手動画像ダウンロード

テキストファイルは次のようになります。

出典: http://farm1.static.flickr.com/136/326907154_d975d0c944.jpg
http://weeksbay.org/photo_gallery/reptiles/American20Alligator.jpg
...
画像番号1261まで。

たとえば、最初の URL は次の URL にリンクします。

2 番目はリンク切れです:

3 番目のリンクは無効ですが、4 番目のリンクは機能しています。

これらの URL の画像は公開されていますが、多くのリンクは無効であり、画像の解像度も低くなっています。

自動画像ダウンロード

再び ImageNet ガイドから引用します:

HTTP プロトコルでダウンロードするには? HTTP リクエストで synset をダウンロードするには、まず synset の「WordNet ID」(wnid) を取得する必要があります。エクスプローラーを使用して synset を参照する場合、画像ウィンドウの下に WordNet ID が表示されます。(ここをクリックして「Synset WordNet ID」を検索すると、「Dog, domestic dog, Canis familiaris」synset の wnid が表示されます)。「WordNet ID」の詳細については、次を参照してください。
Mapping between ImageNet and WordNet
synsetのwnidがわかれば、その画像のURLは次の場所で取得できる。
http://www.image-net.org/api/text/imagenet.synset.geturls?wnid=[wnid]
wnid を指定して下位語の synset を取得することもできます。詳細については、API ドキュメントを参照してください。

それで、そこには何があるのでしょうかAPIドキュメント?

すべての WordNet ID (いわゆる「synset ID」) とすべての synset の単語を取得するために必要なものがすべて揃っています。つまり、任意のクラス名とその WordNet ID が無料で手に入ります。

シノセットの単語を取得する

synsetのwnidが与えられると、synsetの単語は次の式で得られる。
http://www.image-net.org/api/text/wordnet.synset.getwords?wnid=[wnid]
あなたもすることができますここをクリックすべてのシノニムセットのWordNet IDと単語間のマッピングをダウンロードするには、ここをクリックすべてのシノニムセットの WordNet ID と用語間のマッピングをダウンロードします。

選択したWordNet IDとそのクラス名がわかっている場合は、「nltk」（自然言語ツールキット）のnltk.corpus.wordnetを使用できます。WordNetインターフェース。

今回の場合、必要なのはクラスの画像だけです#50: 'American alligator, Alligator mississipiensis'。必要なものはすでにわかっているので、nltk.corpus.wordnet は無視できます (詳細についてはチュートリアルまたは Stack Exchange の質問を参照してください)。まだ有効な URL をループすることで、すべてのワニの画像のダウンロードを自動化できます。もちろん、すべての WordNet ID をループすることで、これを完全な WordNet に拡張することもできますが、これではツリーマップ全体に時間がかかりすぎます。また、毎日何千人もの人がダウンロードすると画像がなくなるため、お勧めできません。

残念ながら、ImageNet クラス番号「#50」を引数として受け入れるこの Python コードを書く時間はないと思いますが、WordNet から ImageNet へのマッピングテーブルを使用すれば、これも可能になるはずです。クラス名と WordNet ID があれば十分でしょう。

単一の WordNet ID の場合、コードは次のようになります。

import urllib.request 
import csv

wnid = "n01698640"
url = "http://image-net.org/api/text/imagenet.synset.geturls?wnid=" + str(wnid)

# From https://stackoverflow.com/a/45358832/6064933
req = urllib.request.Request(url, headers={'User-Agent': 'Mozilla/5.0'})
with open(wnid + ".csv", "wb") as f:
    with urllib.request.urlopen(req) as r:
        f.write(r.read())

with open(wnid + ".csv", "r") as f:
    counter = 1
    for line in f.readlines():      
        print(line.strip("\n"))
        failed = []
        try:
            with urllib.request.urlopen(line) as r2:
                with open(f'''{wnid}_{counter:05}.jpg''', "wb") as f2:
                    f2.write(r2.read())
        except:
            failed.append(f'''{counter:05}, {line}'''.strip("\n"))
        counter += 1
        if counter == 10:
            break

with open(wnid + "_failed.csv", "w", newline="") as f3:
    writer = csv.writer(f3)
    writer.writerow(failed)

結果：

リンク切れや元の品質の画像が必要で、プロジェクトが非営利である場合は、サインインして「画像のコピーを入手するにはどうすればいいですか？」を参照してください。ダウンロードに関するFAQ。

上記の URL では、wnid=n01698640URL の末尾に、ImageNet にマップされている WordNet ID が表示されます。
または、「Synset の画像」タブで、「Wordnet ID」をクリックします。

アクセス方法:

または右クリックして名前を付けて保存:

WordNet ID を使用して元の画像を取得できます。

商用の場合は、ImageNet チームに問い合わせることをお勧めします。

アドオン

コメントのアイデアを取り入れる: たくさんの画像ではなく、クラスをできるだけよく表す「単一のクラス画像」だけが必要な場合は、以下を参照してください。GoogLeNet クラスの視覚化代わりに、このメソッドを ImageNet の画像で使用してみます。これも deepdream コードを使用しています。

GoogLeNet クラスの視覚化

2015年7月

ディープニューラルネットワークがダルメシアンの見た目をどう考えているか考えたことがありますか? もう疑問に思う必要はありません。

最近Google投稿を公開しましたディープニューラルネットワークを使用してクラスの視覚化を生成し、いわゆる「インセプション主義」メソッドを使用して画像を変更する方法について説明しています。その後、インセプション主義メソッドを使用して画像を変更するためのコードを公開しましたが、同じ投稿で示すクラスの視覚化を生成するコードは公開しませんでした。

Googleがクラスの視覚化をどのように生成したのか正確にはわかりませんでしたが、ディープドリームコードこのiPythonノートブックカイル・マクドナルドから、私はGoogLeNetにこれらを描くように指導することができました:

... [他にもたくさんのサンプル画像が続きます]

Imagenetから選択したクラスの画像を取得するにはどうすればいいですか? 質問する

背景

望ましい結果（回答すべき質問の一部ではありません）

動作コード

質問

ベストアンサー1

202303: このガイドは古くなっています。

以下の手順は古くなっています。Web サイトが変更されました。

手動画像ダウンロード

自動画像ダウンロード

アドオン

おすすめ記事