URLConnection で Java を使用して Web ページを解析しようとしています。次のようにユーザー エージェントを設定しようとしています。
java.net.URLConnection c = url.openConnection();
c.setRequestProperty("User-Agent", "Mozilla/5.0 (Macintosh; U; Intel Mac OS X 10.4; en-US; rv:1.9.2.2) Gecko/20100316 Firefox/3.6.2");
しかし、結果として得られるユーザー エージェントは、私が指定したもので、末尾に「Java/1.5.0_19」が追加されます。この追加なしでユーザー エージェントを実際に設定する方法はありますか?
ベストアンサー1
明確にするために:setRequestProperty("User-Agent", "Mozilla ...")
今では正常に動作し、java/xx
末尾に追加されません。少なくとも Java 1.6.30 以降ではそうです。
私は自分のマシンでnetcat(ポート リスナー)を使用してリッスンしました。
$ nc -l -p 8080
単にポートをリッスンするだけで、生の http ヘッダーなど、要求されたものがすべて表示されます。
そして、setRequestProperty なしで次の http ヘッダーを取得しました。
GET /foobar HTTP/1.1
User-Agent: Java/1.6.0_30
Host: localhost:8080
Accept: text/html, image/gif, image/jpeg, *; q=.2, */*; q=.2
Connection: keep-alive
setRequestProperty を使用する場合:
GET /foobar HTTP/1.1
User-Agent: Mozilla/5.0 (Macintosh; U; Intel Mac OS X 10.4; en-US; rv:1.9.2.2) Gecko/20100316 Firefox/3.6.2
Host: localhost:8080
Accept: text/html, image/gif, image/jpeg, *; q=.2, */*; q=.2
Connection: keep-alive
ご覧のとおり、ユーザーエージェントは適切に設定されています。
完全な例:
import java.io.IOException;
import java.net.URL;
import java.net.URLConnection;
public class TestUrlOpener {
public static void main(String[] args) throws IOException {
URL url = new URL("http://localhost:8080/foobar");
URLConnection hc = url.openConnection();
hc.setRequestProperty("User-Agent", "Mozilla/5.0 (Macintosh; U; Intel Mac OS X 10.4; en-US; rv:1.9.2.2) Gecko/20100316 Firefox/3.6.2");
System.out.println(hc.getContentType());
}
}