Twitterフィードを言語のみでフィルタリングする 質問する

Twitterフィードを言語のみでフィルタリングする 質問する

Twitter フィードの抽出に Tweepy API を使用しています。特定の言語の Twitter フィードのみを抽出したいです。言語フィルターはtrackフィルターが提供されている場合にのみ機能します。次のコードは 406 エラーを返します。

l = StdOutListener()
auth = OAuthHandler(consumer_key, consumer_secret)
auth.set_access_token(access_token, access_token_secret)
stream = Stream(auth, l)
stream.filter(languages=["en"])

どうやって抽出すればいいですか全てTweepy を使用して特定の言語のツイートを検索できますか?

ベストアンサー1

できません(特別なアクセスがなければ)。ストリーミング全てツイート(フィルタリングなし)には接続が必要です消防ホースは、Twitterによって特定の使用例にのみ許可されています。正直なところ、ファイアホースは実際には必要ではありません。trackどうすればいいかわからないほど多くのツイートが届く可能性があります。

次のようなものを使ってみてください:

stream.filter(languages=["en"], track=["a", "the", "i", "you", "u"]) # etc

このような単語でフィルタリングすると、非常に多くのツイートが見つかります。最もよく使用される単語の実際のデータが必要な場合は、Time のこの記事をご覧ください。Twitterで最もよく使われる500語. 使用することができます最大400キーワードは一致しますが、特定の時間間隔でのツイートの 1% の制限に近づく可能性があります。パラメータが特定のtrack時間のすべてのツイートの 60% に一致する場合でも、取得できるのは 1% だけです (これは大量のツイートです)。

おすすめ記事