スクリプトを介してWebページと対話しますか?

スクリプトを介してWebページと対話しますか?

電子メールアカウントがありますが、いよいよ受け取りました。たくさんスパムフォルダに(200,000)個のメッセージがあります。残念ながら、これはすべてスパムではありません。一部はフィルタが正しく訓練されていないため、一部はメーリングリストダイジェストにフィルタを操作する多くのメッセージの1つまたは2つが含まれているためです。

これらの電子メールをダウンロードしたいのですが、電子メールの量が多いため、POPはINBOXとIMAPを除くすべてのフォルダにアクセスできません(サーバーの競合)。

メッセージをスパムから受信トレイに移動するには、Webメールを使用する必要がありました。 「ページが読み込まれるのを待つ」、「すべてのメッセージにフラグを立てる」、「受信トレイを選択」、「フラグ付きメッセージを選択したフォルダに移動する」などを実行しました。 .. ...そして繰り返します!ただし、1ページあたりのメッセージ数は500〜1,000件にすぎず、100,000件のメッセージを移動するには多くの作業が必要です。

これを自動化する良い方法はありますか?

またはとexpect一緒に使用しようとしましたが、WebメールインターフェースはいくつかのJavaScriptを使用しているので、うまく動作するかどうか疑問に思うかもしれません... 、または(またはそれ自体)スクリプトを介して? lynxlinkswgetchromefirefoxoperaX

私が本当に探しているのは(私の考えでは)通常のWebブラウザのように動作しますが、スクリプトによって制御される一種の「仮想Webブラウザ」です。

ベストアンサー1

WebインターフェースがJavaScriptを使用していてJavaScriptなしで実行できない場合は、以下を使用する必要があります。セレン選択したプログラミング言語を直接使用する場合、またはPythonを使用している場合は、抽象化レイヤを使用することもできます。破片

実行するにはJavaScriptが必要ですが、JavaScriptがまったく必要ないWebサイトはますます一般的になっています。ただし、ブラウザでJavaScriptを一時的にオフにすると簡単に確認できます。 JavaScriptは必要ありませんが、クッキーが必要な場合は、セレンなどのあまり重いメカニズムを使用できます(例:Python +機械化。 URLに加えて、通常はログインからリクエストまで、リクエストからリクエストまでCookieを処理する必要がありますwget

別の方法は、問題なく受信トレイをダウンロードできる場合は、受信トレイのメッセージを一時ストアに移動し、すべてのスパムフォルダーの内容を受信トレイに移動し、受信トレイをダウンロードして消去し、受信トレイの一時ストアを復元することです。それから。

おすすめ記事