リストからcmsを検出する

リストからcmsを検出する

マーケティング部門でドメイン名を検索したい(WordPressを使用している場合)私は巨大なドメインリストを持っていますが、wordpressを持つドメインを出力ファイルに保存する適切なcms検出器を見つけることができません。

ご提案いただきありがとうございます。

ベストアンサー1

サイトのインデックスページを確認し、「WordPress」またはより良い「wp-content」サブストリングのgrepを確認できます。

たとえば、「wp-content/themes」サブストリングのいくつかのウェブサイトと次の行のいずれかを確認しました。

DOMAINS="enjoyyourcooking.com yabloko.studio academyselfdefense.com cnn.com middlechildphilly.com"; for i in ${DOMAINS}; do wget --timeout=5 -qO- ${i}|grep 'wp-content/themes' >/dev/null 2>&1 && echo "+++ Domain ${i}: wordpress detected" || echo "--- Domain ${i}: wordpress NOT detected"; done

出力:

+++ Domain enjoyyourcooking.com: wordpress detected
+++ Domain yabloko.studio: wordpress detected
+++ Domain academyselfdefense.com: wordpress detected
--- Domain cnn.com: wordpress NOT detected
+++ Domain middlechildphilly.com: wordpress detected

読みやすいコードバージョン:

DOMAINS="enjoyyourcooking.com yabloko.studio academyselfdefense.com cnn.com middlechildphilly.com";
for i in ${DOMAINS}; do
  wget --timeout=5 -qO- ${i}|grep 'wp-content/themes' >/dev/null 2>&1 && 
    echo "+++ Domain ${i}: wordpress detected" || 
    echo "--- Domain ${i}: wordpress NOT detected";
done

もちろん、特定のサイトに合わせてWordPressを変更したときに検索された部分文字列が変更されないという保証はありませんが、...助けることはできません。

おすすめ記事