uniqとagrepの組み合わせ？

Question

クエリが十分に予測可能な場合は、単にsedパラメータ値を出力することもできます。たとえば、多くのクエリに数値との同一性比較が含まれている場合、sed 's/=[[:digit:]]+//g'実際の数値はすべて削除され、列名のみが残ります。

それ以外の場合、私が考えることができる唯一の一般的な解決策はパターン認識技術です。K- 最も近い隣人、類似性に基づいて、すべての文字列のリストをクラスターに分類できます。

Answer 1

クエリが十分に予測可能な場合は、単にsedパラメータ値を出力することもできます。たとえば、多くのクエリに数値との同一性比較が含まれている場合、sed 's/=[[:digit:]]+//g'実際の数値はすべて削除され、列名のみが残ります。

それ以外の場合、私が考えることができる唯一の一般的な解決策はパターン認識技術です。K- 最も近い隣人、類似性に基づいて、すべての文字列のリストをクラスターに分類できます。

おすすめ記事