文字列の類似性を比較する 質問する

文字列の類似性を比較する 質問する

2 つの文字列を比較して、それらの類似性を確認する最適な方法は何ですか?

例:

My String
My String With Extra Words

または

My String
My Slightly Different String

私が求めているのは、各ペアの 1 番目と 2 番目の文字列がどの程度類似しているかを判断することです。比較にスコアを付け、文字列が十分に類似している場合は、一致するペアと見なします。

C# でこれを行う良い方法はありますか?

ベストアンサー1

static class LevenshteinDistance
{
    public static int Compute(string s, string t)
    {
        if (string.IsNullOrEmpty(s))
        {
            if (string.IsNullOrEmpty(t))
                return 0;
            return t.Length;
        }

        if (string.IsNullOrEmpty(t))
        {
            return s.Length;
        }

        int n = s.Length;
        int m = t.Length;
        int[,] d = new int[n + 1, m + 1];

        // initialize the top and right of the table to 0, 1, 2, ...
        for (int i = 0; i <= n; d[i, 0] = i++);
        for (int j = 1; j <= m; d[0, j] = j++);

        for (int i = 1; i <= n; i++)
        {
            for (int j = 1; j <= m; j++)
            {
                int cost = (t[j - 1] == s[i - 1]) ? 0 : 1;
                int min1 = d[i - 1, j] + 1;
                int min2 = d[i, j - 1] + 1;
                int min3 = d[i - 1, j - 1] + cost;
                d[i, j] = Math.Min(Math.Min(min1, min2), min3);
            }
        }
        return d[n, m];
    }
}

おすすめ記事