如何实现字符串匹配算法?

字符串匹配问题是判断一个字符串是否包含另一个字符串的子串。我们可以使用KMP算法实现字符串匹配:

public int strStr(String haystack, String needle) {
    int n = haystack.length(), m = needle.length();
    int[] next = generateNext(needle);
    int i = 0, j = 0;
    while (i < n && j < m) {
        if (j == -1 || haystack.charAt(i) == needle.charAt(j)) {
            i++;
            j++;
        } else {
            j = next[j];   
        }
    }
    return j == m ? i - j : -1;
}

private int[] generateNext(String p) {
    int n = p.length();
    int[] next = new int[n];
    next[0] = -1;
    int i = 0, j = -1;
    while (i < n - 1) {
        if (j == -1 || p.charAt(i) == p.charAt(j)) {
            i++;
            j++;
            next[i] = j;
        } else {
            j = next[j];
        }
    }
    return next;
} 

算法流程:

  1. 生成next数组,next[i]表示p的前i个字符的最大公共前后缀长度。
  2. i指向haystack,j指向needle。如果j==-1或当前字符匹配,i和j都增加。
  3. 如果不匹配,j跳到next[j]位置。
  4. 重复步骤2和3,直到j遍历完needle。
  5. 如果j遍历完,则找到匹配,返回i – m。否则返回-1。

时间复杂度 O(n+m),空间复杂度 O(m)

所以,KMP算法的关键是:

  1. 生成next数组,简化匹配过程。
  2. i指向haystack,j指向needle。当字符匹配时,i和j同时增加。
  3. 当失配时,j跳到next[j]位置,而不是退回到初始位置。这避免了重复匹配。
  4. 根据j是否遍历完成needle判断是否找到匹配。
  5. next数组的计算也使用KMP思想,有助于理解。

理解KMP算法与字符串匹配,是算法与编程的重要内容。掌握该算法,可以让我们熟练使用字符串这种数据结构。KMP算法这一问题包含字符串、数组等知识与技能。