即使失去了重要之物，少年仍然直面命运。即使忘记了重要的人，怪物仍然挑战命运。——《Charlotte》

Knuth Morris Pratt

真的没名字能代进去了，《》和《》在这种情况下真的是不好搞。

KMP算法（全称字符串查找算法，由三位发明者的姓氏命名）是可以在文本串 中快速查找模式串 的一种算法。

暴力匹配

显然，既然我们会讲这个算法，就是因为暴力匹配太慢了！！！

但是我们还是应该不厌其烦地看看暴力匹配是如何浪费时间，如果你在比赛中忘记了怎么写的时候，说不定暴力也是一种骗分的好办法（为什么不用呢），而且这段浪费时间的文字成为了我们进步的基石。

所谓暴力匹配，就是逐字符逐字符的进行匹配，如果当前字符匹配成功，就匹配下一个，如果失配（在刺客信条里我们通常称为失去同步），回溯，代码如下：

int i = 0, j = 0;
for (auto i : s)
{
	if (s[i] == p[j])
		++ i, ++ j; // 移动指针
	else
	{
		i = i - j + 1; // 回溯
		j = 0; // 下面的指针置零
	}
	if (j == p.length ()) // 匹配成功
	{
		printf ("%d\n", i - j); // 返回位置
		i = i - j + 1;
		j = 0;
	}
}

如果我们暴力匹配 ” “，会发生什么呢？

从头开始匹配，第一位字符成功：

开始同步！

第二到四位字符也匹配成功，继续：

同步成功下一位，匹配失败，回溯：

同步失败

匹配失败，继续尝试：

同步又失败了，你太菜了下一位匹配成功了！

同步成功了！

就这样一直啪塔啪塔地匹配到字符串の尽头：

终于，到达了那不可到达的遥远的尽头。

设两个字符串的长度分别为和，则暴力匹配最坏时间复杂度是。究其原因，是在回溯的时候浪费了时间，但是如果不回溯，还把光标置零，很可能会出现遗漏，如下图：

出大问题啦！！！

于是为了让光标被赋为一个合适的值，我们引入了PMT（，部分匹配表）

部分匹配表

原理

光标应该被赋值为多少，是只与模式串自身有关的。每个模式串，都对应着一张，比如 “ “对应的如下：

一张不错的PMT，对吧？

观察后可以发现，就是，从开始数、同时从往后数相同的位数，在保证前后缀相同的情况下，最多能数多少位。

就像这样啦~前缀和后缀是相同的~

专业一点说，它是真前缀（不包含字符串本身的前缀）和真后缀（不包含字符串本身的后缀）的集合之交集中，最长元素的长度。

为什么可以用来确定指针的位置呢，让我们先时间回溯到暴力匹配第一次失配的那个时候：

欢迎回到这个时候，如果你敢轻举妄动就会引发雪崩效应，使时间线变动

这时，字符串中的’ ‘和字符串中的’ ‘没有匹配，那么我们~~刻意改动时间线~~保持上面的指针不变，把下面的指针左移。这时注意到，” “已经匹配成功了，它拥有一个前缀” “和一个后缀” “（两个虚线部分），所以可以把这个” “利用起来，变成下面这样：

之后就全同步了，但是代价是？

实际上这个时候我们正是在令。再举一个例子：

来举新栗子！发生失配，我们令（也就是符合条件的最长前缀（最大匹配）所紧接着的下一位）：

直接跳回来！仍然不匹配，继续遍历：

下一次我们想要跳到的地方，就在虚线后一位

现在是，然后匹配：

付出代价，然后跳跃吧！

这次取得了匹配，继续匹配下去我们就可以非常幸运地得到答案了，现在我们将其转化为代码：

for (int i = 0, j = 0; i < s.length (); ++ i)
{
	while (j >= 0 && s[i] != p[j]) // 失配，不断循环直到匹配成功，如果无论如何都无法匹配成功则得到 -1 
		j = j ? pmt[j - 1] : -1; // j 指针往回走，直到匹配，并赋值为它
	++ j; // 指针后移一位（如果匹配失败，则置于字符串首 
	if (j == s.length ())
	{
		printf ("%d\n", i - j + 1); // 输出位置  
		j = pmt[j - 1]; // 回溯
	}
}

如果到这里你仍不知道为什么的话，因为前面的是匹配的（即存在），所以其实是等于最大匹配长度的，那么就会回到，也就是回到前缀。

很多文章中会出现数组，即把整体向右移一位（特别的，令），表示在每一位失配的时候应跳转到的索引。也就是说，失配时，按照的顺序跳转。

获取

现在问题来了，怎么求？如果暴力求的话，时间复杂度是，并不理想。神奇的是，我们可以在错开一位后，让 自己匹配自己（等于是用前缀匹配后缀），我们知道，而之后的每一位则可以通过匹配过程中记录值得到。

还是以刚刚的模式串为例：

开始模拟！匹配失败，则，指针后移。

匹配成功了接下来匹配成功，得到，然后将两个指针都右移。

欧气有点好，又匹配一位继续匹配成功，。

这就又失去同步了？下一位又失配了，但是因为前面的已经算出来了，我们可以像匹配文本串一样使用它。即等于，所以退回开头。

功亏一篑

结果在开头匹配失败了，出师不利，则。接下来也按这样操作：

继续匹配！最后一位出现失配，这次是先令，也就是直接回到老家：

千算万算没算到最后一位失配了那么直接回到老家：

快乐老家~天亮就出发再次匹配，匹配成功。自此，通过一次自我匹配，求出了，代码如下：

pmt[0] = 0;
for (int i = 1, j = 0; i < p.length (); ++ i)
{
	while (j >= 0 && p[i] != p[j]) // 总感觉似曾相识啊…… 
		j = j ? pmt[j - 1] : -1; // 如果失配就回到一个匹配的点  
	pmt[i] = ++ j; // 转移指针  
}

优化

上面的只能被称作算法，一切从现在开始。

例如对于” “这个模式串，如果我们用它来匹配” “，在最后要跳转次才能发现匹配失败：

这可真是一个悲伤的故事

中间这几次跳转是毫无意义的，所以我们可以在计算的时候动上一些小手脚：

pmt[0] = 0;
for (int i = 1; j = 0; i < s.length (); ++ i)
{
	while (j >= 0 && p[i] != p[j])
		j = j ? pmt[j - 1] : -1;  
	pmt[i] = j >= 0 && p[i + 1] == [j + 1] ? pmt[j ++] : ++ j;  
}

如果自我匹配成功了，第位在失配的时会跳转到第位，但是我们发现第位和第位的字符是一样的。我们直到第失配后会跳转到位即位，所以干脆跳过直接到去。

小手脚

相反，匹配到下图时，，就可以像之前那样处理。

这种情况可以照样处理

但是这个已经不叫了（不信你自己试试去），这个应该重开一个数组。

算法总的时间复杂度是，这是因为和都只进行了次，虽然在过程中有减小，但在任何时刻不会小于，所以减小的次数也不可能超过。