Главная страница » База знаний » Алгоритм Кнута, Морриса и Пратта

Алгоритм Кнута, Морриса и Пратта

Поделиться статьей

Рассмотрим сначала более простой случай. Пусть все символы строки-образца S различны. Начнем сравнивать символы S слева направо с первыми m символами строки A. Допустим, что несравнение символов произошло в позиции k £ m, т.е. первые k–1 букв A и S совпали. С какой позиции A следует начать новое сравнение с S? Поскольку символ a_k–1 = s_k–1, то a_k–1 не может совпасть с предыдущими символами S (потому что все символы S различны). Значит, перед продолжением сравнения строк можно сдвинуть S так, чтобы ее первый символ сравнивался сразу с k-м символом A (т.е. с той позицией A, где было обнаружено несовпадение).

Если в S есть совпадающие символы, рассчитать величину сдвига несколько сложнее.

Определим d_j как длину наибольшей подстроки из S, которая заканчивается в позиции j и совпадает с началом строки S во всех позициях, кроме последней. Это можно подробно расписать таким образом:

s[j – d_j + 1] = s[1],

s[j – d _j + 2] = s[2],

…, (7.1)

s[j – 1] = s[d_j – 1],

но при этом s[j] ¹ s[d_j]).

Если такой подстроки не существует, то положим d_j = 0. Тогда нетрудно показать, что, если первое несовпадение при сравнении символов из A и S произошло на паре символов a_i ¹ s_j, то перед продолжением сравнения следует заменить индекс j на d_j, а значение индекса i не изменять (т.е. надо сдвинуть строку S на j – d_j позиций вдоль строки A). Действительно, поскольку символы a[i – d_j + 1], a[i – d _j + 2], …,
a[i – 1] успешно сравнились с символами s[j – d_j + 1], s[j – d _j + 2], …, s[j – 1], то они, согласно (7.1), должны сравниться и с символами s[1], s[2], …, s[d_j – 1], а потому сравнение можно продолжать с пары символов a[i] и s[d_j].

Если же значение j стало равно 0, то надо увеличить i и j на единицу, т.е. начать сопоставление символов заново с позиции i + 1 в строке A и с первой позиции в строке S.

Ниже приведены примеры значений d_j, рассчитанных для различных строк-образцов.

1)	a a a a a a	2)	q w e r t y u i
	0 0 0 0 0 0		0 1 1 1 1 1 1 1
3)	a a b a a b c	4)	a b c d a c e f a b d f
	0 0 2 0 0 2 4		0 1 1 1 0 2 1 1 0 1 3 1
5)	a b b a b b a c	6)	a b a b a b a c a b c
	0 1 1 0 1 1 0 5		0 1 0 1 0 1 0 6 0 1 3

Рассмотрим работу алгоритма на примере, показанном на рис. 7.1. В строке A = ‘aabaabaaabaabc’ ищется подстрока S = ‘aabaabc’ (см. выше, пример 3).

Шаг 1:

Шаг 2:

Шаг 3:

Рис. 7.1. Пример работы алгоритма Кнута, Морриса и Пратта

На первом шаге обнаруживается несовпадение букв a_i и s_j при i = 7 и j = 7. Выполняется присваивание j:= 4. Сравнение продолжается, пока при i = 9 и j = 6 не происходит очередное несовпадение. Делается присваивание j:= 2. На сей раз сравнение проходит успешно.

Отдельный вопрос – как лучше всего рассчитывать величины d_j. В алгоритме на этот вопрос дается довольно неожиданный ответ. Задачу расчета d_j для всех значений j можно рассматривать как модифицированную задачу поиска, в которой роль строки поиска играет S, а роль строки-образца – начальная часть той же строки. Поэтому вычисление d_j выполняется примерно по тому же алгоритму, что и сам поиск вхождения S в A.

Ниже приведен текст функции, реализующей алгоритм поиска КМП.

function KMPSearch(A: StringN . S: StringM): Integer .

var

i, j, k: Integer .

d: Array[1..M] of Integer .

begin

{Вычисление d[j]}

j:= 1 .

k:= 0 .

d[1]:= 0 .

Представленная информация была полезной?
ДА
61.19%
НЕТ
38.81%
Проголосовало: 1510

while j &lt . M do begin

while (k &gt . 0) and (S[j] &lt .&gt . S[k]) do

k:= d[k] .

j:= j + 1 .

k:= k + 1 .

if S[j] = S[k] then d[j]:= d[k]

else d[j]:= k .

end .

{Поиск}

i:= 1 .

j:= 1 .

while (j &lt .= M) and (i &lt .= N) do begin

while (j &gt . 0) and (A[i] &lt .&gt . S[j]) do

j:= d[j] .

i:= i + 1 .

j:= j + 1 .

end .

if j &gt . M then

KMPSearch:= i – j + 1 {Успех}

else

KMPSearch:= 0 . {Неудача}

end . {KMPSearch}

Можно доказать, что время работы алгоритма КМП T_макс(n, m) = O(n+m). Это значительно лучше, чем оценка O(n×m) для прямого поиска, особенно для длинных строк-образцов.

Поделиться статьей

Автор статьи

Анастасия

Задать вопрос

Эксперт

Представленная информация была полезной?
ДА
61.19%
НЕТ
38.81%
Проголосовало: 1510

или напишите нам прямо сейчас:

Написать в WhatsApp Написать в Telegram

ЯТТС-Рекомендации по написанию отчета по учебной и производственной практики-Гостинечное дело

Поделиться статьей

Поделиться статьейПоделиться статьей Автор статьи Анастасия Задать вопрос Эксперт Представленная информация была полезной? ДА 61.19% НЕТ 38.81% Проголосовало: 1510

Поделиться статьей

Написать в WhatsApp Написать в Telegram

X-PDF

X-PDF

Алгоритм Кнута, Морриса и Пратта

ЯТТС-Рекомендации по написанию отчета по учебной и производственной практики-Гостинечное дело

ЯГСА- Контрольная работа. Технологии ремонта машин

ЮУрГУ-вопросы

ЮУГУ-Отчет_ПП-Машины непрерывного транспорта

ЮУГУ- Курсовой проект по электронике

ЮУГУ-ВКР-Обеспечение требований охраны труда на рабочем месте слесаря-ремонтника 5 разряда

X-PDF