Misspelling
Misspelling, czyli moduł odpowiedzialny za poprawę pisowni, ułatwia korzystanie z wyszukiwarki poprzez wykrywanie często popełnianych przez użytkowników błędów, takich jak literówki i błędy ortograficzne oraz podpowiadanie poprawionej pisowni. Moduł działa w oparciu o zbiór reguł (np. mówiących o popularnych błędach ortograficznych typu zamiana "u" i "ó" oraz w oparciu o listy znanych słów. Znane słowa mogą pochodzić ze słownika danego języka lub ze zbioru danych użytkownika. Misspelling analizuje nie tylko pojedyncze słowa, ale również całe frazy, dobierając podpowiedź optymalną dla całej treści zapytania.
Mechanizm Misspellingu korzysta z trzech słowników:
-
Słownik podstawowy, czyli słownik słów podpowiadanych na podstawie obliczeń bliskości szukanego wyrażenia do danej formy. Baza słów jest predefiniowana i istnieje możliwość jej modyfikacji w celu usunięcia słów źle wpływających na działanie wyszukiwarki lub dodania nowych form.
-
Słownik dedykowany dla danego wdrożenia. Baza słów generowana jest na podstawie zebranych już dokumentów. System wyparsowuje słowa i frazy z kluczowych pól w dokumencie mogących stanowić informacje o niestandardowych wyrażeniach używanych na danej instancji. Pola muszą być wybierane również ze względu na niskie prawdopodobieństwo znalezienia w nich błędnych form. Słownik nie jest modyfikowalny z powodu możliwości jego nadpisania podczas okresowego generowania bazy słów.
-
Słownik słów niepoprawnych, nazywany także słownikiem słów niepodpowiadanych, który stanowią formy poprawne które ze względu na bliskość z innymi formami mogą być uważane z błędne. Nie wchodzą one jednak w skład predefiniowanej bazy słów podpowiadanych z powodu niepoprawności semantycznej (znaczeniowej) a jedynie poprawności syntaktycznej (składniowej).
Przykłady wdrożeń

Rysunek 1. Misspelling na serwisie www.pkobp.pl

Rysunek 2. Przykład wykorzystania Misspellingu w wyszukiwarce internetu www.netsprint.pl

