Architektura NASP
NASP składa się w modułów, które współpracując ze sobą dostarczają funkcjonalności niezbędne do efektywnego przetwarzania danych. Komunikacja w systemie opiera się na kolejce (queue) - standard JMS (Java Messaging System). Dzięki niej wewnątrz systemu pomiędzy działającymi modułami przesyłane są tekstowe komunikaty. Komunikaty oparte są na technologii XML.
NASP składa się z następujących modułów:
- Spider
Spider to proces, który regularnie przegląda strony internetowe w poszukiwaniu informacji stanowiących dane wejściowe do systemu. Zadaniem spidera jest znalezienie nowych lub zmodyfikowanych treści strony, co umożliwia aktualizację danych przechowywanych w repozytorium.
- Connector
Aplikacja odpowiedzialna za pobieranie danych wejściowych ze zdefiniowanego źródła, która odpowiednio przetwarza dane i dostarcza je w ustalonym formacie do repozytorium UB (Universal Backend).
- UB (Universal Backend)
Uniwersalne repozytorium (UB) odpowiedzialne za przechowywanie oraz wstępną obróbkę danych polegającą na dodawaniu do dokumentu słów kluczowych oraz innych danych na potrzeby wyszukiwania. W trakcie procesu indeksowania dane z repozytorium są przekazywane do indeksera.
- USE (Universal Search Engine)
Główny moduł wyszukiwania to uniwersalny i wysokowydajny silnik (USE), umożliwiający pełnotekstowe przeszukiwanie indeksu zbudowanego na bazie dokumentów z repozytorium (UB) oraz za przesyłanie do frontendu otrzymanych wyników.
- Frontend (Service Layer)
Platforma, z którą komunikują się systemy Klienta. Frontend służy do implementacji logiki biznesowej. Do frontendu zadawane są zapytania za pomocą protokołu HTTP.
- Control Center
Monitoruje pracę modułów wchodzących w skład NASP-a.

Więcej informacji
Opis technologiczny spidera i connectora – Spider i connector
Opis technologiczny silnika USE – USE
Opis technologiczny repozytorium UB – UB
Opis technologiczny frontendu i Control Center – Frontend i Control Center

