Architektura NASP

NASP składa się w modułów, które współpracując ze sobą dostarczają funkcjonalności niezbędne do efektywnego przetwarzania danych. Komunikacja w systemie opiera się na kolejce (queue) - standard JMS (Java Messaging System). Dzięki niej wewnątrz systemu pomiędzy działającymi modułami przesyłane są tekstowe komunikaty. Komunikaty oparte są na technologii XML.

NASP składa się z następujących modułów:

  • Spider

    Spider to proces, który regularnie przegląda strony internetowe w poszukiwaniu informacji stanowiących dane wejściowe do systemu. Zadaniem spidera jest znalezienie nowych lub zmodyfikowanych treści strony, co umożliwia aktualizację danych przechowywanych w repozytorium.

  • Connector

    Aplikacja odpowiedzialna za pobieranie danych wejściowych ze zdefiniowanego źródła, która odpowiednio przetwarza dane i dostarcza je w ustalonym formacie do repozytorium UB (Universal Backend).

  • UB (Universal Backend)

    Uniwersalne repozytorium (UB) odpowiedzialne za przechowywanie oraz wstępną obróbkę danych polegającą na dodawaniu do dokumentu słów kluczowych oraz innych danych na potrzeby wyszukiwania. W trakcie procesu indeksowania dane z repozytorium są przekazywane do indeksera.

  • USE (Universal Search Engine)

    Główny moduł wyszukiwania to uniwersalny i wysokowydajny silnik (USE), umożliwiający pełnotekstowe przeszukiwanie indeksu zbudowanego na bazie dokumentów z repozytorium (UB) oraz za przesyłanie do frontendu otrzymanych wyników.

  • Frontend (Service Layer)

    Platforma, z którą komunikują się systemy Klienta. Frontend służy do implementacji logiki biznesowej. Do frontendu zadawane są zapytania za pomocą protokołu HTTP.

  • Control Center

    Monitoruje pracę modułów wchodzących w skład NASP-a.

    Moduły NASP


Więcej informacji

Opis technologiczny spidera i connectora – Spider i connector
Opis technologiczny silnika USE – USE
Opis technologiczny repozytorium UB – UB
Opis technologiczny frontendu i Control Center – Frontend i Control Center