Silnik USE (Universal Search Engine)

Uniwersalny i wysokowydajny silnik wyszukiwawczy (USE) umożliwia pełnotekstowe przeszukiwanie danych. Do zadań USE należy indeksowanie danych udostępnionych przez UB (Universal Backend). Proces wyszukiwania zaindeksowanych danych opiera się o konfigurację różnych opcji wyszukiwania, wpływających na efektywne działanie oraz szybką prezentację wyników. Poniżej zostały przedstawione funkcjonalności wyszukiwania:

Wyszukiwanie

  • pełnotekstowe - indeksowaniu podlega pełny tekst dokumentu i dzięki temu mogą zostać wyszukane wszystkie zawarte w nim informacje. Wyszukiwanie pełnotekstowe udostępnia następujące opcje:
    • słowa
    • frazy
    • łączenie słów i fraz za pomocą operatorów logicznych AND, OR, NOT
    • konteksty - ograniczenie wyszukiwania do wybranego pola dokumentu
    • trafność – ranking obliczany na podstawie liczby wystąpień wyszukiwanych słów i fraz w dokumencie oraz bliskości (odległości dzielącej wyszukiwane słowa)
    • słowniki i stemmery - umożliwiają sprowadzenie wyszukiwanego słowa do jego formy podstawowej, co pozwala na znalezienie słów nawet wówczas, gdy w dokumencie występują w innej formie gramatycznej, niż wyszukiwana (dostępne stemmery dla kilkunastu języków)
    • wyszukanie prefiksowe: automatyczne (wyszukiwanie prefiksowe wszystkich słów), ręczne (wyszukiwanie prefiksowe słów, po których wpisano gwiazdkę), mieszane (słowo jest wyszukiwane w słowniku, jeśli nie ma go w słowniku, to wyszukujemy prefiksowo)
    • nie jest wrażliwe na wielkość liter
  • literalne - wyszukujemy dokładnego łańcucha znaków, a nie poszczególnych słów (wrażliwe na wielkość liter)
  • wartości numerycznych - wyszukiwanie konkretnych wartości lub wartości z określonego przedziału, z wykorzystaniem z operatorów >,>=,<,<= Wartości numeryczne obsługiwane przez USE:
    • liczby całkowite
    • liczby zmiennoprzecinkowe
    • daty
  • multiquery - jednoczesne wyszukiwanie według różnych kryteriów połączone za pomocą nawiasów i operatorów logicznych

Sortowanie

  • po trafności
  • po wartości pola numerycznego
  • po łańcuchach
  • mieszane – iloczyn trafności i wartości pola numerycznego
  • po funkcjach – wartości funkcji są obliczane na podstawie wartości pól dokumentu oraz parametrów podawanych w zapytaniu

Każde kryterium pozwala na sortowanie w porządku normalnym i odwrotnym.

Inne funkcjonalności

  • zwijanie - wyświetlenie w liście wyników po jednym dla każdego z dokumentów, zawierających w wyróżnionym polu taką samą wartość.
  • przycinanie i podświetlanie – prezentacja tej części wybranego dokumentu, która zawiera wyszukane słowa kluczowe, słowa te mogą zostać podświetlone w tekście
  • zliczanie – zliczanie wyników sumarycznych i cząstkowych dla dokumentów należących do zdefiniowanych wcześniej kategorii
  • ustawienia strony – w zapytaniu można określić liczbę wyników do zwrócenia oraz numer pierwszego wyniku do zwrócenia
  • mechanizm indeksów przyrostowych – umożliwia zaindeksowanie nowoprzybyłych danych do repozytorium, w celu dokonania szybkiej aktualizacji wyszukiwanych treści.