Indicizzazione full-text e ranking

Twproject indicizza ogni testo salvato nei suoi oggetti, come task, documenti, allegati, issue, risorse, commenti e così via.

Esso usa Lucene, un potente motore di ricerca open source.

Lucene è documentato qui:

http://lucene.apache.org/java/docs/index.html

Ci sono alcuni parametri da configurare:

screen1091

Prima di tutto la localizzazione del file di indice, poi la lingua dell’analyzer. Questo analyzer è usato per stemmare correttamente i tuoi dati. Lo stemming consente di cercare “work” e trovare anche “working”, ovviamente funziona bene se la lingua di ciò che stai scrivendo e lo stemmer coincidono.

In goni caso Twproject usa anche la corrispondenza esatta nelle ricerche.

Seguendo il link “index management”:

screen1092

Qui puoi vedere lo stato della macchina di indicizzazione, interrompere il job o forzare una nuova indicizzazione.

Pagina di gestione degli hit

Gli hit sono usati da Twproject per calcolare il rank. Tutti i dati di “hit” sono denormalizzati per migliorare le performance, quindi c’è un’azione programmata per pulire gli.
Gli hit sono automaticamente puliti e gestiti, eventualmente puoi usare questa pagina per dare uno sguardo e eventualmente riparare gli hit.

screen1093