-
Notifications
You must be signed in to change notification settings - Fork 2
Open
Description
- a intervalli regolari, o quando una directory cambia (si puo' essere
notificati quando questo succede dal servizio "inotify" di Linux):- se non esiste, nello share samba, una directory chiamata
"ninuxoo_index", questa viene creata ed al suo interno viene creato un
file compresso con dentro l'elenco di tutti i file e directory dello
share samba - se invece la directory ninuxoo_index esiste, ed all'interno si
trova il file compresso con la descrizione di file e directory, viene
generato un diff file con i cambiamenti. Se esistono gia' dei diff file,
ne viene tenuto conto e fatto il diff solo rispetto all'ultimo - ogni tot (tipo ogni settimana) i diff sono raggruppati dentro un
unico file e si ricomincia da capo con i nuovi diff file - il crawler passa e se esiste la directory ninuxoo_index, se ha gia'
scaricato in precedenza il file descrittivo della directory, scarica
solo i diff che gli mancano, altrimenti scarica tutto quello che c'e'
nel ninuxoo_index, applica i diff, e parsa - se ninuxoo_index/ non esiste fa il crawl "normale"
- implementiamo una nuova chiamata JSON "crawl_me" su ninuxoo "main"
che quando viene chiamata fa il "crawl on demand" di uno share
- se non esiste, nello share samba, una directory chiamata
I vantaggi di questo sistema sono che:
- e' indipendente dal tipo di share: funziona sia su samba che su ftp
che su http - se c'e' qualche problema sul crawler, non si incasina tutto perche'
hai il ninuxoo_index sempre in uno stato consistente - non hai bisogno di mettere su un servizio http apposta
- si usano file compressi, che quindi sono piu' veloci da scaricare
- non aggiunge potenziali buchi di sicurezza
Reactions are currently unavailable
Metadata
Metadata
Assignees
Labels
No labels