Apache Nutch

Apache Nutch

Apache Nutch je visoko proširiv i skalabilan projekt softvera za indeksiranje web stranica.Nutch se u cijelosti kodira Java programskim jezikom, ali podaci su zapisani u jezično neovisnim formatima.Ima izrazito modularnu arhitekturu koja omogućava programerima da izrade dodatke za raščlanjivanje medija, pretraživanje podataka, postavljanje upita i klasteriranje.Alat za dohvaćanje ("robot" ili "web pretraživač") napisan je od početka posebno za ovaj projekt.
apache-nutch

Web stranica:

Kategorije

Alternativa Apache Nutchu za BSD sa besplatnom licencom