0
Newspaper
Novine su izvlačenje metapodataka vijesti, cjelovitih tekstova i članaka izgrađeno pomoću Pythona 3. OSOBINE - Radi na 10+ jezika (engleski, kineski, njemački, arapski, ...) - Okvir za preuzimanje članaka s više navoja - identifikacija URL-a vijesti -Vađenje teksta iz html-a - Izvlačenje gornjih slika iz html-a - Sve ekstrakcije slika iz html-a - Vađenje ključnih riječi iz teksta - Vađenje sažetka iz teksta - Autorsko izdvajanje iz teksta - Izvlačenje Google trendova
Web stranica:
http://newspaper.readthedocs.io/Kategorije
Alternativa Newspaperu za Web s komercijalnom licencom
13
ScrapeHero
Internetska usluga skeniranja za prikupljanje podataka s web stranica, bez ikakvog alata za programiranje ili samostalno izrađivanje.,
- Plaćena
- Web