
0
Newspaper
Novine su izvlačenje metapodataka vijesti, cjelovitih tekstova i članaka izgrađeno pomoću Pythona 3. OSOBINE - Radi na 10+ jezika (engleski, kineski, njemački, arapski, ...) - Okvir za preuzimanje članaka s više navoja - identifikacija URL-a vijesti -Vađenje teksta iz html-a - Izvlačenje gornjih slika iz html-a - Sve ekstrakcije slika iz html-a - Vađenje ključnih riječi iz teksta - Vađenje sažetka iz teksta - Autorsko izdvajanje iz teksta - Izvlačenje Google trendova
Web stranica:
http://newspaper.readthedocs.io/Kategorije
Alternativa Newspaperu za sve platforme s bilo kojom licencom

13
ScrapeHero
Internetska usluga skeniranja za prikupljanje podataka s web stranica, bez ikakvog alata za programiranje ili samostalno izrađivanje.,
- Plaćena
- Web

0
artoo.js
artoo.js je dio JavaScripta koji se treba pokretati u konzoli preglednika kako bi vam pružio neke uslužne programe za struganje.
- Besplatna
- Chrome
- JavaScript
- Node.JS
- Web
- Self-Hosted