Apache Spark

Apache Spark

Apache Spark ™ je brz i općenit motor za obradu podataka velikih razmjera. SpeedRun programi do 100 puta brži od Hadoop MapReduce u memoriji ili 10 puta brži na disku.
Apache Spark ™ je brz i općeniti motor za veliku obradu podataka.Programi za brzo pokretanje do 100 puta brži od Hadoop MapReduce u memoriji ili 10 puta brži na disku.Spark ima napredni mehanizam za izvršavanje DAG-a koji podržava ciklički protok podataka i računanje u memoriji.
apache-spark

Web stranica:

Alternativa Apache Sparku za Linux

Apache Hadoop

Apache Hadoop

Apache Hadoop je softver otvorenog koda koji podržava distribuirane aplikacije s intenzivnom distribucijom podataka licencirane pod licencom Apache v2.
Disco MapReduce

Disco MapReduce

Disco je lagani okvir otvorenog koda za raspodijeljeno računanje temeljen na paradigmi MapReduce i napisan u Python-u.