Disco MapReduce

Disco MapReduce

Disco je lagani okvir otvorenog koda za raspodijeljeno računanje temeljen na paradigmi MapReduce i napisan u Python-u.
Disco je implementacija mapreduce-a za raspodijeljeno računanje.Disco podržava paralelne proračune na velikim skupovima podataka, pohranjenim na nepouzdanom skupu računala, kao u izvornom okviru kojeg je stvorio Google.To ga čini savršenim alatom za analizu i obradu velikih skupova podataka, bez brige o teškim tehničkim podacima povezanima s distribucijom poput komunikacijskih protokola, balansiranja opterećenja, zaključavanja, rasporeda poslova i tolerancije grešaka, kojima Disco upravlja.

Web stranica:

Značajke

Kategorije

Alternativa Disco MapReduceu za sve platforme s bilo kojom licencom

Apache Hadoop

Apache Hadoop

Apache Hadoop je softver otvorenog koda koji podržava distribuirane aplikacije s intenzivnom distribucijom podataka licencirane pod licencom Apache v2.
Apache Spark

Apache Spark

Apache Spark ™ je brz i općenit motor za obradu podataka velikih razmjera. SpeedRun programi do 100 puta brži od Hadoop MapReduce u memoriji ili 10 puta brži na disku.
Amazon Kinesis

Amazon Kinesis

Amazon Kinesis usluge olakšavaju rad s streamingom podataka u stvarnom vremenu u AWS oblaku.
dispy

dispy

dispy je Python-ov okvir za paralelno izvršavanje računa distribucijom na više procesora na jednom stroju (SMP), među mnogim strojevima u klasteru ili ...