Den Code meiner Simulationsanwendung habe ich jetzt für die Anwendung der Funktion mclapply aus dem Package Multicore angepasst, jetzt gilt es den Effekt der Parallelisierung auszuprobieren.
Lokale Simulation sequentiell:
1,15 Sekunden pro Lauf → etwa 190 Minuten für 10.000 Simulationen (eine Periode)
Lokale Simulation parallel:
0,35 Sekunden pro Lauf → etwa 60 Minuten für 10.000 Simulationen (eine Periode)
Amazon Cloud:
0,15 Sekunden pro Lauf → etwa 25 Minuten für 10.0000 Simulationen (eine Periode)
Bei Amazon habe ich dafür die High-Memory Quadruple Extra Large (Vierfach XL) Instance benutzt:
68,4 GB Speicher
26 EC2 Compute Units (8 virtuelle Kerne mit je 3,25 EC2 Recheneinheiten)
1.690 GB Instance-Speicher
64-Bit-Plattform
E/A-Leistung: Hoch
Als EBS-optimiert verfügbar: 1000 Mbps
API-Name: m2.4xlarge
Für diese Instanz berechnet Amazon laut Preisliste 1,80$ pro Stunde, als Spot Instance habe ich 0,18$ gezahlt. Eine stabile Berechnung würde damit dann etwa 0,075$ kosten.
Die nächste Stufe wäre dann die Bündelung mehrerer Instanzen über Hadoop…