ANALISA PERFORMA APACHE HADOOP DENGAN H2O MENGGUNAKAN BENCHMARK HIBENCH VIA CLOUD COMPUTING

Aminudin Aminudin

Abstract


Perkembangan data yang kian cepat dan masif membuat media penyimpanan konvensional kesulitan untuk menyimpan, mengelola dan menganalisa data dengan ukuran yang besar. Untuk mengelola dan menganalisa data yang berukuran besar dapat menggunakan konsep High performance komputer (HPC), tetapi konsep HPC membutuhkan resource serta biaya yang mahal. Untuk mengatasi mahalnya biaya pada penggunaan HPC tersebut dapat menggunakan konsep parallel komputing. Parallel komputing adalah penggunaan beberapa komputer yang saling terhubung untuk mengolah data dalam ukuran yang besar. Salah satu tools parallel komputing yang lagi trend saat ini adalah Apache Hadoop. Apache hadoop dengan segala kelebihanya mampu memproses data yang besar secara parallel dengan membagi pemrosesan ke beberapa node yang digunakan. Berdasarkan dari pengujian yang dilakukan didapatkan Apache Hadoop mampu memproses data dengan algoritma Deep Learning dengan ukuran data sampai 6 GB yang dibagi menjadi empat node. Hasil pengujian berdasarkan parameter yang diujikan menggunakan Benchmark Hibench didapatkan nilai running time, throughput, average memory, average CPU dipengaruhi oleh ukuran data dan jumlah node yang digunakan. 

Keywords


Apache Hadoop; Benchmark Hibench; H2O

Full Text:

PDF

References


L. Liu, “Performance comparison by running benchmarks on hadoop, spark, and hamr,” 2015.

I. Mavridis and H. Karatza, “Performance evaluation of cloud-based log file analysis with Apache Hadoop and Apache Spark,” J. Syst. Softw., vol. 125, pp. 133–151, 2017.

S. Pan, “The Performance Comparison of Hadoop and Spark,” 2016.

A. Zaslavsky, C. Perera, and D. Georgakopoulos, “Sensing as a Service and Big Data,” Proc. Int. Conf. Adv. Cloud Comput., pp. 21–29, 2012.

C. Engineering, P. Chouksey, and A. S. Chauhan, “Weather Data Analytics using MapReduce and Spark,” vol. 6, no. 2, pp. 42–47, 2017.

A. Aminudin and M. Alwi, “Analisa Multithreading Pada Sistem Rekomendasi Menggunakan Metode Collaborative Filtering Dengan,” Techno. Com, vol. 17, no. 1, pp. 1–11, 2018.

P. Khusumanegara, “Analisis Performa Kecepatan Mapreduce Pada Hadoop Menggunakan Tcp Packet Flow,” p. 72, 2014.

S. Humbetov, “Data-intensive computing with map-reduce and Hadoop,” 2012 6th Int. Conf. Appl. Inf. Commun. Technol. AICT 2012 - Proc., 2012.

J. Woo, “Apriori-Map / Reduce Algorithm.”

S. S. Y. Ng, W. Zhu, W. W. S. Tang, L. C. H. Wan, and A. Y. W. Wat, “An independent study of two deep learning platforms - H2O and SINGA,” 2016 IEEE Int. Conf. Ind. Eng. Eng. Manag., pp. 1279–1283, 2016.

Y. Samadi, M. Zbakh, and C. Tadonki, “Comparative study between Hadoop and Spark based on Hibench benchmarks,” 2016.




DOI: https://doi.org/10.22219/sentra.v0i4.2448

Refbacks

  • There are currently no refbacks.


Seketariat

Fakultas Teknik

Universitas Muhammadiyah Malang Kampus III

Jl. Raya Tlogomas 246 Malang, 65144