Blog.YHT.Web.ID

Icon

Bosan adalah awal dari penciptaan perubahan.

Analytics Platform berbasis R

Sampai dengan beberapa bulan terakhir ini salah satu pekerjaan saya adalah melakukan riset untuk penggunaan teknologi berbasis free software atau open source software dalam hal perangkat analisis data. Mengingat data yang ada pada instansi di tempat saya bekerja mengumpulkan sebagian besar data dari pihak ketiga, bisa dibilang analisis yang diperlukan memerlukan kemampuan untuk menganalisis big data.

Sebenarnya riset mengenai big data sendiri sebagai basis data telah dilakukan oleh bagian lain dengan melakukan pengembangan berbasis Hadoop. Dalam pengembangan ini bagian saya hanya mendukung dalam hal perangkat keras yang digunakan sebagai riset. Menurut kabar mereka menggunakan paket distribusi dari cloudera di atas CentOS.

Sedangkan dalam hal perangkat analisis saya mendapatkan mandat untuk melakukan riset perangkat apa saja dan bagaimana penggunaannya di bagian tempat saya bertugas. Pilihan yang ada tidak lain dan tidak bukan adalam lingkungan pengembangan dan analisis berbasis R. Berikut perangkat yang termasuk dalam perangkat analisis.

Sistem Operasi

Sistem Operasi yang digunakan pada perangkat analisis adalah Debian (Linux) 8.x (Jessie).

Pertimbangan penggunaan sistem operasi ini adalah kestabilan dalam setiap rilis dan dukungan komunitas pengembang dan pengguna. Dan bukan kebetulan, saya memang lebih familier dengan sistem operasi berbasis debian daripada yang lain, selain Slackware tentunya.

Basis Data

Di dalam perangkat analisis terdapat MongoDB dan MySQL yang dapat diisi dengan data dan digunakan sebagai basis dalam melakukan analisis.

Selain itu, perangkat analisis ini akan terhubung dengan Impala yang ada dalam infrastruktur Hadoop.

Perangkat Analisis

Seperti telah saya sebutkan di atas, perangkat analisis ini menggunakan lingkungan pengembangan dan analisis berbasis R. Pada perangkat analisis terdapat RStudio server dan Shiny server yang dapat melayani tugas analis melalui protokol web.

Pada mesin analis terdapat beberapa perangkat.

  • RRO, Revolution R Open, distribusi R yang dikembangkan oleh Revolution Analytics
  • Rattle, paket data miner yang dikembangkan oleh Lead Data Scientist di ATO, Dr Graham J Williams
  • R Analytic Flow, penggambaran proses analisis melalui diagram alur

Mengingat semua akan dalam satu lingkungan, saya juga menyiapkan repository CRAN di jaringan lokal.

Dokumentasi

Dalam dokumentasi akan menggunakan TeX sebagai basis dokumentasi. Lingkungan R sendiri telah memiliki paket yang dapat membuat laporan berupa pdf dengan memanfaatkan perangkat berbasis Tex.

Dan dengan mengingat akan dibutuhkan banyak paket pendukung, saya juga menyiapkan repository CTAN di jaringan lokal.

Perangkat Pendukung

Selain perangkat-perangkat di atas beberapa perangkat juga dipasang.

  • MediaWiki, perangkat ini digunakan sebagai Knowledge Management System.
  • WordPress, sebagai media massa lokal
  • Jenkins-CI, perangkat pengembangan berkesinambungan

Ini bukan versi baku. Masih akan ada pengembangan lebih lanjut dalam riset ini.

NB : Saya hanya menumpahkan catatan mengenai sebagian pekerjaan yang saya lakukan. Ini mungkin juga bukan kondisi sebenarnya. 😉

Kategori: /artikel

Tag: , , , , , , ,

Leave a Reply