Sains Data & Geofisika (Sains Data #1)

By Zulfakriza Z. - Juli 14, 2021

Sains data (Data Science) dapat diartikan sebagai ilmu pengetahuan interdisi- plin yang memanfaatkan metode komputasi untuk mendapatkan sebuah informasi dari setiap fenomena yang berdasarkan kumpulan data dalam tiga fase, yaitu de- sain data, mengumpulkan data, dan analisis data [1]. Tentunya sebagai sebuah ilmu interdisiplin, sains data secara lebih spesifik memiliki arti yang berbeda-beda tergantung pada bidang keilmuan dan sudut pandang dari setiap akademisi.

Secara sederhana dapat dikatakan bahwa Sains Data merupakan ilmu terapan yang secara khusus mempelajari dan menganalisis data. Fungsi ilmu Sains Data dalam era digital dan big data saat ini cukup penting karena begitu melimpahnya data yang tersedia. Data menyediakan informasi yang dapat menentukan keputusan penting dalam berbagai sektor baik itu industri dan pemerintahan.

Sebagai contoh, interaksi dengan market place yang dilakukan secara daring merupakan bagian dari Sains Data. Pada setiap transaksi yang dilakukan oleh pelanggan menjadi data penting dari penyedia jasa market place untuk memahami pola dan kecenderungan jenis barang yang banyak diminati oleh pelanggan. Setiap barang yang terjual akan menjadi data bagi perusahaan market place untuk mem- buat keputusan-keputusan bisnis yang menguntukan bagi perusahaan. Tentunya, semakin akurat data yang diperoleh akan memberikan pengambilan keputusan yang lebih baik untuk kemajuan dan peningkatan profit perusahaan.

Dengan kata lain, sains data dapat dikatakan sebagai sebuah kajian multidisi- plin yang berhubungan dengan beberapa bidang kajian. Secara sederhana, sains data dan hubungannya dengan bidang keilmuan lain diilustrasikan dalam Gambar 1. Sains data pada dasarnya adalah sebuah subjek yang interdisipliner. Sains data terdiri dari tiga bidang ilmu yang berbeda dan saling beririsan. Ketiga ilmu itu adalah (1) ilmu statistik yang menuntun untuk memahami cara membuat model dan meringkas kumpulan data (kondisi data yang tumbuh bertambah banyak); (2) ilmu komputer yang memberikan pemahaman merancang dan menggunakan algo- ritma untuk menyimpan, memproses, dan memvisualisasikan data secara baik dan efesien; (3) domain expertise yang merupakan sebuah keahlian untuk merumuskan permasalahan secara tepat dan menemukan solusi secara benar. Domain expertise merupakan salah satu prasyarat penting yang dibutuhkan dalam data mining. Secara umum, domain experties dapat diartikan sebagai pengetahuan dan pemahaman tentang hal-hal penting yang perlu dilakukan dalam proses penyelidikan tertentu. Dengan kata lain, domain experties digunakan untuk mengevaluasi input, memandu proses dan mengevaluasi produk akhir dalam konteks nilai dan validitas.

Gambar 1. Diagram yang menjelaskan hubungan antara pengetahuan matematika dan statistik, kemampuan komputasi dan pengetahuan geosains terhadap sains data.

Pada bidang geofisika tentunya kebutuhan akan data menjadi hal yang utama. Fenomena kebumian yang rumit dapat dipahami secara baik jika memiliki data yang akurat dan mewakili objek yang dikaji. Misalkan dalam bidang seismologi, untuk memahami sumber gempabumi secara baik, dibutuhkan data waveform gempa yang akurat dari sejumlah rekaman seismograf yang mewaliki zona sumber gempa. Pembahasan lebih rinci tentang geofisika dan hubungannya dengan data akan dijelaskan pada bagian berikutnya.

Kembali ke Sains Data, pada dasarnya, Sains Data mempelajari data baik itu data yang terstruktur maupun tidak terstruktur. Selain itu, data yang dianalisis merupakan data yang bersifat kualitatif dan numerik yang dipelajari dalam ilmu statistika, aktuaria dan matematika. Pada proses aplikasinya tentu berhubungan dengan komputasi dan bahasa pemrograman. Dalam buku ini, permasalahan Sains Data diselesaikan dengan bantuan Bahasa Python.

Kenapa harus Python? hal ini menjadi pertanyaan yang dapat dijawab den- gan sebuah jawab ”karena Python itu bebas lisensi dan relatif mudah digunakan”. Dalam komunitas Sains Data, bahasa Python menjadi bahasa yang umum digunakan. Silakan berselancar pada laman berikut [2] sebagai salah satu informasi penggunaan Bahasa Python pada Sains Data.

Referensi:

[1]  Chikio Hayashi, Keiji Yajima, Hans-Hermann Bock, Noboru Ohsumi & Yutaka Tanaka (1996). Data Science, Classification, and Related Methods, Proceedings of the Fifth Conference of the International Federation of Classification Societies (IFCS- 96), Kobe, Japan, March 27–30, 1996

[2]  https://www.datacamp.com/tracks/data-scientist-with-python


  • Share:

You Might Also Like

0 comments

PyGMT, Paket Python untuk Generic Mapping Tools (GMT)

Ada hal menarik bagi para peminat GMT ( Generic Mapping Tools ), khususnya yang senang bermain-main dengan peta dan ploting grafik atau...