APA SIH PENGERTIAN METODOLOGI DATA SCIENCE?
Dalam menyelesaikan masalah pekerjaaan, tentu kita memerlukan tahapan-tahapan atau alur dalam mengerjakan suatu projek. Hal itu tentunya memerlukan step serta alur bagaimana cara kita bisa menyelesaikan suatu projek dengan baik. Sama halnya dalam mengerjakan metodologi data science, ada beberapa step yang kita perlukan dalam mengerjakan metodologi data science dari awal hingga akhir.
Terlepas dari itu semua, yang paling utama adalah memahami pengertian terlebih dahulu. Berikut pengertian serta uraian tentang Metodologi Data Science :
A. Pengertian Metodologi Data Science
Metodologi data science adalah langkah-langkah yang digunakan dalam proyek mengerjakan data science agar dapat menghasilkan hasil yang relevan dan dapat menjawab pertanyaan dari suatu masalah yang ingin diselesaikan.
B. Tujuan Metodologi Data Science
Tujuan Metodologi data science adalah untuk memastikan bahwa data yang akan digunakan dalam membantu memecahkan suatu masalah adalah relevan, yang berarti data tersebut harus jelas asal sumbernya.
C. Membangun Metodologi Data Science
Untuk membangun metodologi data science, dapat mengajukan beberapa pertanyaan seperti berikut :
Dari masalah ke pendekatan:
- Masalah apa yang akan kita coba pecahkan?
- Bagaimana bisa kita menggunakan data untuk menjawab pertanyaannya?
Bekerja dengan data:
- Data apa yang kita butuhkan untuk menjawab pertanyaan?
- Dari mana data ini datang dan bagaimana kita mendapatkannya?
- Apakah data yang kita kumpulkan merepresentasikan masalah yang akan dipecahkan?
- Pekerjaan tambahan apa yang dibutuhkan untuk memanipulasi atau bekerja dengan data?
- Dengan cara apa data dapat divisualisasikan untuk mendapatkan jawaban yang diperlukan?
- Apakah model yang digunakan benar-benar menjawab pertanyaan awal?
- Dapatkah kita mempraktekkan modelnya?
- Bisakah kita mendapatkan feedback yang membangun untuk menjawab pertanyaan?
Mencari jawabannya:
- Dengan cara apa data dapat divisualisasikan untuk mendapatkan jawaban yang diperlukan?
- Apakah model yang digunakan benar-benar menjawab pertanyaan awal?
- Dapatkah kita mempraktekkan modelnya?
- Bisakah kita mendapatkan feedback yang membangun untuk menjawab pertanyaan?
D. Alur Kerja Data Scientists
- Business Understanding
Seorang ilmuwan data mulai menghabiskan waktu mencari penjelasan untuk mencapai apa yang disebut wawasan bisnis. Karena ketika kita mendapatkan kejelasan tentang masalah yang akan dipecahkan, kita dapat menentukan data apa yang akan digunakan untuk menjawab pertanyaan awal.
Sebagai praktisi data, kita perlu memahami apakah tujuannya adalah untuk membuat operasi menjadi lebih efisien? Atau menambahkan aktivitas tertentu? Setelah tujuan ditetapkan, langkah selanjutnya adalah mencari tahu apa yang dapat mendukung tujuan tersebut.
2. Analytic Understanding
Berdasarkan pemahaman bisnis sebelumnya, kita harus memutuskan pendekatan analitis mana yang harus diikuti, yaitu:
- Deskriptif → status saat ini dan informasi yang diberikan.
- Diagnostik → analisis statistik, apa yang terjadi dan mengapa itu terjadi.
- Prediktif → meramalkan tren atau kemungkinan kejadian di masa depan.
- Preskriptif → bagaimana masalah harus diselesaikan.
- Gunakan model prediktif
- Gunakan model deskriptif
- Gunakan model klarifikasi
- Untuk memprediksi selamat atau mati
- Hasil kategoris
- Eksplisit "decision path" menunjukkan kondisi yang mengarah ke resiko tinggi.
- Kemungkinan hasil yang di klasifikasikan
- Mudah dipahami dan diterapkan
- Data mana yang diperlukan?
- Bagaimana cara mengumpulkan data?
- Bagaimana memahami alur kerja transaksi?
- Bagaimana mempersiapkan data untuk memenuhi hasil yang diinginkan?
- Nama dan lokasi apotek
- Transaksi obat
- Memesan barang
- Kategorisasi pembayaran
5. Data Understanding
Pada dasarnya, pada tahap ini data scientist akan menjawab pertanyaan “Apakah data yang kami kumpulkan mewakili masalah yang akan dipecahkan?”. Statistik perlu digunakan untuk memastikan apakah ada nilai yang hilang atau tidak. Terkadang nilai yang hilang bisa berarti “0” atau “tidak” atau bahkan “tidak diketahui”.
Pada tahap ini Data Scientist menentukan apakah data yang disiapkan sudah sesuai atau membutuhkan lebih banyak finishing dan bumbu. Ilmuwan data memiliki kesempatan untuk mengambil sampel data dan fokus pada pengembangan model deskriptif atau prediktif. Berikut adalah alur kerja analisis deskriptif dan prediktif:
Evaluasi model dilakukan selama proses pengembangan model. Di sini Data Scientist memeriksa kualitas model apakah memenuhi persyaratan yang diberikan oleh stakeholder atau tidak. Tahap ini akan menjalani dua tahap pengukuran, yaitu :
- Pengukuran Diagnostik (model berfungsi sebagaimana dimaksud dan di mana modifikasi diperlukan).
- Pengukuran Signifikansi Statistik (memastikan penanganan dan interpretasi data yang tepat).
Komentar
Posting Komentar