Back to IF3170 Inteligensi Artifisial

Topic

Questions/Cues

  • Apa itu Data Science?

  • Apa 4 tujuan task analitik?

  • Apa itu CRISP-DM?

  • Apa tujuan dari fase Business Understanding?

  • Apa saja 4 tugas utama dalam fase ini?

  • Apa output dari fase ini?

  • Bagaimana menerjemahkan masalah bisnis ke tujuan data science?

Reference Points

  • IF3170-data-science.pdf (Slide 3-4, 8, 14-16)

  • SKKNI Bidang Keahlian Artificial Intelligence

Definisi dan Tujuan Data Science

Data science adalah bidang studi interdisipliner yang menggabungkan statistika, matematika, dan ilmu komputer untuk mengekstrak pengetahuan dan insight (wawasan) berharga dari data. Tujuannya adalah untuk memahami, menganalisis, dan mendukung pengambilan keputusan yang kompleks.

Ada empat tujuan utama dari sebuah task analitik:

  1. Descriptive: Menjelaskan apa yang terjadi (misalnya, “Berapa total penjualan bulan lalu?”).

  2. Diagnostic: Menjelaskan mengapa sesuatu terjadi (misalnya, “Mengapa penjualan turun di wilayah X?”).

  3. Predictive: Memprediksi apa yang akan terjadi di masa depan (misalnya, “Berapa prediksi penjualan bulan depan?”).

  4. Prescriptive: Menyarankan tindakan terbaik untuk diambil (misalnya, “Strategi apa yang harus diterapkan untuk menaikkan penjualan?”).

Metodologi CRISP-DM

CRISP-DM (Cross-Industry Standard Process for Data Mining) adalah metodologi paling populer dan terstandar dalam proyek data science. Ini adalah proses iteratif (berulang) yang membagi proyek menjadi enam fase utama, memastikan pendekatan yang terstruktur dari awal hingga akhir.

Fase 1: Pemahaman Bisnis (Business Understanding)

Ini adalah fase paling krusial. Tujuannya adalah untuk memahami objektif dan kebutuhan proyek dari perspektif bisnis, lalu mengubah pemahaman ini menjadi definisi masalah data science dan rencana awal untuk mencapainya. Kegagalan di fase ini hampir pasti menyebabkan kegagalan proyek.

Empat tugas utama dalam fase ini adalah:

  1. Menentukan Tujuan Bisnis (Determine Business Objectives):

    • Apa masalah bisnis yang sebenarnya ingin diselesaikan? (misalnya, “menurunkan tingkat kredit macet / Non-Performing Loan (NPL)”).

    • Latar belakang masalahnya apa? Apa yang sudah pernah dicoba?

    • Apa kriteria kesuksesan dari sisi bisnis? (misalnya, “NPL turun sebesar 5% dalam 6 bulan”).

  2. Menilai Situasi (Assess Situation):

    • Inventarisasi sumber daya yang ada: data, personil (domain expert, IT), infrastruktur komputasi.

    • Identifikasi risiko, batasan (constraints), dan asumsi yang ada.

    • Lakukan analisis cost-benefit dari proyek.

  3. Menentukan Tujuan Data Science (Determine Data Science Goals):

    • Menerjemahkan tujuan bisnis menjadi tujuan teknis.

    • Contoh: Tujuan bisnis “menurunkan NPL” diterjemahkan menjadi tujuan data science “membangun model klasifikasi untuk memprediksi kolektibilitas pinjaman (lancar/macet) dengan F1-Score minimal 85%“.

    • Di sini, kita menentukan jenis task (klasifikasi, regresi, clustering) dan metrik evaluasi teknisnya.

  4. Menghasilkan Rencana Proyek (Produce Project Plan):

    • Membuat rencana detail yang menguraikan setiap tahapan, tugas, durasi, dan sumber daya yang dibutuhkan.

    • Mengidentifikasi tools dan teknik yang akan digunakan.

Summary

Proyek data science yang sukses dimulai dengan metodologi terstruktur seperti CRISP-DM, di mana fase fundamentalnya adalah Business Understanding. Pada fase ini, tujuan bisnis yang jelas diidentifikasi, situasi dinilai, lalu diterjemahkan menjadi tujuan data science yang terukur (seperti klasifikasi atau regresi), dan diakhiri dengan sebuah rencana proyek yang komprehensif untuk memandu seluruh proses analitik.