Teorema CAP dan Model Konsistensi Data

Back to IF3130 Sistem Paralel dan Terdistribusi

Teorema CAP dan Spektrum Model Konsistensi

Questions/Cues

Apa itu Teorema CAP?

Siapa yang mengajukan?

3 Properti CAP?

(1) Consistency?

(2) Availability?

(3) Partition Tolerance?

Aturan CAP?

Mengapa P wajib?

Pilihan di dunia nyata? (CP vs AP)

Contoh sistem CA?

Contoh sistem CP?

Contoh sistem AP?

Apa itu ‘Consistency Model’?

Apa itu ‘Strong’ vs ‘Weak’?

Model Kuat: Linearizable?

Model Kuat: Sequential?

Perbedaan Linearizable vs Sequential?

Model Lemah: Causal?

Model Lemah: Eventual?

Reference Points

Slides 20-31

Teorema CAP

Diajukan oleh Eric Brewer (1999). Ini adalah “hukum” fundamental dalam desain sistem terdistribusi.

Teorema ini menyatakan bahwa sistem terdistribusi untuk penyimpanan data hanya dapat memilih 2 dari 3 properti berikut:

C (Consistency / Konsistensi): Strong Consistency. Setiap read request akan menerima data write terakhir yang paling up-to-date. Semua node melihat data yang sama pada saat yang sama.

A (Availability / Ketersediaan): Sistem selalu merespons setiap permintaan (yang tidak gagal). Respons dijamin non-error, meskipun datanya mungkin bukan yang terbaru (stale).

P (Partition Tolerance / Toleransi Partisi): Sistem tetap dapat beroperasi (merespons) meskipun terjadi network partition (jaringan terputus antar node).

Pilihan di Dunia Nyata: CP vs. AP

Di jaringan nyata seperti WAN/Internet, network partition (P) tidak bisa dihindari (lihat Fallacy #1). “P” adalah kenyataan, bukan pilihan.

Oleh karena itu, pilihan desainer sistem di dunia nyata adalah antara CP atau AP:

Sistem CA (Consistency + Availability): Mengorbankan Toleransi Partisi.

Contoh: Database relasional tunggal (non-terdistribusi) atau protokol 2PC (Two-Phase Commit) di jaringan yang sangat andal (misal: LAN). Tidak cocok untuk internet.

Sistem CP (Consistency + Partition Tolerance): Mengorbankan Ketersediaan.

Strategi: Saat terjadi partisi, sistem akan berhenti merespons (menjadi unavailable) untuk menghindari data yang tidak konsisten.

Contoh: Algoritma konsensus (Paxos, Raft), sistem perbankan.

Sistem AP (Availability + Partition Tolerance): Mengorbankan Konsistensi (kuat).

Strategi: Saat terjadi partisi, sistem tetap merespons (tetap available), meskipun data yang dikembalikan mungkin stale (kedaluwarsa). Sistem akan menggunakan eventual consistency.

Contoh: Amazon DynamoDB, Cassandra, Gossip protocols, DNS.

Consistency Model (Spektrum Konsistensi)

“Consistency” bukanlah biner (ya/tidak), melainkan sebuah spektrum dari yang terkuat hingga terlemah.

Strong Consistency Models (Model Kuat):

Linearizable Consistency: Paling kuat. Setiap operasi terlihat dieksekusi atomic dan instantaneous (seketika). Urutannya harus sesuai dengan real-time ordering (jika A selesai sebelum B mulai, efek A harus terlihat oleh B).

Sequential Consistency: Sedikit lebih lemah dari Linearizable. Operasi terlihat atomic, dan semua node setuju pada satu urutan global, TAPI urutan itu tidak harus sesuai real-time.

Weak Consistency Models (Model Lemah):

Causal Consistency: Hanya menjamin urutan happened-before (sebab-akibat). Jika A $\to$ B, maka B pasti melihat efek A. Operasi yang concurrent (tidak ada hubungan sebab-akibat) boleh terlihat dalam urutan berbeda oleh node berbeda.

Eventual Consistency: Paling lemah. Jaminan bahwa jika tidak ada update baru untuk sementara waktu, semua node pada akhirnya (eventually) akan memiliki nilai yang sama (konvergen).

Summary

Teorema CAP (Brewer) menyatakan sistem terdistribusi hanya bisa memilih dua dari tiga properti: Consistency (C), Availability (A), atau Partition Tolerance (P). Karena (P) adalah keharusan di dunia nyata, desainer harus memilih antara sistem CP (mengutamakan konsistensi, mengorbankan ketersediaan) atau AP (mengutamakan ketersediaan, mengorbankan konsistensi). “Konsistensi” sendiri adalah sebuah spektrum, mulai dari Linearizable (paling kuat dan mahal) hingga Eventual Consistency (paling lemah dan cepat).

Additional Information

Pendalaman: Linearizable vs. Sequential (Slide 29)

Diagram di slide 29 adalah contoh sempurna.

Mengapa Tidak Linearizable?

Client 1 melakukan WRITE(X:10) ke Node A (T1).

Node A selesai menulis dan membalas ke Client 1 (T3).

Setelah itu, Client 2 melakukan READ(X) ke Node C (T4).

Node C (yang belum menerima update dari A) mengembalikan nilai lama (misal, X=5) ke Client 2 (T6).

Ini melanggar Linearizability karena operasi READ(X) (T4-T6) secara real-time terjadi setelah operasi WRITE(X:10) (T1-T3) selesai. Read seharusnya melihat nilai baru.

Mengapa (Mungkin) Sequential?

Sistem ini bisa jadi Sequential Consistent jika semua node setuju pada satu urutan sejarah (history) global, misalnya: READ(X) $\rightarrow$ WRITE(X:10).

Meskipun urutan ini tidak sesuai real-time, ini adalah urutan yang valid secara sekuensial dan bisa dilihat oleh semua node.

Pendalaman: Client-Centric Consistency (Slide 28)

Banyak model lemah yang bersifat “Client-Centric”, artinya jaminan konsistensi hanya berlaku untuk satu sesi client. Ini jauh lebih mudah diimplementasikan.

Contoh (dari slide 30):

Monotonic Reads: Jika Anda membaca nilai X, lalu membaca X lagi, Anda dijamin tidak akan pernah melihat nilai X yang lebih lama dari yang pertama. (Anda hanya melihat nilai yang sama atau lebih baru).

Read Your Writes: Jika Anda menulis nilai X=10, lalu Anda membaca X, Anda dijamin akan melihat X=10 (atau yang lebih baru), bukan nilai lama. (Sangat intuitif untuk pengguna).

Writes Follow Reads: Jika Anda membaca X=5, lalu Anda menulis X=10, operasi tulis Anda dijamin terjadi setelah operasi baca X=5.

Sumber & Referensi Lanjutan:

Artikel: “CAP Twelve Years Later: How the ‘Rules’ Have Changed” oleh Eric Brewer. (Penjelasan modern dari si penemu tentang bagaimana CAP sering disalahpahami).

Jepsen.io: https://jepsen.io/consistency (Situs oleh Kyle Kingsbury yang menguji database terdistribusi untuk melihat apakah mereka benar-benar memenuhi jaminan konsistensi yang mereka iklankan).

IF Notes

Explorer

Teorema CAP dan Model Konsistensi Data

Questions/Cues

Reference Points

Teorema CAP

Pilihan di Dunia Nyata: CP vs. AP

Consistency Model (Spektrum Konsistensi)

Pendalaman: Linearizable vs. Sequential (Slide 29)

Pendalaman: Client-Centric Consistency (Slide 28)

Sumber & Referensi Lanjutan:

Graph View

Table of Contents

Backlinks