Prinsip Log-Based Recovery

Back to IF3140 Sistem Basis Data

Prinsip Log-Based Recovery: Log, Undo, Redo, & Checkpoint
Questions/Cues

Apa itu Log-Based Recovery?

Apa saja 3 jenis Log Record utama?

Apa arti <Ti, X, V1, V2>?

Apa itu Immediate Database Modification?

Kapan sebuah transaksi dianggap committed?

Kapan kita perlu UNDO transaksi?

Kapan kita perlu REDO transaksi?

Bagaimana proses undo(Ti)?

Bagaimana proses redo(Ti)?

Apa itu Checkpoint?

Apa 3 langkah melakukan Checkpoint sederhana?

Bagaimana Checkpoint mempercepat recovery?

Reference Points

Slides “12 - Recovery System - 1.pdf” (Slide 11-21)
Apa itu Log-Based Recovery?

Log-Based Recovery adalah mekanisme recovery yang paling umum digunakan. Idenya adalah mencatat semua operasi modifikasi database dalam sebuah file khusus yang disebut Log.

Log adalah urutan (sekuensial) dari log records.

Log disimpan di Stable Storage (diasumsikan tidak akan pernah hilang) sehingga bisa digunakan untuk memulihkan data setelah terjadi kegagalan.

Dengan adanya log, sistem dapat melacak apa yang sudah, sedang, dan belum dilakukan oleh setiap transaksi.

Tiga Jenis Log Record Utama

Setiap log record mencatat sebuah kejadian penting. Tiga yang paling fundamental adalah:

<Ti start>: Dicatat saat transaksi Ti memulai eksekusinya.

<Ti, X, V1, V2>: Dicatat sebelum transaksi Ti melakukan perubahan pada item data X.

X: Item data yang diubah.

V1: Nilai lama (old value) dari X.

V2: Nilai baru (new value) dari X.

Ini adalah record terpenting untuk undo dan redo.

<Ti commit>: Dicatat setelah transaksi Ti berhasil menyelesaikan semua operasinya (tetapi datanya mungkin belum ditulis ke disk).

Contoh: Transaksi T10 transfer $50 dari A (1000) ke B (2000)
<T10 start>
<T10, A, 1000, 950>
<T10, B, 2000, 2050>
<T10 commit>
Immediate Database Modification

Ini adalah salah satu strategi modifikasi database yang paling umum, yang secara langsung memengaruhi cara kerja recovery.

Aturan Utama: Log record (<Ti, X, V1, V2>) HARUS ditulis ke stable storage sebelum blok data X yang telah dimodifikasi (di buffer) diizinkan untuk ditulis ke disk. (Ini adalah inti dari Write-Ahead Logging).

Kapan Transaksi Commit?: Sebuah transaksi Ti dianggap telah committed pada saat log record <Ti commit>-nya berhasil ditulis ke stable storage.

Fleksibilitas Penulisan: Blok data yang dimodifikasi di buffer (misal blok A dan B) bisa ditulis ke disk kapan saja, baik sebelum maupun sesudah transaksi commit. Fleksibilitas inilah yang menciptakan kebutuhan akan undo dan redo.

Logika Recovery: Undo vs. Redo

Setelah terjadi system crash, sistem recovery akan memeriksa log untuk menentukan nasib setiap transaksi yang tercatat.

Transaksi Ti perlu di-UNDO (dibatalkan)

Kondisi: Log berisi <Ti start> TAPI TIDAK BERISI <Ti commit> (atau <Ti abort>).

Alasan: Transaksi ini sedang aktif saat crash terjadi. Perubahannya mungkin sudah ada yang ditulis ke disk (melanggar Atomicity). Kita harus membatalkan semua perubahannya untuk memastikan konsistensi.

Transaksi Ti perlu di-REDO (diulangi)

Kondisi: Log berisi <Ti start> DAN BERISI <Ti commit> (atau <Ti abort>).

Alasan: Transaksi ini sudah berhasil commit. Perubahannya WAJIB ada di database (prinsip Durability). Ada kemungkinan crash terjadi setelah commit tapi sebelum semua perubahannya di buffer sempat ditulis ke disk. Kita harus mengulangi perubahannya untuk menjamin durabilitas.

Proses Undo(Ti) dan Redo(Ti)

undo(Ti) (Membatalkan)

Memindai log secara mundur (dari akhir ke awal).

Untuk setiap record <Ti, X, V1, V2>, sistem mengembalikan nilai X di disk menjadi V1 (nilai lama).

Saat melakukan undo, sistem juga menulis log record khusus: Compensation Log Record (CLR), misal <Ti, X, V1>.

Setelah menemukan <Ti start>, sistem menulis <Ti abort> untuk menandakan transaksi ini resmi dibatalkan.

redo(Ti) (Mengulangi)

Memindai log secara maju (dari awal ke akhir).

Untuk setiap record <Ti, X, V1, V2>, sistem menuliskan nilai V2 (nilai baru) ke data item X di disk.

Penting: Operasi redo tidak menghasilkan log record baru.

Apa itu Checkpoint?

Jika tidak ada checkpoint, sistem harus membaca keseluruhan log dari awal setiap kali terjadi crash, yang bisa sangat lama.

Checkpoint adalah sebuah prosedur periodik yang “menandai” log untuk menyederhanakan dan mempercepat proses recovery.

Tiga Langkah Checkpoint Sederhana:

(Selama checkpoint, semua update transaksi dihentikan sementara)

Menulis semua log record yang masih ada di memory buffer ke stable storage (log di disk).

Menulis semua blok data yang telah dimodifikasi di memory buffer ke disk.

Menulis satu log record khusus <checkpoint L> ke stable storage, di mana L adalah daftar semua transaksi yang sedang aktif (belum commit) pada saat itu.

Recovery Menggunakan Checkpoint

Dengan adanya checkpoint, sistem tidak perlu lagi membaca seluruh log.

Sistem memindai log secara mundur dari akhir untuk menemukan record <checkpoint L> terakhir.

Sistem kini hanya perlu peduli pada:

Transaksi yang ada di dalam daftar L.

Transaksi apa pun yang dimulai setelah checkpoint tersebut.

Transaksi yang sudah commit sebelum checkpoint dapat diabaikan dengan aman, karena langkah 2 checkpoint sudah menjamin semua perubahan mereka ada di disk.

Contoh (Slide 21):

T1 (commit sebelum checkpoint): Abaikan.

T2 (aktif saat checkpoint, lalu commit): REDO.

T3 (mulai setelah checkpoint, lalu commit): REDO.

T4 (mulai setelah checkpoint, tidak commit): UNDO.

Summary

Log-Based Recovery menjamin Atomicity dan Durability dengan cara mencatat semua perubahan di log pada stable storage. Log record utama adalah <start>, <commit>, dan <Ti, X, V1, V2> (nilai lama V1, nilai baru V2). Setelah crash, transaksi yang sudah commit akan di-REDO (menulis V2) untuk memastikan Durability, sementara transaksi yang belum commit akan di-UNDO (menulis V1) untuk memastikan Atomicity. Prosedur Checkpoint dilakukan secara periodik untuk menulis data kotor ke disk dan menandai log, sehingga proses recovery tidak perlu memindai seluruh log, melainkan hanya dari titik checkpoint terakhir.

Additional Information

Pendalaman Teknis: Fuzzy Checkpoints vs. Simple Checkpoints

Checkpoint yang dijelaskan di slide (slide 19) disebut Simple Checkpoint, di mana semua aktivitas transaksi dihentikan sementara (“stop-the-world”). Ini tidak efisien untuk sistem besar.

Kebanyakan sistem modern (seperti ARIES) menggunakan Fuzzy Checkpoints:

Sistem menulis log record <checkpoint L> (L = daftar transaksi aktif) ke stable storage.

Sistem kemudian mulai menulis data kotor (modified blocks) dari buffer ke disk di latar belakang, tanpa menghentikan transaksi baru.

Ini berarti pada saat recovery, sistem harus tahu blok data mana yang sudah berhasil ditulis ke disk sejak checkpoint dimulai. Ini membuat algoritma recovery (khususnya fase Analisis) sedikit lebih kompleks, tetapi kinerjanya jauh lebih baik.

Pendalaman Teknis: Compensation Log Records (CLRs)

Saat melakukan undo(Ti), slide 17 menyebutkan penulisan log record khusus (CLR). Mengapa ini penting?

Bayangkan skenario ini:

Sistem melakukan undo untuk transaksi Ti.

Sistem berhasil mengembalikan nilai X ke V1 dan menulis CLR-nya.

Tiba-tiba, sistem crash lagi di tengah-tengah proses undo (misal sebelum Ti selesai di-undo semua).

Saat sistem restart untuk kedua kalinya, ia akan melihat log lagi. Jika tidak ada CLR, ia akan melihat record <Ti, X, V1, V2> asli dan mencoba meng-undo-nya lagi, padahal sudah di-undo.

Dengan adanya CLR, saat restart kedua, sistem melihat CLR tersebut. Aturannya adalah: CLR tidak pernah di-undo. Sistem tahu bahwa aksi undo untuk record tersebut sudah dilakukan, dan ia akan melanjutkan proses undo dari titik sebelum CLR, membuat operasi undo menjadi idempotent (aman diulang) dan restartable.

Sumber & Referensi Lanjutan:

Buku: Silberschatz, Korth, Sudarshan, “Database System Concepts”, 7th Ed, Chapter 19.4 - 19.5.

Konsep: ARIES (Algorithm for Recovery and Isolation Exploiting Semantics).

Istilah Kunci: STEAL/NO-STEAL dan FORCE/NO-FORCE.

STEAL: Buffer boleh menulis data uncommitted ke disk. (Membutuhkan UNDO).

NO-FORCE: Buffer tidak wajib menulis data saat transaksi commit. (Membutuhkan REDO).

Immediate Database Modification (yang kita bahas) adalah kebijakan STEAL / NO-FORCE, yang paling fleksibel namun memerlukan undo dan redo.

IF Notes

Explorer

Prinsip Log-Based Recovery

Questions/Cues

Reference Points

Apa itu Log-Based Recovery?

Tiga Jenis Log Record Utama

Immediate Database Modification

Logika Recovery: Undo vs. Redo

Proses `Undo(Ti)` dan `Redo(Ti)`

Apa itu Checkpoint?

Recovery Menggunakan Checkpoint

Pendalaman Teknis: Fuzzy Checkpoints vs. Simple Checkpoints

Pendalaman Teknis: Compensation Log Records (CLRs)

Sumber & Referensi Lanjutan:

Graph View

Table of Contents

Backlinks

IF Notes

Explorer

Prinsip Log-Based Recovery

Questions/Cues

Reference Points

Apa itu Log-Based Recovery?

Tiga Jenis Log Record Utama

Immediate Database Modification

Logika Recovery: Undo vs. Redo

Proses Undo(Ti) dan Redo(Ti)

Apa itu Checkpoint?

Recovery Menggunakan Checkpoint

Pendalaman Teknis: Fuzzy Checkpoints vs. Simple Checkpoints

Pendalaman Teknis: Compensation Log Records (CLRs)

Sumber & Referensi Lanjutan:

Graph View

Table of Contents

Backlinks

Proses `Undo(Ti)` dan `Redo(Ti)`