Dasar banget ini buat ngejar pemahaman

Back to IF2224 Teori Bahasa Formal dan Otomata

1. Konsep Dasar Finite Automata (FA)

(a) Perbedaan DFA/NFA:

Jelaskan perbedaan utama antara fungsi transisi ( $δ$ ) pada DFA dan NFA!

DFA → Transisi ke satu state
NFA → Transisi bisa lebih dari satu state

(b) Tracing DFA:

Diberikan DFA berikut ( $Σ = {0, 1}$ , $q_{0} = A$ , $F = {C}$ ):

State	0	1
$\to A$	B	A
B	B	C
$* C$	B	A

Tentukan state akhir setelah DFA membaca string 10110! Apakah string tersebut diterima?

$δ (A, 1) = A$
$δ (A, 0) = B$
$δ (B, 1) = C$
$δ (C, 1) = A$
$δ (A, 0) = B$

Bukan di final state → Ditolak

Diberikan $ϵ$ -NFA berikut:

$Q = {q_{0}, q_{1}, q_{2}}$
$Σ = {a, b}$
$q_{0}$ = Start State
$F = {q_{2}}$
Transisi $δ$ :
- $δ (q_{0}, ϵ) = {q_{1}}$
- $δ (q_{1}, a) = {q_{1}}$
- $δ (q_{1}, b) = {q_{2}}$
- $δ (q_{2}, ϵ) = {q_{0}}$

Hitunglah $ECLOSE (q_{0})$ dan $ECLOSE (q_{2})$ !

Cara cari ECLOSE: Masukin yang diminta ke himpunannnya. Liat ada transisi ke epsilon atau engga. Kalau ada, masukin next statenya

$EC L OSE = {q_{0}}$ $EC L OSE = {q_{0}, q_{1}}$

$EC L OSE = {q_{2}}$ $EC L OSE = {q_{2}, q_{0}}$ $EC L OSE = {q_{2}, q_{0}, q_{1}}$

2. Ekuivalensi & Regular Expression (RE)

(a) Subset Construction:

Jelaskan ide utama di balik algoritma Subset Construction untuk mengubah NFA menjadi DFA! State baru di DFA merepresentasikan apa?

Subset Construction bertujuan untuk menghilangkan nondeterminisme di NFA. Satu state di DFA baru akan melambangkan himpunan state lama di NFA.

(b) Regular Expression:

Tuliskan Regular Expression (RE) untuk bahasa $L$ pada $Σ = {a, b}$ yang terdiri dari semua string yang:

Dimulai dengan ‘a’.
Diikuti oleh nol atau lebih ‘b’.
Diakhiri dengan ‘a’.

Contoh string diterima: aa, aba, abba, abbba.
Contoh string ditolak: a, b, ba, baa.

ab*a

3. Properties Bahasa Reguler

(a) Pumping Lemma:

Apa tujuan utama dari Pumping Lemma? Sebutkan 3 kondisi yang harus dipenuhi oleh pemecahan string $w = x yz$ dalam Pumping Lemma!

Jawaban:

Bertujuan utama menunjukkan bahwa sebuah bahasa BUKAN bahasa reguler.

3 Kondisi:

|xy| < n

|y| > 0

Untuk setiap $i > 0$ , berlaku $x y^{i} z \in L$

Untuk membuktikan bahasa $L = {a^{k} b^{2 k} ∣ k \geq 0}$ bukan reguler menggunakan Pumping Lemma, string $w$ mana yang paling strategis untuk dipilih (dengan $n$ adalah pumping length)?

(i) $a^{n} b^{n}$ (ii) $a^{n} b^{2 n}$ (iii) $(ab)^{2 n}$ (iv) $b^{2 n} a^{n}$

(ii). Ini bentuk umum string di L. Kalau kita pecah ke x, y, dan z, kan xy < n, berarti xy tuh pasti kumpulan string a.

Kita definisikan $x = a^{j}, y = a^{k}, z = a^{n - j - k} b^{2 n}$

Misalkan kita pilih $i = 0$ :

Artinya tercipta string baru $w = x z = a^{j} a^{n - j - k} b^{2 n} = a^{n - k} b^{2 n}$

Padahal, $n - k \neq = n$ . Maka kontradiksi terjadi. L bukan bahasa reguler.

(b) Closure Properties:

Jika $L_{1}$ adalah bahasa reguler (diterima oleh DFA $M_{1}$ ) dan $L_{2}$ adalah bahasa reguler (diterima oleh DFA $M_{2}$ ), apakah bahasa $L = L_{1} \cup L_{2}$ (gabungan $L_{1}$ dan $L_{2}$ ) juga dijamin reguler? Jelaskan secara singkat mengapa!

Ya, dijamin reguler. Karena jika $L_{1}$ punya RE $R_{1}$ dan $L_{2}$ punya RE $R_{2}$ , maka $L_{1} \cup L_{2}$ memiliki RE $R_{1} + R_{2}$ , yang juga merupakan RE valid.

Diketahui $L_{1} = {string biner dengan jumlah 0 genap}$ dan $L_{2} = {string biner dengan jumlah 1 ganjil}$ . Keduanya adalah bahasa reguler. Apakah bahasa $L_{3} = L_{1} \cap L_{2}$ (string dengan jumlah 0 genap DAN jumlah 1 ganjil) juga reguler? Mengapa?

Ya, $L_{3}$ reguler. Karena kelas bahasa reguler tertutup (closed) terhadap operasi irisan (intersection).

Apa tujuan dari minimasi DFA? Kriteria dasar apa yang digunakan oleh Algoritma Table-Filling untuk menandai pasangan state yang distinguishable (dapat dibedakan) pada langkah awalnya?

Tujuan: Mendapatkan DFA dengan jumlah state paling sedikit yang menerima bahasa yang sama (efisien dan representasi standar).

Kriteria Dasar (Basis): Menandai semua pasangan state ${p, q}$ di mana salah satunya adalah final state dan yang lainnya bukan final state. Pasangan ini jelas dapat dibedakan oleh string kosong ( $ϵ$ ).

Perhatikan DFA berikut:

$Q = {A, B, C}$ , $q_{0} = A$ , $F = {C}$
$δ (A, 0) = B$ , $δ (A, 1) = A$
$δ (B, 0) = C$ , $δ (B, 1) = B$
$δ (C, 0) = C$ , $δ (C, 1) = C$

Gunakan Algoritma Table-Filling untuk menentukan state yang indistinguishable:

Identifikasi state Final (F) dan Non-Final (N).
Langkah Basis: Pasangan mana saja yang langsung ditandai (distinguishable) karena merupakan pasangan (F, N)?
Langkah Induksi: Periksa pasangan (A, B). Apakah $δ (A, 0)$ dan $δ (B, 0)$ mengarah ke pasangan yang sudah ditandai di langkah 2? Jika ya, tandai (A, B).
Kesimpulan: Pasangan state mana yang tersisa (tidak ditandai) sebagai indistinguishable?

F = {C}, N = {A, B}

(A, C) dan (B, C)

(A, B)

Tidak ada

4. Context-Free Grammar (CFG) & Parse Tree

(a) Definisi CFG:

Sebuah CFG didefinisikan sebagai $G = (V, T, P, S)$ . Jelaskan secara singkat apa arti dari masing-masing komponen $V, T, P, S$ !

V = Variabel (Simbol non-terminal)

T = Terminal (Simbol dasar)

P = Production Rule (Cara ubah suatu Variabel jadi Variabel/Terminal)

S = Simbol Awal (Tempat mulai derivasi)

(b) Derivasi:

Diberikan CFG berikut:

$V = {S, A}$
$T = {0, 1}$
$P = {S \to 0 A 1, A \to 1 A ∣ ϵ}$
$S = S$

Lakukan leftmost derivation untuk menghasilkan string 011!

Mulai dari S S → 0A1 Pilih variabel paling kiri, A (dengan production rule A → 1A) S → 01A1 Ambil lagi variabel paling kiri (dengan production rule A → $ϵ$ ) S → 01 $ϵ$ 1 = 011

Gambarkan Parse Tree yang sesuai dengan derivasi yang kamu lakukan di soal (b)!

(d) Rekursif Kiri:

Apa masalah yang disebabkan oleh aturan produksi rekursif kiri (contoh: $E \to E + T$ ) pada metode parsing top-down?

Menyebabkan parser masuk ke dalam loop tak terbatas (infinite loop). Parser akan terus mencoba mengekspansi variabel yang sama (misal ‘E’) tanpa pernah membaca input, karena pilihan pertama ekspansinya adalah memanggil dirinya sendiri lagi.

Cara Memperbaiki Rekursif Kiri (Contoh): Aturan rekursif kiri umumnya berbentuk: $A \to A α ∣ β$ (di mana $α$ adalah bagian rekursif, dan $β$ adalah bagian non-rekursif yang tidak dimulai dengan A). Cara memperbaikinya adalah dengan mengubah aturan menjadi:

$A \to β A^{'}$

$A^{'} \to α A^{'} ∣ ϵ$ (di mana $A^{'}$ adalah variabel baru).

Contoh Penerapan: Misalkan aturan asli: $E \to E + T ∣ T$

Identifikasi: $A = E$ , $α = + T$ , $β = T$ .

Terapkan transformasi:

$E \to T E^{'}$

$E^{'} \to + T E^{'} ∣ ϵ$

Aturan baru ini menghasilkan bahasa yang sama tetapi tidak lagi rekursif kiri, sehingga aman untuk parser top-down.

(e) Ambiguitas:

Apa yang dimaksud dengan ambiguitas dalam Context-Free Grammar? Berikan contoh CFG yang ambigu dan tunjukkan ambiguitasnya untuk sebuah string!

Definisi: Sebuah CFG disebut ambigu jika terdapat setidaknya satu string dalam bahasanya yang memiliki lebih dari satu leftmost derivation ATAU lebih dari satu rightmost derivation ATAU lebih dari satu parse tree. Ini berarti struktur sintaksis string tersebut bisa diinterpretasikan dengan cara yang berbeda.

Contoh Grammar Ambigu (Ekspresi Aritmatika Sederhana): $E \to E + E ∣ E * E ∣ id$

String: id + id * id

Ambiguitas (Dua Leftmost Derivations):

Derivasi 1 (Penjumlahan dulu): $E \Rightarrow_{l m} E + E$ $\Rightarrow_{l m} id + E$ $\Rightarrow_{l m} id + E * E$ $\Rightarrow_{l m} id + id * E$ $\Rightarrow_{l m} id + id * id$ (Interpretasi: (id + id) * id)

Derivasi 2 (Perkalian dulu): $E \Rightarrow_{l m} E * E$ $\Rightarrow_{l m} E + E * E$ $\Rightarrow_{l m} id + E * E$ $\Rightarrow_{l m} id + id * E$ $\Rightarrow_{l m} id + id * id$ (Interpretasi: id + (id * id))

Karena ada dua leftmost derivation yang berbeda untuk string yang sama, grammar ini ambigu.

Cara Memperbaiki Ambiguitas (Menegakkan Precedence & Associativity): Ambiguitas pada grammar ekspresi biasanya diatasi dengan memperkenalkan level variabel yang berbeda untuk setiap tingkat precedence (prioritas operator) dan menggunakan rekursi untuk associativity (arah pengelompokan).

Grammar Tidak Ambigu (Perbaikan):

$E \to E + T ∣ T$ (Expression: penjumlahan, precedence terendah, left-associative)

$T \to T * F ∣ F$ (Term: perkalian, precedence lebih tinggi, left-associative)

$F \to (E) ∣ id$ (Factor: unit dasar - identifier atau ekspresi dalam kurung, precedence tertinggi)

Dengan grammar ini, string id + id * id hanya akan memiliki satu parse tree yang valid, yang secara paksa mengelompokkan perkalian terlebih dahulu: id + (id * id), sesuai aturan precedence matematika standar.

5. Konsep Dasar Compiler

(a) Fase Compiler:

Sebutkan tiga fase frontend dalam sebuah compiler! Apa input dan output dari masing-masing fase tersebut?

Analisis Leksikal (Lexical Analysis / Scanning):

Input: Urutan karakter kode sumber.

Output: Urutan token (unit leksikal bermakna).

Analisis Sintaksis (Syntax Analysis / Parsing):

Input: Urutan token dari fase sebelumnya.

Output: Parse Tree (Pohon Sintaks) atau struktur data serupa yang merepresentasikan struktur gramatikal kode.

Analisis Semantik (Semantic Analysis):

Input: Parse Tree dari fase Parsing

Output: Annotated Parse Tree, Sinyal lolos/gagal

(b) Scanner & Token:

Apa tugas utama Scanner (Lexical Analyzer)? Apa yang dimaksud dengan token? Berikan contoh token dari kode if (x > 10)!

Tugas Scanner: Membaca kode sumber karakter per karakter, mengelompokkannya menjadi unit leksikal (token), membuang whitespace dan komentar, dan melaporkan error leksikal.

Token: Representasi abstrak dari satu unit leksikal, biasanya terdiri dari tipe token (misal: KEYWORD, IDENTIFIER, NUMBER) dan kadang nilai token (misal: nama identifier x, angka 10).

Contoh Token dari if (x > 10): KEYWORD(if), DELIMITER((), IDENTIFIER(x), OPERATOR(>), NUMBER(10), DELIMITER())

Apa tugas utama Parser (Syntax Analyzer)? Bagaimana hubungannya dengan Context-Free Grammar (CFG) dan Parse Tree?

Tugas Parser: Memeriksa apakah urutan token yang diterima dari scanner sesuai dengan aturan tata bahasa (grammar) dari bahasa pemrograman. Membangun representasi struktur sintaksis (biasanya Parse Tree). Melaporkan error sintaksis.

Hubungan: Parser menggunakan CFG sebagai definisi formal dari tata bahasa. Ia mencoba untuk membangun Parse Tree untuk urutan token input berdasarkan aturan-aturan dalam CFG tersebut. Jika Parse Tree berhasil dibangun, berarti kode secara sintaksis valid.

IF Notes

Explorer

Dasar banget ini buat ngejar pemahaman

1. Konsep Dasar Finite Automata (FA)

2. Ekuivalensi & Regular Expression (RE)

3. Properties Bahasa Reguler

4. Context-Free Grammar (CFG) & Parse Tree

5. Konsep Dasar Compiler

Graph View

Table of Contents

Backlinks