Rabu, 22 April 2020

TEORI BAHASA DAN AUTOMATA - FINITE STATE AUTOMATA


A.    Penerapan FSA
Finite state automata (FSA) adalah mesin abstrak berupa sistem model matematika dengan masukan dan keluaran diskrit yang dapat mengenali bahasa paling sederhana (bahasa reguler) dan dapat diimplementasikan secara nyata.
Finite State Automata (FSA) adalah model matematika yang dapat menerima input dan mengeluarkan output yang memiliki state yang berhingga banyaknya dan dapat berpindah dari satu state ke state lainnya berdasarkan input dan fungsi transisi. Finite state automata tidak memiliki tempat penyimpanan/memory, hanya bisa mengingat state terkini.
Finite State Automata dinyatakan oleh pasangan 5 tuple, yaitu:
M=(Q , Σ , δ , S , F )
Q = himpunan state
Σ = himpunan simbol input
δ = fungsi transisi δ : Q × Σ
S = state awal / initial state , S Q
F = state akhir, F Q
B.     Karakteristik Finite Automata
1.      Setiap Finite Automata memiliki keadaan dan transisi yang terbatas.
2.      Transisi dari satu keadaan ke keadaan lainnya dapat bersifat deterministik atau non-deterministik.
3.      Setiap Finite Automata selalu memiliki keadaan awal.
4.      Finite Automata dapat memiliki lebih dari satu keadaan akhir.
Jika setelah pemrosesan seluruh string, keadaan akhir dicapai, artinya otomata menerima  string tersebut. Setiap FSA memiliki:
a.       Himpunan berhingga (finite) status (state)
·         Satu buah status sebagai status awal (initial state), biasa dinyatakan q0.
·         Beberapa buah status sebagai status akhir (final state).
b.      Himpunan berhingga simbol masukan
c.       Fungsi transisi
Menentukan status berikutnya dari setiap pasang status dan sebuah simbol masukan.
C.    Cara Kerja Finite State Automata
Finite State Automata bekerja dengan cara mesin membaca memori masukan berupa tape yaitu 1 karakter tiap saat (dari kiri ke kanan) menggunakan head baca yang dikendalikan oleh kotak kendali state berhingga dimana pada mesin terdapat sejumlah state berhingga.
Finite Automata selalu dalam kondisi yang disebut state awal (initial state) pada saat Finite Automata mulai membaca tape. Perubahan state terjadi pada mesin ketika sebuah karakter berikutnya dibaca. Ketika head telah sampai pada akhir tape dan kondisi yang ditemui adalah state akhir, maka string yang terdapat pada tape dikatakan diterima Finite Automata (String-string merupakan milik bahasa bila diterima Finite Automata bahasa tersebut).
D.    Finite State Diagram (FSD)
Finite State Automata dapat dimodelkan dengan Finite State Diagram (FSD) dapat juga disebut State Transition Diagram. Sistem transisi adalah sistem yang tingkah lakunya disajikan dalam bentuk keadaan-keadaan (states). Sistem tersebut dapat bergerak dari state yang satu ke state lainnya sesuai dengan input yang diberikan padanya.
Fungsi Transisi (d) adalah representasi matematis atas transisi keadaan.
S = himpunan alfabet.
Q = himpunan keadaan-keadaan.
d = Q x S à Q
Finite State Diagram terdiri dari:
a.       Lingkaran menyatakan state
Lingkaran diberi label sesuai dengan nama state tersebut. Adapun pembagian lingkaran adalah:
·       Lingkaran bergaris tunggal berarti state sementara
·       Lingkaran bergaris ganda berarti state akhir
b.      Anak Panah menyatakan transisi yang terjadi.
Label di anak panah menyatakan simbol yang membuat transisi dari 1 state ke state lain. 1 anak panah diberi label start untuk menyatakan awal mula transisi dilakukan. Contoh FSA : pencek parity ganjil.
Misal input : 1101
Genap 1 Ganjil 1 Genap 0 Genap 1 Ganjil : diterima mesin
Misal input : 1100
Genap 1 Ganjil 1 Genap 0 Genap 0 Genap : ditolak mesin
Dari contoh diatas, maka:
Q = {Genap, Ganjil}
Σ = {0,1}
S = Genap
F = {Ganjil }

atau
δ(Genap,0) = Genap
δ(Genap,1) = Ganjil
δ(Ganjil,0) = Ganjil
δ(Ganjil,1) = Genap
Sebuah FSA dibentuk dari lingkaran yang menyatakan state:
·         Label pada lingkaran adalah nama state
·         Busur menyatakan transisi/ perpindahan
·         Label pada busur yaitu symbol input
·         Lingkaran yang didahului sebuah busur tanpa label menyatakan state awal
·         Lingkaran ganda menyatakan state akhir/ final.
Jadi sebuah mesin otomata dapat dinyatakan dalam diagram transisi, fungsi transisi dan tabel transisi.

E.     Jenis FSA
Ada dua jenis FSA :
1.      Deterministic Finite Automata (DFA) : dari suatu state ada tepat satu state berikutnya untuk setiap simbol masukan yang diterima. Deterministik artinya tertentu/sudah tertentu fungsi transisinya.
Notasi matematis DFA:
• M = nama DFA
• Q = himpunan keadaan DFA
• S = himpunan alfabet
• d = fungsi transisi
• q0 = keadaan awal
• F = keadaan akhir
M = (Q, S, d, q0, F)
Contoh : Pengujian untuk menerima bit string dengan banyaknya 0 genap, serta banyaknya 1 genap.
0011 : diterima
10010 : ditolak, karena banyaknya 0 ganjil
Diagram transisi-nya :

DFA nya:
Q = {q0 , q1 , q2 , q3 }
Σ = {0,1}
S = q0
F = { q0}
fungsi transisi adalah:

δ( q0,011)= δ( q2,11) =δ( q3,1)= q2  Ditolak
δ( q0,1010)= δ( q1,010) =δ( q3,10)=δ( q2,0)= q0 Diterima
2.      Non-deterministic Finite Automata (NDFA) : dari suatu state ada 0, 1 atau lebih state    berikutnya untuk setiap simbol masukan yang diterima.
Non-Deterministic Finite Automata:
·      Otomata berhingga yang tidak pasti untuk setiap pasangan state input, bisa memiliki 0 (nol) atau lebih pilihan untuk state berikutnya.
·      Untuk setiap state tidak selalu tepat ada satu state berikutnya untuk setiap simbol input yang ada.
·      Dari suatu state bisa terdapat 0,1 atau lebih busur keluar (transisi) berlabel simbol input yang sama.
·      Untuk NFA harus dicoba semua kemungkinan yang ada sampai terdapat satu yang mencapai state akhir.
·      Suatu string x dinyatakan diterima oleh bahasa NFA, M= (Q, _, d, S, F) bila {x | d (S,x) memuat sebuah state di dalam F}
Kedua finite automata di atas mampu mengenali himpunan reguler secara presisi. Dengan demikian kedua finite automata itu dapat mengenali string-string yang ditunjukkan dengan ekspresi reguler secara tepat.
DFA dapat menuntun recognizer(pengenal) lebih cepat dibanding NDFA. Namun demikian, DFA berukuran lebih besar dibanding NDFA yang ekivalen dengannya. Lebih mudah membangun NDFA dibanding DFA untuk suatu bahasa, namun lebih mudah mengimplementasikan DFA dibanding NDFA.

F.     Ekuivalensi Antar Deterministic Finite Automata ( Reduksi )
Untuk suatu bahasa regular, kemungkinan ada sejumlah Deterministic Finite Automata yang dapat menerimanya. Perbedaannya hanyalah jumlah state yang dimiliki otomata-otomata yang saling ekuivalen tersebut. Tentu saja, dengan alasan kepraktisan, kita memilih otomata dengan jumlah state yang lebih sedikit.
Sasaran kita di sini adalah mengurangi jumlah state dari suatu Finite State Automata, dengan tidak mengurangi kemampuannya semula untuk menerima suatu bahasa.
Ada dua buah istilah baru yang perlu kita ketahui yaitu :
·         Distinguishable yang berarti dapat dibedakan.
·         Indistinguishable yang berarti tidak dapat dibedakan.
Dua DFA M1 dan M2 dinyatakan ekivalen apabila L(M1) = L(M2)

G.    Reduksi Jumlah State Pada FSA
Reduksi dilakukan untuk mengurangi jumlah state tanpa mengurangi kemampuan untuk menerima suatu bahasa seperti semula (efisiensi). State pada FSA dapat direduksi apabila terdapat useless state. Hasil dari FSA yang direduksi merupakan ekivalensi dari FSA semula
Pasangan State dapat dikelompokkan berdasarkan:
1.      Distinguishable State (dapat dibedakan)
Dua state  p dan q dari suatu DFA dikatakan indistinguishable apabila:
δ(q,w) Î F dan  δ(p,w) Î F   atau   δ(q,w) F dan  δ(p,w) F
untuk semua w Î S*

2.      Indistinguishable State (tidak dapat dibedakan)
Dua state  p dan q dari suatu DFA dikatakan distinguishable jika ada string w Î S*  hingga:
δ(q,w) Î F dan  δ(p,w) F
H.    Reduksi Jumlah State Pada FSA – Relasi
Pasangan dua buah state memiliki salah satu kemungkinan : distinguishable atau indistinguishable tetapi tidak kedua-duanya.
Dalam hal ini terdapat sebuah relasi :
Jika         p dan q    indistinguishable,
dan         q  dan r    indistinguishable
maka      p,  r          indistinguishable
dan         p,q,r         indistinguishable
Dalam melakukan eveluasi state, didefinisikan suatu relasi :
     Untuk Q yg merupakan himpunan semua state
D  adalah  himpunan state-state distinguishable,  dimana D Ì Q
N  adalah himpunan state-state indistinguishable, dimana N Ì Q
maka     x Î N  jika  x Î Q  dan x   D
I.        Reduksi Jumlah State Pada FSA – Step
Langkah - langkah untuk melakukan reduksi ini adalah :
·         Hapuslah semua state yg tidak dapat dicapai dari state awal  (useless state)
·         Buatlah semua pasangan state (p, q) yang distinguishable, dimana p Π F dan q F. Catat semua pasangan-pasangan state tersebut.
·         Cari state lain yang distinguishable dengan aturan:                                                          
 Untuk semua (p, q) dan semua a Î ∑, hitunglah  δ (p, a) = pa dan δ (q, a) = qa  . Jika pasangan (pa, qa) adalah pasangan state yang distinguishable maka pasangan (p, q) juga termasuk pasangan yang distinguishable.
·         Semua pasangan state yang tidak termasuk sebagai stateyang distinguishable merupakan state-state indistinguishable.
·         Beberapa state yang indistinguishable dapat digabungkan menjadi satu state.
·         Sesuaikan transisi dari state-state gabungan tersebut.
 Reduksi Jumlah State Pada FSA – Contoh
Sebuah Mesin DFA

1)      State  q5 tidak dapat dicapai dari state awal dengan jalan apapun (useless state).  Hapus state q5
2)      Catat state-state distinguishable, yaitu :                                                                                   
q4 Î F sedang q0, q1, q2, q3 F sehingga pasangan
(q0, q4) (q1, q4) (q2, q4) dan (q3, q4) adalah distinguishable.
3)      Pasangan-pasangan state lain yang distinguishable diturunkan berdasarkan pasangan darilangkah2,yaitu:                                                                                                                  
·         Untuk pasangan (q0, q1)
δ(q0, 0) = q1   dan   δ(q1, 0) q2 à belum teridentifikasi
δ(q0, 1) = q3   dan   δ(q1, 1) = q4   à  (q3, q4) distinguishable.
maka (q0, q1) adalah distinguishable. \
·         Untuk pasangan (q0, q2)
δ(q0, 0) = q1   dan   δ(q2, 0) = q1   à  belum teridentifikasi
δ(q0, 1) = q3   dan   δ(q2, 1) = q4   à  (q3, q4) distinguishable                  
maka (q0, q2) adalah distinguishable.
4)      Setelah diperiksa semua pasangan state  maka terdapat state-state yang distinguishable : (q0,q1), (q0,q2), (q0,q3),  (q0,q4), (q1,q4),  (q2,q4), (q3,q4). Karena berdasarkan relasi-relasi yang ada, tidak dapat dibuktikan (q1, q2), (q1, q3) dan (q2, q3) distinguishable,  sehingga disimpulkan pasangan-pasangan state tersebut indistinguishable.
5)      Karena q1 indistinguishable dengan q2,  q2 indistinguishable dengan q3, maka dapat disimpulkan q1, q2, q3 saling indistinguishable dan dapat dijadikan satu state.
6)      Berdasarkan hasil diatas  maka hasil dari DFA yang direduksi menjadi:

J.      Daftar Pustaka


Selasa, 14 April 2020

Tata Bahasa Bebas Konteks – Pohon Penurunan (Parsing)

 Tata Bahasa Bebas Konteks – Pohon Penurunan (Parsing)          
A.    Tata Bahasa Bebas Konteks
Bila pada tata bahasa regular terdapat pembatasan pada ruas kanan atau hasil produksinya, maka pada tata bahasa bebas konteks/context free grammar, selanjutnya kita sebut sebagai CFG, tidak terdapat pembatasan hasil produksinya. Pada aturan produksi :
A   b
batasannya hanyalah ruas kiri (A) dalah sebuah  simbol variabel. Contoh aturan produksi yang termasuk CFG :
B CdeFg
D BcDe
Seperti halnya pada tata bahasa reguler, sebuah tata bahasa bebas konteks adalah suatu cara yang menunjukkan bagaimana menghasilkan untai – untai dalam sebuah bahasa. Seperti kita ketahui, pada saat menurunkan suatu string, simbol – simbol variabel akan mewakili bagian-bagian yang belum terturunkan dari string tersebut. Bila pada tata bahasa reguler, bagian yang belum terturunkan tersebut selalu terjadi pada suatu ujung, pada tata bahasa bebas konteks bisa terdapat lebih banyak bagian yang belum terturunkan itu, dan bisa terjadi dimana saja. Ketika penurunan itu telah lengkap, semua bagian yang belum terturunkan telah diganti oleh string-string (yang mungkin saja kosong) dari himpunan simbol terminal. Bahasa bebas konteks menjadi dasar dalam pembentukan suatu parser/proses analisis sintaksis. Bagian sintaks dalam suatu kompilator kebanyakan didefinisikan dalam tata bahasa bebas konteks.
Terinspirasi dari bahasa natural manusia, ilmuwan-ilmuwan ilmu komputer yang mengembangkan bahasa pemrograman turut serta memberikan grammar (pemrograman) secara formal. Grammar ini diciptakan secara bebas-konteks dan disebut Context Free Grammar (CFG). Hasilnya, dengan pendekatan formal ini, kompiler suatu bahasa pemrograman dapat dibuat lebih mudah dan menghindari ambiguitas ketika parsing bahasa tersebut. Contoh desain CFG untuk parser, misal : B → BB | (B) | e untuk mengenali bahasa dengan hanya tanda kurung {‘(’,’)’} sebagai terminal-nya. Proses parsing adalah proses pembacaan string dalam bahasa sesuai CFG tertentu, proses ini harus mematuhi aturan produksi dalam CFG tersebut.

B.     Pohon Penurunan
Sebuah pohon (tree) adalah suatu graph terhubung tidak sirkuler, yang memiliki satu simpul (node) / vertex disebut akar (root) dan dari situ memiliki lintasan ke setiap simpul. Pohon sintaks / pohon penurunan (syntax tree/derivaton tree/parse tree) berguna untuk menggambarkan bagaimana memperoleh suatu string (untai) dengan cara menurunkan simbol-simbol variabel menjadi simbol-simbol terminal. Setiap simbol variabel diturunkan menjadi terminal, sampai tidak ada yang belum tergantikan.

C.     Parsing
Sebuah pohon (tree) adalah suatu graph terhubung tidak sirkuler, yang memiliki satu simpul (node)/vertex yang disebut akar (root) dan dari situ memiliki lintasan ke setiap simpul. Gambar dibawah ini memberikan contoh sebuah tree yang menguraikan kalimat dalam bahasa inggris.
Context Free Grammar ( CFG ) menjadi dasar dalam pembentukan suatu parser/proses analisis sintaksis. Bagian sintaks dalam suatu kompilator kebanyakan di definisikan dalam tata bahasa bebas konteks.
Pohon penurunan  (derivation tree / parse tree) berguna untuk menggambarkan bagaimana memperoleh suatu string (untai) dengan cara menurunkan simbol-simbol variabel menjadi simbol – simbol terminal. Setiap simbol variabel akan diturunkan menjadi terminal, sampai tidak ada yang belum tergantikan.
Proses Parsing merupakan tahapan analisis sintaksis yang berguna untuk memeriksa urutan kemunculan token. Di dalam mengimplementasikan sebuah metode parsing ke dalam program perlu diperhatikan tiga hal sebagai berikut:
·           Rentang Waktu eksekusi
·           Penanganan Kesalahan
·           Penanganan Kode

Metode Parsing digolongkan menjadi:
1.      Top – Down
Metode ini melakukan penelusuran dari root/puncal ke leaf / bawah (dari symbol awal ke symbol terminal/symbol awal S sampai kalimat x). metode ini meliputi:
-          Backtrack/backup : Brute Force
-          No Backtrack : Recursive Descent Parser
2.      Bottom – Up
Metode ini melakukan penelusuran dari leaf ke root (dari kalimat x sampai symbol
awal S)
Proses penurunan atau parsing bisa dilakukan dengan cara sebagai berikut :
1.      Penurunan terkiri (leftmost derivation) : simbol variabel terkiri yang diperluas terlebih dulu.
2.      Penurunan terkanan (rightmost derivation): simbol variabel terkanan yang diperluas terlebih dahulu.
            Misalnya terdapat tata bahasa bebas konteks dengan aturan produksi (simbol awal S, selanjutnya di dalam bab ini digunakan sebagai simbol awal untuk tata bahasa konteks adalah S):
S à AB
A à aA | a
B à bB | b
            Akan kita gambarkan pohon penurunan untuk memeperoleh untai : ‘aabbb’. Pada pohon tersebut simbol awal akan menjad akar (root). Setiap kali penurunan dipilih aturan produksi yang menuju ke solusi. Simbol – simbol variabel akan menjadi simpul  - simpul yang mempunyai anak. Simpul-simpul yang tidak mempunyai anak akan menjadi simbol terminal. Kalau kita baca simbol terminal yang ada (pada gambar) dari kiri ke kanan akan diperoleh untai ‘aabbb’.


Soal Latihan :
1)      S AA
A AAA | a | bA| Ab
Buatlah pohon penurunan dari himpunan produksi di atas untuk membangkitkan string dengan susunan “bbabaaba”
Jawab :

2)      S   AB
A   Aa | bB
B   a | Sb
Buatlah pohon penurunan dari himpunan produksi diatas untuk membangkitkan string dengan susunan “baabaab”
Jawab :

3)      S Ba | Ab
A Sa | Aab | a
B Sb| Bba | b
Buatlah pohon penurunan dari himpunan produksi diatas untuk membangkitkan string dengan susunan “bbaaaabb”
Jawab :

D.    Ambiguitas
Ambiguitas / kedwiartian terjadi bila terdapat lebih dari satu pohon penurunan yang berbeda untuk memperoleh suatu untai.
Soal Latihan :
S AB | C
A aAb | ab
B cBd | cd
C aCd | aDd
D bDc | bc
Buatlah pohon penurunan dari himpunan produksi diatas untuk membangkitkan string dengan susunan “aabbccdd”
Jawab :
Soal diatas memilki 2 pohon penurunan yang berbeda tetapi untai string yang dibangkitkan sama.



Untuk lebih jelasnya lagi, kalian dapat menonton video pembahasan lengkap mengenai pohon penurunan/ parsing tree di video di bawah ini. Let's play!!



DAFTAR PUSTAKA
http://eywatsauroty.blogspot.com/2014/09/tata-bahasa-bebas-konteks.html?m=1
https://www.coursehero.com/file/41091318/5-6-Pohon-Penurunan-dan-Penyederhanaanpdf/
https://s.docworkspace.com/d/AGf0fEqe6dYnwtb93vWmFA