Langsung ke konten utama

 Teknik Kompilasi Pertemuan 7

Klasifikasi Grammar menurut Chomsky



1.      TATA BAHASA (GRAMMAR)
Bahasa merupakan himpunan kalimat (baik terhingga maupun tak terhingga). Bahasa dapat disajikan dengan menyebut kalimatnya satu persatu. Untuk bahasa tak hingga, penyebutan seperti itu tidak mungkin. Oleh karena itu diciptakan cara penyajian yang mendeskripsikan bahasa secara efisien. Cara penyajian tersebut adalah Tata Bahasa atau Grammar.
Sebuah Tata Bahasa (Grammar) didefinisikan sebagai 4 tupel :
            G = (Vn, Vt, S, Q)
Vn dan Vt adalah simbol Non Terminal dan Simbol Terminal.
S adalah sebuah elemen anggota Vn yang disebut Simbol Start.
Q merupakan himpunan Produksi.

Chomsky mengelompokkan Grammar menjadi 4 kelompok :
1.      Tipe nol : UnRestricted Grammar (Tata Bahasa Tidak Terbatasi)

Tata Bahasa UnRestricted yang tidak merupakan anggota dari klasifikasi lainnya ditandai dengan aturan produksi yang bagian sebelah kirinya lebih panjang dari bagian sebelah kanan. Aturan produksi yang mengandung simbol hampa (^) pasti merupakan Tata Bahasa UnRestricted dan tidak termasuk klasifikasi lainnya.


2        Tipe satu : Context Sensitive Grammar (Tata Bahasa Tergantung Konteks)
Tata bahasa ini terdiri dari produksi berbentuk :
a ® b  dengan  ½a½  <==  ½b½
dimana a adalah string dan ½a½ adalah panjang string a demikian juga b adalah string dan ½b½ adalah panjang string b. String adalah merupakan deretan simbol baik terminal maupun non terminal.

Contoh :
G = ( {S, B, C}, {a, b, c}, S, Q )
Dimana Q terdiri dari produksi berikut :
1.      S     ® aSBC ½ abC
2.      bB  ® bb
3.      BC ® bc
4.      CB ® BC
5.      CC ® cc

1.      Tipe dua : Context Free Grammar ( Tata Bahasa Bebas konteks)
Tata bahasa ini terdiri dari produksi berbentuk :
a ® b  dengan  ½a½  <==  ½b½
dimana a adalah anggota Vn sedangkan b adalah string. Berarti Context Free Grammar seluruh produksi ruas kirinya hanya terdiri dari satu simbol yaitu simbol non terminal.
Contoh :
G = ( {S, C}, {a, b}, S, Q )
Dimana Q terdiri dari produksi berikut :
1.      ® aSa
2.      ® aCa
3.      ® b

2.      Tipe tiga : Regular Grammar
Tata bahasa ini terdiri dari produksi berbentuk :
a ® b  dengan  ½a½  <==  ½b½
dimana a adalah anggota Vn dan b mempunyai bentuk aB atau a dengan a anggota Vt dan B anggota Vn.

Contoh :
G = ( {S, A, B, C}, {a, b}, S, Q )
Dimana Q terdiri dari produksi berikut :
1.      ® aS ½ aB
2.      ® bC
3.      ® aC
4.      ® a

Regular Grammar merupakan subset dari Context Free Grammar.
Context Free Grammar merupakan subset dari Context Sensitive Grammar.
Context Sensitive Grammar merupakan subset dari UnRestricted Grammar.






Definisi : Kompilator (compiler) adalah sebuah program yang membaca suatu program yang ditulis dalam suatu bahasa sumber (source language) dan menterjemah-kannya ke dalam suatu bahasa sasaran (target language).

Proses kompilasi dapat digambarkan melalui sebuah kotak hitam (black box




Proses kompilasi dikelompokkan ke dalam dua kelompok besar :
1. analisa : program sumber dipecah-pecah dan dibentuk menjadi bentuk antara (inter-mediate representation)
2. sintesa  : membangun program sasaran yang diinginkan dari bentuk 


Program sumber merupakan rangkaian karakter. Berikut ini hal-hal yang dilakukan oleh setiap fase pada proses kompilasi terhadap program sumber tersebut :

1. Penganalisa leksikal : membaca program sumber, karakter demi karakter. Sederetan (satu atau lebih) karakter dikelompokkan menjadi satu kesatuan mengacu kepada pola kesatuan kelompok karakter (token) yang ditentukan dalam bahasa sumber. Kelompok karakter yang membentuk sebuah token dinamakan lexeme untuk token tersebut. Setiap token yang dihasilkan disimpan di dalam tabel simbol. Sederetan karakter yang tidak mengikuti pola token akan dilaporkan sebagai token tak dikenal (unidentified token).
Contoh : Misalnya pola token untuk identifier I adalah : I = huruf(huruf½angka)*. Lexeme ab2c dikenali sebagai token sementara lexeme 2abc atau abC tidak dikenal.

2. Penganalisa sintaks : memeriksa kesesuaian pola deretan token dengan aturan sintaks yang ditentukan dalam bahasa sumber. Sederetan token yang tidak mengikuti aturan sintaks akan dilaporkan sebagai kesalahan sintaks (sintax error). Secara logika deretan token yang bersesuaian dengan sintaks tertentu akan dinyatakan sebagai pohon parsing (parse tree).
Contoh : Misalnya sintaks untuk ekspresi if-then E adalah : E ® if  L  then, L ® IOA, I = huruf(huruf½angka)*,  O ® <½=½>½<=½>=,  A ® 0½1½...½9.  Ekspresi if a2 9 then adalah ekspresi sesuai sintaks; sementara ekspresi if a2 9 do atau if then a2B 9 tidak sesuai. Perhatikan bahwa contoh ekspresi terakhir juga mengandung token yang tidak dikenal.

3. Penganalisa semantik : memeriksa token dan ekspresi dari batasan-batasan yang ditetapkan. Batasan-batasan tersebut misalnya :
a. panjang maksimum token identifier adalah 8 karakter,
                                             b. panjang maksimum ekspresi tunggal adalah 80 karakter,
c. nilai bilangan bulat adalah -32768 s/d 32767,
d. operasi aritmatika harus melibatkan operan-operan yang bertipe sama.

4. Pembangkit kode antara : membangkitkan kode antara (intermediate code) berdasar-kan pohon parsing. Pohon parse selanjutnya diterjemahkan oleh suatu penerjemah yang dinamakan penerjemah berdasarkan sintak (syntax-directed translator). Hasil penerjemahan ini biasanya merupakan perintah tiga alamat (three-address code) yang merupakan representasi program untuk suatu mesin abstrak. Perintah tiga alamat bisa berbentuk quadruples (op, arg1, arg2, result), tripels (op, arg1, arg2). Ekspresi dengan satu argumen dinyatakan dengan menetapkan arg2 dengan - (strip, dash)

5.      Pengoptimal kode : melakukan optimasi (penghematan space dan waktu komputasi), jika mungkin, terhadap kode antara.

6.      Pembangkit kode : membangkitkan kode dalam bahasa target tertentu (misalnya bahasa mesin).

Komentar

Postingan populer dari blog ini

 Teknik Kompilasi Pertemuan 6 1.  Tuliskan ekspresi dan tata bahasa dari pohon urai dibawah ini. Jawab : Ekspresi  :  9-5+2  Tata Bahasa :  list => list + digit list => list - digit list => digit digit => 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 2.  Jelaskan dan berikan contoh mengenai tata bahasa yang mempunyai arti ganda ... Jawab :  Suatu tata bahasa dapat disebut sebagai tata bahasa yang mempunyai arti ganda apabila, suatu tata bahasa dapat memberikan lebih dari satu pohon urai untuk membentuk suatu rangkaian token dari tata bahasa yang digunakan tersebut. Contoh :  Misalkan tidak dibedakannya antara angka dan list. Maka, tata bahasa yang melibatkan angka dan tanda plus dan minus dapat dituliskan sebagai berikut :  string -> string + string | string - string | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 .    Sehingga tata bahasa yang seperti itu akan mempunyai lebih dari satu pohon urai, yaitu sebagai berikut : G...
  Teknik Kompilasi Pertemuan 12 Pengertian Sintaksis Sintaksis adalah cabang ilmu linguistik yang mengkaji seluk-beluk tata bahasa dalam satuan kalimat. Pengertian tersebut sejalan dengan pendapat Ramlan (2009, hlm. 1) yang mengungkapkan bahwa sintaksis adalah bagian atau cabang ilmu bahasa yang membicarakan seluk beluk wacana, kalimat, klausa, dan frasa. Objek Kajian (Satuan) Sintaksis Seperti yang telah disebutkan sebelumnya, objek kajian sintaksis menyelimuti frasa, klausa, dan kalimat. Berikut adalah penjelasan dari masing-masing objek. Frasa Frasa adalah gabungan dua kata atau lebih yang bersifat nonpredikatif atau lazim juga disebut gabungan kata yang mengisi salah satu fungsi sintaksis di dalam kalimat (Chaer, 2003, hlm. 222). Mudahnya, frasa adalah gabungan kata yang tidak memiliki predikat (P). Agar lebih jelas, perhatikan contoh-contoh berikut. Frasa Non Frasa pisang goreng rumah besar bayi sehat ayam hitam saya pisang digoreng rumah itu besar bayi ibu sehat ayam saya hit...