Thesis modifikasi mel frequency ceptral coefficient (mfcc) pada sistem penghafalan al qur’an dalam p

Page 1

MODIFIKASI MEL-FREQUENCY CEPTRAL COEFFICIENT (MFCC) PADA SISTEM PENGHAFALAN AL-QUR’AN DALAM PENGENALAN POLA NAGHAM AL-QUR’AN

TESIS

YESY AFRILLIA 157038080

PROGRAM STUDI S2 TEKNIK INFORMATIKA FAKULTAS ILMU KOMPUTER DAN TEKNOLOGI INFORMASI UNIVERSITAS SUMATERA UTARA MEDAN 2018


MODIFIKASI MEL-FREQUENCY CEPTRAL COEFFICIENT (MFCC) PADA SISTEM PENGHAFALAN AL-QUR’AN DALAM PENGENALAN POLA NAGHAM AL-QUR’AN

TESIS Diajukan untuk melengkapi tugas dan memenuhi syarat memperoleh ijazah Magister Teknik Informatika YESY AFRILLIA 157038080

PROGRAM STUDI S2 TEKNIK INFORMATIKA FAKULTAS ILMU KOMPUTER DAN TEKNOLOGI INFORMASI UNIVERSITAS SUMATERA UTARA MEDAN 2018


ii

PERSETUJUAN

Judul

: MODIFIKASI MEL-FREQUENCY CEPTRAL COEFFICIENT (MFCC) PADA SISTEM PENGHAFALAN AL-QUR’AN DALAM PENGENALAN POLA NAGHAM AL-QUR’AN

Kategori

: TESIS

Nama

: YESY AFRILLIA

Nomor Induk Mahasiswa

: 157038080

Program Studi

: PASCASARJANA (S-2) TEKNIK INFORMATIKA

Fakultas

: ILMU KOMPUTER DAN TEKNOLOGI INFORMASI UNIVERSITAS SUMATERA UTARA

Komisi Pembimbing

:

Pembimbing 2

Pembimbing 1

Prof. Dr. Marwan Ramli

Prof. Dr. Herman Mawengkang

Diketahui/disetujui oleh Program Studi S2 Teknik Informatika Ketua,

Prof. Dr. Muhammad Zarlis Nip. 19570701 198601 1 003


iii

PERNYATAAN

MODIFIKASI MEL-FREQUENCY CEPTRAL COEFFICIENT (MFCC) PADA SISTEM PENGHAFALAN AL-QUR’AN DALAM PENGENALAN POLA NAGHAM AL-QUR’AN

Saya mengakui bahwa tesis ini adalah hasil karya sendiri, kecuali beberapa kutipan dan ringkasan yang masing-masing telah disebutkan sumbernya.

Medan, 23 Januari 2018

Yesy Afrillia Nim. 157038080


iv

PERNYATAAN PERSETUJUAN PUBLIKASI KARYA ILMIAH UNTUK KEPENTINGAN AKADEMIS

Sebagai civitas Akademika Universitas Sumatera Utara, saya yang bertanda tangan dibawah ini: Nama

: Yesy Afrillia

Nim

: 157038080

Program Studi

: Pascasarjana (S-2)Teknik Informatika

Jenis Karya Ilmiah

: Tesis

Demi pengembangan ilmu pengetahuan, menyetujui untuk memberikan kepada Universitas Sumatera Utara Hak Bebas Royalti Non-Ekslusif (Non-Ekclusive Royalti Free Right) atas tesis saya yang berjudul:

MODIFIKASI MEL-FREQUENCY CEPTRAL COEFFICIENT (MFCC) PADA SISTEM PENGHAFALAN AL-QUR’AN DALAM PENGENALAN POLA NAGHAM AL-QUR’AN Beserta perangkat yang ada (jika diperlukan). Dengan Hak Bebas Royalti NonEksklusif ini, Universitas Sumatera Utara berhak menyimpan, mengalih media, menformat, mengelola dalam bentuk database, merawat dan mempublikasikan tesis saya tanpa meminta izin dari saya selama tetap mencantumkan nama saya sebagai penulis dan sebagai pemegang dan/atau sebagai pemilik hak cipta.

Demikianlah pernyataan ini dibuat dengan sebenarnya.

Medan, 23 Januari 2018

Yesy Afrillia NIM. 157038080


v

LEMBAR PANITIA PENGUJI TESIS

Telah di uji pada Tanggal : 23 Januari 2018

PANITIA PENGUJI TESIS Ketua

: Prof. Dr. Herman Mawengkang

Anggota

: 1. Prof. Dr. Marwan Ramli 2. Prof. Dr. Muhammad Zarlis 3. Dr. Syahril Efendi, S.Si., M.IT


vi

RIWAYAT HIDUP

DATA PRIBADI

Nama Lengkap

: Yesy Afrillia

Tempat dan Tanggal Lahir

: Kruenggeukueh Aceh Utara, 12 April 1992

Alamat Rumah

: Dsn. Cot Mesjid, Ds. Uteuen Geulinggang, Kec. Dewantara, Kab.Aceh Utara, Prov. Aceh, Indonesia - 24354

Telepon/Faks/HP

: 0851 0615 6699

Email

: yesy.afrillia@gmail.com

Instansi Tempat Bekerja

: PT. Medco E&P Malaka

Alamat Kantor

: Jl. Lintas Medan-Banda Aceh, Tanoh Anou, Idi Rayeuk, Kab. Aceh Timur, Prov. Aceh, Indonesia.

DATA PENDIDIKAN SD

: SD Negeri 1 Dewantara

TAMAT

: 2004

SMP

: SMP Negeri 1 Dewantara

TAMAT

: 2007

SMA : SMA Swasta Iskandar Muda

TAMAT

: 2010

S1

: Teknik Informatika Universita Malikussaleh

TAMAT

: 2014

S2

: Teknik Informatika Universitas Sumatera Utara

TAMAT

: 2018


vii

UCAPAN TERIMA KASIH

Syukur Alhamdulillah kehadirat Allah SWT sebagaimana Allah telah memberi nikmat, rahmat dan hidayahnya kepada kita. Tak lupa pula shalawat beriringkan salam kepada Nabi Muhammad SAW yang telah membawa kita dari alam kebodohan hingga ke alam yang penuh dengan ilmu pengetahuan. Dengan rahmat dan hidayahNya penulis dapat menyelesaikan Tesis dengan judul “MODIFIKASI MEL-FREQUENCY CEPTRAL COEFFICIENT (MFCC)

PADA

SISTEM

PENGHAFALAN

AL-QUR’AN

DALAM

PENGENALAN POLA NAGHAM AL-QUR’AN”, Tesis ini merupakan salah satu syarat untuk memperoleh gelar Magister Teknik Informatika pada program studi S-2 Teknik Informatika Universitas Sumatera Utara. Dari tahap awal penyusunan tesis ini sampai dengan selesai, penulis tidak hanya bertumpu pada kemampuan penulis sendiri. Pada kesempatan ini tak lupa penulis mengucapkan terima kasih sebesar-besarnya kepada : 1. Bapak Prof. Dr. Runtung Sitepu, S.H., M.Hum., selaku Rektor Universitas Sumatera Utara. 2. Bapak Prof. Dr. Opim Salim Sitompul., selaku Dekan Fakultas Ilmu Komputer danTeknologi Informasi Universitas Sumatera Utara. 3. Bapak Prof. Dr. Muhammad Zarlis., selaku Ketua Program Studi Pascasarjana (S-2) Teknik Informatika Fakultas Ilmu Komputer dan Teknologi Informasi Universitas Sumatera Utara dan juga selaku Dosen Pembanding/Penguji 1 yang selama ini telah memberikan banyak saran, serta pembelajaran yang berharga bagi penulis sebagai arahan untuk menyelesaikan penulisan tesis ini. 4. Bapak Dr. Syahril Efendi, S.Si., M.IT., selaku Sekretaris Program Studi Pascasarjana (S-2) Teknik Informatika Fakultas Ilmu Komputer dan Teknologi Informasi Universitas Sumatera Utara dan juga Selaku Dosen Pembanding/Penguji 2 saya, yang telah memberikan bantuan dan saran yang berharga bagi penulis sebagai arahan untuk menyelesaikan penulisan tesis ini. 5. Bapak Prof. Dr. Herman Mawengkang., selaku Guru Besar Program Studi Matematika dan Ilmu Pengetahuan Alam Universitas Sumatera Utara dan juga


viii

selaku dosen pembimbing 1 saya, yang tiada henti memberikan motivasi dan saran serta ilmu yang sangat membantu penulis sehingga penulis dapat menyelesaikan tesis ini dengan tepat waktu. 6. Bapak Prof. Dr. Marwan Ramli, selaku profesor muda Program Studi Matematika dan Ilmu Pengetahuan Alam Universitas Syiah Kuala, Aceh. Dan juga selaku dosen pembimbing 2 saya, yang telah banyak meluangkan waktu untuk membimbing, memberikan saran dan motivasi serta ilmu yang sangat membantu penulis sehingga penulis dapat menyelesaikan tesis ini dengan tepat waktu. 7. Bapak/Ibu Dosen Program Studi Pascasarjana (S-2) Teknik Informatika Fakultas Ilmu Komputer dan Teknologi Informasi Universitas Sumatera Utara yang telah memberikan bekal ilmu yang sangat berharga bagi penulis selama menjadi mahasiswa. 8. Seluruh Civitas Akademika, Staf, Pegawai, teman-teman, adik-adik, kakakkakak di Program Studi Pascasarjana (S-2) Teknik Informatika Fakultas Ilmu Komputer dan Teknologi Informasi Universitas Sumatera Utara, yang telah membantu penulis dalam menyelesaikan penelitian dan juga telah mewarnai hari-hari indah penulis selama menjalani masa kuliah. 9. Ayahanda Muhammad Bidin, S.T., dan Ibunda Suridah yang tercinta, karena pengorbanan yang sungguh luar biasa serta cinta kasih dan do’a mereka yang tak henti-hentinya sehingga saya dapat mengenyam dan menyelesaikan studi magister dan menyelesaikan tesis ini dengan tepat waktu. 10. Bapak Fadlisyah, S.Si., MT., selaku Kepala Prodi Teknik Informatika Malikussaleh dan juga selaku orang tua angkat bagi saya karena motivasi dan semangat beliau saya berani melangkah lebih maju untuk mengenyam studi magister berkat saran dan ilmu beliau saya dapat menyelesaikan tesis ini dengan tepat waktu. 11. Adinda tersayang Muhammad Rizky Wahyudi dan Safuani Marsya, yang telah memberikan dukungan serta do’a yang sangat luar biasa sehingga penulis penulis dapat menyelesaikan tesis ini dengan tepat waktu. 12. Saudara Rizky Putra Fhonna, S.T., yang selalu memberikan dukungan semangat serta do’a dan pengorbanan yang sangat berarti bagi penulis.


ix

13. Keluarga rantauan Alam Rizky Pratama, Herry Agam Prakoso, Siti Aisyah dan Abrar, selalu memberikan dukungan semangat serta do’a yang sangat berarti bagi penulis. 14. Sahabat-sahabat yang luar biasa, Khairul Umam Syaliman, Adli Abdillah Nababan, Miftahul Jannah, Insidini Fawwaz, Safrina A Sitepu, Reni Ramadhani, Hafizh Al-Kautsar Aidilof, Adnan Buyung Nasution, M. Zulfahmi Nasution, M. Putra Novelan dan sahabat-sahabat Magister Teknik Informatika Unit Kom C yang telah membantu dan memberi dukungan yang bagi penulis.

Penulis tetap menyadari banyaknya kekurangan dalam penelitian ini. Oleh sebab itu saran dan kritik sangat dinantikan dan diterima dengan sikap terbuka. Dan pada akhirnya penulis berharap karya tulis ini dapat digunakan sebagai referensi dan dimanfaatkan dengan baik. Akhirnya kepada Allah jualah kita menyerahkan segalanya semoga penulisan ini dapat bermanfaat dan terima kasih.

Medan, 23 Januari 2018 Penulis,

Yesy Afrillia 157038080


x

ABSTRAK

Penelitian ini mengusulkan inovasi baru untuk para tahfidz dalam penghafalan AlQur’an yang lebih efesien sehingga meminimalisir lama waktu belajar dalam menghafal Al-Qur’an. Banyak penelitian sebelumnya menggunakan pengolahan sinyal dan suara untuk pengenalan pola makhraj dan tajwid bacaan dalam AlQur’an menggunakan metode Mel-frequency Ceptral Coefficient (MFCC) . Namun belum ada penelitian untuk pengenalan pola lantunan ayat Al-Qur’an atau sering disebut pola nagham Al-Qur’an menggunakan metode modifikasi MelFrequency Ceptral Coefficient (MFCC). Dimana pada tahapan akhir MelFrequency Ceptral Coefficient (MFCC) yaitu proses merubah nilai spectrum menjadi nilai cepstrum menggunakan Discrete Wavelet Transform (DWT). Dengan karakteristik pola nagham Al-Qur’an yang lebih kompleks dari pada pola makhraj dan tajwid bacaan dalam Al-Qur’an memiliki tantangan tersendiri. Dimana memiliki gelombang suara yang lebih bervariasi dengan tingkat noise yang tinggi dan memiliki durasi suara yang lebih panjang. Data uji yang digunakan dalam penelitian ini berupa suara rekaman secara real-time. Pengukuran evaluasi unjuk kerja sistem pengenalan pola nagham Al-Qur’an ini berdasarkan parameter true dan false detection. Tingkat keakurasian sistem menggunakan metode modifikasi Mel-Frequency Ceptral Coefficient (MFCC) mencapai 83%. Untuk penelitian berikutnya dapat menambahkan data yang lebih bervariasi pada sistem penghafalan al-qur’an dalam pengenalan pola nagham alqur’an berdasarkan jenis suara dan dapat menambahkan algoritma pencocokan pola untuk pengklasifikasian atau pengelompokkan jenis suara. Penambahan pendekatan tersebut tentunya akan mempengaruhi kecepatan komputasi pada pengenalan pola. Kata kunci : pengenalan suara, pola nagham Al-Qur’an, mel-frequency ceptral coefficient (MFCC), discrete wavelet transform (DWT).


xi

MODIFICATION MEL-FREQUENCY CEPTRAL COEFFICIENT (MFCC) METHOD IN LEARNING SYSTEM OF AL-QUR’AN BASED IN NAGHAM PATTERN RECOGNITION

ABSTRACT

This research provides new innovations for tahfidz in memorizing the Qur'an more efficiently so as to minimize the length of time learning in memorizing the Qur'an. Many previous studies used signal and sound processing for pattern recognition of makhraj and tajwid in reading the Qur'an using the Mel-frequency Ceptral Coefficient (MFCC) method. But there is no research to recognize the pattern of chanting verses of the Qur'an or often called the pattern of nagham AlQur'an using the method of modification Mel-Frequency Ceptral Coefficient (MFCC). Where in the final stage of Mel-Frequency Cepstral Coefficient (MFCC) is the process of changing spectrum into cepstrum using Discrete Wavelet Transform (DWT). With the more complex nature of the Qur'anic nagham pattern of the makhraj and tajwid patterns of reading in the Qur'an has its own challenges. In nagham the wave of the sound has more variation which implies the level of noice is much higher and has sound duration longer. The data testing in this research was taken term by real-time recording. The evaluation measurement in the system performance of nagham Al-Quran pattern is based on true and false detection parameter with accuracy 83%. For future research can add more varied data on al-qur'an memorization system in nagham al-qur'an pattern recognition based on sound type and can add pattern matching algorithm for classification or clustering of voice type. This will certainly affect the speed of pattern recognition. Keywords : speech recognition, pola nagham Al-Qur’an, mel-frequency ceptral coefficient (MFCC), discrete wavelet transform (DWT).


xii

DAFTAR ISI

Hal. Persetujuan Pernyataan Persetujuan Publikasi Panitia Penguji Tesis Riwayat Hidup Ucapan Terima Kasih Abstrak Abstract Daftar Isi Daftar Tabel Daftar Gambar Bab 1

Bab 2

Pendahuluan 1.1. Latar Belakang 1.2. Rumusan Masalah 1.3. Batasan Masalah 1.4. Tujuan dan Manfaat Penelitian 1.5. Manfaat Penelitian Landasan Teori 2.1. Suara 2.2. Sinyal Suara 2.3. Sinyal dan Sistem 2.4. Pengenalan Suara 2.5. Sampling 2.6. Eksraksi Fitur 2.6.1. Mel-Frequency Ceptral Coefficient (MFCC) 2.6.1.1. Pre-Emphasis 2.6.1.2. Framing 2.6.1.3. Windowing 2.6.1.4. Fast Fourier Transform (FFT) 2.6.1.5. Mel Frequency Wrapping 2.6.1.6. Log 2.6.1.7. Discrete Cosinus Transform (DCT) 2.6.1.8. Cepstrum 2.7. Discrete Wavelet Transform (DWT) 2.8. Nagham 2.8.1. Murrotal 2.9. Riset Terkait 2.10. Perbedaan Dengan Riset Sebelumnya 2.11. Kontribusi Riset

ii iii iv v vi vii x xi xii xiv xv

1 3 3 3 4

5 5 7 8 9 10 10 11 12 12 13 14 15 15 16 16 18 19 19 21 21


xiii

Bab 3

Bab 4

Bab 5

Metodologi Penelitian 3.1. Tahapan Penelitian 3.2. Diagram Alur Kerja Penelitian 3.3. Data dan Peralatan Penelitian 3.4. Skema Sistem 3.4.1. Sampling Suara 3.4.2. Pre-Emphasis 3.4.3. Framing 3.4.4. Windowing 3.4.5. Fast Fourier Transform (FFT) 3.4.6. Mel-Frequency Wrapping 3.4.7. Log 3.4.8. Discrete Wavelet Transform (DWT) 3.5. Parameter Pengukuran Evaluasi Unjuk Kerja Sistem Hasil dan Pembahasan 4.1. Hasil 4.1.1. Sampel Training dan Testing 4.1.2. Hasil Sampling Suara Pola Nagham Al-Qur’an 4.1.3. Algoritma Modifikasi Mel-Frequency Ceptral Coefficient (MFCC) 4.1.4. Pengukuran Unjuk Kerja Sistem 4.1.5. Hasil Pengenalan Pola Nagham Al-Qur’an 4.2. Pembahasan Kesimpulan dan Saran 5.1. Kesimpulan 5.2. Saran

Daftar Pustaka Lampiran

22 22 23 23 24 25 26 26 27 27 28 28 29

30 30 31 32 39 52 52

54 55 56 60


xiv

DAFTAR TABEL

Hal. Tabel 2.1. Tabel 4.1.

Tabel 4.2. Tabel 4.3.

Riset Terkait Hasil Unjuk Kerja Modifikasi Mel-Frequency Ceptral Coefficient (MFCC) Pada Sistem Penghafalan Al-Qur’an Untuk Pengenalan Pola Nagham Al-Qur’an Unjuk Kerja Modifikasi MFCC Setiap Surat Berdasarkan Toleransi Rate Presentase Keseluruhan Unjuk Kerja Modifikasi MFCC Sistem Penghafalan AL-Qur’an Pada Pengenalan Pola Nagham Al-Qur’an

21

39 44

48


xv

DAFTAR GAMBAR

Hal. Gambar 2.1. Gambar 2.2. Gambar 2.3. Gambar 2.4. Gambar 2.5. Gambar 2.6. Gambar 2.7. Gambar 2.8. Gambar 3.1. Gambar 3.2. Gambar 3.3. Gambar 3.4. Gambar 3.5. Gambar 3.6. Gambar 3.7. Gambar 3.8. Gambar 3.9. Gambar 3.10. Gambar 3.11. Gambar 4.1. Gambar 4.2.

Organ Wicara Manusia Proses Produksi Suara Sinyal Analog Sinyal Digital Diagram Proses MFCC Pre-Emphasis pada Sebuah Frame Framing Hamming Window Alur Kerja Penelitian Secara Umum Diagram Skema Sistem Keseluruhan Diagram Kerja MFCC Modifikasi Flowchart Sampling Suara Flowchart Proses Pre-Emphasis Flowchart Proses Framing Flowchart Proses Windowing Flowchart Proses Fast Fourier Transform Flowchart Proses Mel-Frequency Wrapping Flowchart Proses Log Flowchart Proses Discrete Wavelet Transform Sinyal Frekuensi Pola Nagham Pada Al-Kautsar ayat 1-3 Nilai Sampling Suara Pola Nagham Al-Qur’an Pada Surat Al-Kautsar Ayat 1-3 Gambar 4.3. Sampling Sinyal Suara Surat Al-Kautsar Ayat 1-3 Gambar 4.4. Nilai Sampling Suara Surat Al-Kautsar Ayat 1-3 Gambar 4.5. Sinyal Suara Proses Pre-Emphasis Gambar 4.6. Proses Framing Dan Windowing Gambar 4.7. Proses Fast Fourier Transform (FFT) Gambar 4.8. Proses Mel-Filterbank dan Log Gambar 4.9. Proses Akhir Mengahasilkan Nilai Cepstrum Menggunakan Discrete Wavelet Transform (DWT) Gambar 4.10.Grafik Unjuk Kerja Modifikasi MFCCBerdasarkan Toleransi Rate Pada Kategori Tidak Lulus Gambar 4.11.Grafik Unjuk Kerja Modifikasi MFCCBerdasarkan Toleransi Rate Pada Kategori Lulus Gambar 4.12.Grafik Unjuk Kerja Modifikasi Mel-Frequency Cepstral Coefficient (MFCC)Secara Keseluruhan Per Surat Gambar 4.13.Diagram Kinerja Modifikasi MFCC Dengan Tingkat KeakuratanSecara Keseluruhan

5 6 7 7 10 10 11 12 21 22 23 24 24 25 25 26 26 27 28 29 30 31 32 33 35 35 36 37 46 47 49 50


1

BAB 1 PENDAHULUAN

1.1 Latar Belakang Penelitian ini mengusulkan inovasi baru untuk para Tahfidz dalam penghafalan Al-Qur’an yang lebih efesien sehingga meminimalisir lama waktu belajar dalam menghafal Al- Qur’an. Banyak penelitian sebelumnya menggunakan pengolahan sinyal dan suara untuk pengenalan pola makhraj dan tajwid bacaan dalam AlQur’an menggunakan metode mel-frequency ceptral coefficient (Arshad et al. 2013) . Namun belum ada penelitian untuk pengenalan pola lantunan ayat AlQur’an atau sering disebut pola Nagham Al Qur’an. Karakteristik pola Nagham Al-Qur’an ini lebih kompleks dari pada pola makhraj dan tajwid bacaan dalam AlQur’an. Dimana memiliki gelombang suara yang lebih bervariasi dengan tingkat noise yang tinggi dan memiliki durasi suara yang lebih panjang dari pada pola sinyal makhraj dan pola sinyal tajwid. Pengenalan suara sering disebut juga teknologi biometrik, termasuk identifikasi, verifikasi (otentifikasi), klasifikasi, segmentasi dan deteksi suara. Sebagai informasi tentang identitas seseorang berdasarkan pengenalan suara (Beigi, 2011). Sistem pengenalan suara pertama hanya mencoba mengenali karakteristik suara seseorang. Ini merupakan model matematika dari sistem fisiologi pada suara manusia. Akan tetapi semakin berkembangnya teknologi banyak peneliti membangun model yang lebih menarik dan spesifik pada sistem pengenalan suara (Beigi, 2011). Penelitian (Arshad et al. 2013; Jie et al. 2009; Zainon et al. 2012) mengenai pengenalan suara telah banyak dilakukan dengan berbagai metode pengolahan sinyal, seperti Linier Prediction Coding (LPC), Mel Frequency Cepstrum Coefficients (MFCC), Neural Predictive Coding (NPC), dan sebagainya, yang mana keseluruhan metode diatas berbasiskan Transformasi Fourier sebagai metode ektraksi ciri sinyal (I. Daubechies, 1988). Metode


2

ekstraksi ciri dan klasifikasi yang memiliki pengaruh langsung dalam sistem pengenalan suara (Al-Irhaim, 2010). Tingkat pengenalan dipengaruhi oleh metode ekstraksi dan klasifikasi yang digunakan. Sejauh ini metode ekstraksi MelFrecuency Ceptral Coefficients atau sering disebut MFCC lebih umum digunakan untuk pengenalan suara, seperti yang telah dilakukan oleh ( Martinez et al. 2012; Ismail et al. 2014; Logan, 2000). MFCC menggunakan discrete cosine transform (DCT) untuk menghitung koefisien. Dengan cara mel filter yang didasarkan pada sistem pendengaran manusia, MFCC dioptimalkan untuk pengenalan suara. Namun, pada penelitian lebih lanjut ditemukan bahwa MFCC memiliki kekurangan pada input suara yang memiliki tingkat noise yang tinggi (Afrillia,Y. 2017). Pandiaraj (2015) mengatakan bahwa Transformasi Wavelet memiliki kemampuan untuk memeriksa sinyal secara bersamaan dalam waktu dan frekuensi. Oleh karena itu, transformasi wavelet berguna untuk menganalisis noise. Pada banyak penelitian yang sama (Anusya et al. 2010; Tavanaei et al. 2011; Abdilla et al. 2013; Ali et al. 2014; Pandiaraj et al. 2015) menggunakan discrete wavelet transform pada sinyal suara dan menghasilkan resolusi waktu yang lebih baik pada frekuensi tinggi dan untuk semua sinyal energi yang terbatas. Koefisien wavelet yang diekstraksi memberikan representasi komplek

yang

menunjukkan distribusi energi dari sinyal dalam waktu dan frekuensi. Tapi murni wavelet tidak memberikan hasil yang lebih baik dari pada kinerja MFCC pada penelitian sebelumnya (Ali et al. 2014). Abdalla et al (2013) menggunakan discrete wavelet transformasi yang dikombinasi dengan MFCC, pada tahapan awal ektraksi ciri sinyal suara menggunakan formula DWT kemudian dikombinasi dengan MFCC menghasilkan hasil yang lebih memuaskan pada ektraksi ciri pengenalan pola mencapai 99,6%. Penelitian kali ini, mencoba mengkombinasikan discrete wavelet transform (DWT) dengan memodifikasi tahapan akhir ektraksi fitur MFCC. Ektraksi fitur MFCC secara umum, pada tahap akhir yaitu tahapan proses merubah mel-frequency kembali ke domain waktu, yang secara umum menggunakan formula discrete cosines transform (DCT). Hasil dari proses akhir


3

ini berupa nilai koefisien mel-ceptrum. Hasil modifikasi ini diharapkan dapat memberikan nilai koefisien yang lebih optimal.

1.2 Rumusan Masalah Berdasarkan latar belakang masalah yang telah diuraikan, maka rumusan masalah yang didapat yaitu pada unjuk kerja ektraksi fitur mel-frequency ceprtal coefficient (MFCC) jika pada tahapan proses merubah nilai mel-frequency kembali ke domain waktu atau sering disebut proses merubah nilai spectrum menjadi nilai cepstrum umumnya menggunakan discrete cosine transform (DCT) dimodifikasi menggunakan discrete wavelet transform (DWT).

1.3 Batasan Masalah Beberapa Batasan masalah pada penelitian ini adalah sebagai berikut : 1. Data berupa rekaman secara real-time. 2. Dalam penelitian ini hanya menguji pengenalan pola nagham al-qur’an 10 surat terakhir dari Juz 30. 3. Penelitian fokus pada modifikasi ektraksi fitur MFCC.

1.4 Tujuan Penelitian Tujuan penelitian ini memodifikasi tahapan akhir MFCC pada proses merubah mel-frequency kembali ke domain waktu atau proses merubah nilai spectrum menjadi nilai cepstrum menggunakan discrete wavelet transform (DWT) pada pengenalan pola nagham al-qur’an adalah untuk menghasilkan resolusi waktu yang lebih baik pada frekuensi tinggi. Dengan keunggulan DWT yaitu dapat memeriksa sinyal dalam domain waktu dan frekuensi secara bersamaan. Dan menganalisis hasil proses MFCC konfensional yang telah dilakukan pada penelitian sebelumnya dengan MFCC yang dimodifikasi pada pengenalan pola nagham alquran.


4

1.5 Manfaat Penelitian Adapun manfaat penelitian ini adalah : 1. Memodifikasi metode pada penelitian sebelumnya 2. Memperoleh cara baru untuk ektraksi ciri suara yang memiliki tingkat noise pada frekuensi tinggi.


5

BAB 2 LANDASAN TEORI

2.1 Suara Suara berguna untuk melakukan suatu komunikasi antar sesama manusia. Dimana masing-masing suara memiliki karakteristik dan tingkatan frekuensi yang berbeda-beda. Suara dihasilkan oleh suatu pita suara dengan kerjasama seluruh organ penghasil suara. Saat ini aplikasi teknologi ini berkembang dengan cepat dan sangat berguna bagi kehidupan manusia, contoh : membantu tunarungu, pembuatan google translate dan lain-lain. Ada beberapa permasalahan dalam pengidentifikasian suara yaitu kecepatan dan ketepatan pengolahan data suara (Ishaq, 2007). Suara atau gelombang akustik sesungguhnya merupakan kasus khusus dari suatu gelombang elastik pada medium udara atau fluida. Suara merupakan suatu hal yang unik dan memiliki range frekuensi tertentu dan intensitas suara yang bisa dan tidak bisa didengar oleh manusia. Satuan untuk mengukur intensitas suara tersebut adalah desibel (dB) diambil dari nama penemunya yaitu Alexander Graham Bell yang dikenal sebagai penemu telepon, sedangkan satuan dari frekuensi suara adalah Hertz, diambil dari nama seorang Fisikawan, Heinrich Rudolf Hertz untuk menghargai jasa atas kontribusinya dalam bidang elektromagnetik (Syaifuddin, 2014).

2.2

Sinyal Suara Manusia

Sinyal adalah besaran fisis yang berubah menurut waktu, ruang, atau variabelvariabel bebas lainnya. Contoh sinyal: sinyal ucapan, ECG, dan EEG. Secara matematis, sinyal adalah fungsi dari satu atau lebih variabel independen. Proses ini dilakukan melalui pemodelan sinyal. Contoh fungsi matematis dari sinyal adalah:


6

= đ??Źđ??˘ â Ą

(2.1)

Bagian dari otak kiri mengkhususkan dalam produksi dan pemahaman bahasa dan gambar pada otak belahan kanan dapat memahami karakteristik musik termasuk pitch, tempo, ritme, dan suara (Beigi, 2011). Speech (wicara) dihasilkan dari sebuah kerjasama antara lungs(paru-paru), glottis (dengan vocal cords) dan articulation tract (mouth/mulut dan nose cavity/rongga hidung). Gambar 2.1 menunjukkan penampang melintang dari organ wicara manusia. Untuk menghasilkan sebuah voiced sounds (suara ucapan), paru-paru lungs menekan udara melalui epiglottis, vocal cords bergetar, menginterupt udara melalui aliran udara dan menghassilkan sebuah gelombang tekanan quasi-periodic.

Gambar 2.1 Organ Wicara Manusia

Impuls tekanan pada umumnya disebut sebagai pitch impulses dan frekuensi sinyal tekanan adalah pitch frequency atau fundamental frequency. Impuls pitch merangsang udara di dalam mulut, dan untuk suara tertentu (nasals) juga merangsang nasal cavity (rongga hidung). Ketika rongga beresonansi, akan menimbulkan radiasi sebuah gelombang suara yang mana merupakan sinyal wicara. Kedua rongga beraksi sebagai resonators dengan karacteristik

frekuensi

resonansi

masing-masing,

yang

disebut

formant

frequencies. Pada saat rongga mulut dapat mengalami perubahan besar, kita mampu untuk menghasilkan beragam pola ucapan suara yang berbeda.


7

Di dalam kasus unvoiced sounds (suara tak terucap), exitasi pada vocal tract lebih menyerupai noise (derau). Gambar 2.2 menampilkan proses produksi suara-suara /a/, dan /f/.(Fadlisyah, 2013).

Gambar 2.2 Proses Produksi Suara

2.3 Sinyal dan Sistem Secara umum sinyal didefinisikan sebagai suatu besaran fisis yang merupakan fungsi waktu, ruangan, atau beberapa variabel. Sinyal biasa juga diartikan fenomena dari lingkungan yang terukur atau terkuantisasi, sementara system merupakan bagian dari lingkungan yang menghubungkan sinyal dengan sinyal lainnya atau dengan kata lain merespon sinyal masuk dengan menghasilkan sinyal keluaran. Suara pembicaraan merupakan contoh dari sinyal sementara sistem komunikasi telepon sendiri merupakan contoh dari sistem yang menghubungkan sinyal-sinyal pembicaraan tersebut (Hanggarsari, 2012). Sinyal analog adalah sinyal yang kontinu menurut waktu (time-domain). Sinyal analog merupakan campuran dari sinyal sinusoida yang jumlahnya bisa tak terbatas. Amplitudo pada sinyal analog untuk sebuah file suara bisa sama dalam interval waktu tertentu, dan bisa juga berubah-ubah sesuai dengan keras atau


8

lemahnya suara pada interval waktu. Elektromagnetik sinyal analog diilustrasikan pada Gambar 2.3 (Prasetya et al. 2008) :

Gambar 2.3 Sinyal Analog

Sinyal digital atau sinyal waktu diskrit merupakan bentuk sampling dari sinyal analog. Sinyal digital pada dasarnya di code-kan dalam bentuk biner (Hexa). Besarnya nilai suatu sinyal digital dibatasi oleh lebarnya atau jumlah bit (bandwidth). Jumlah bit juga sangat mempengaruhi nilai akurasi sinyal digital Gambar 2.4 mengilustrasikan sinyal digital (Ishaq, 2007).

Gambar 2.4 Sinyal Digital

2.4 Pengenalan Suara Pengenalan suara (juga dikenal sebagai Automatic Speech Recognition (ASR), atau pengenalan suara komputer adalah proses mengkonversi sinyal suara ke urutan kata-kata, melalui algoritma yang diimplementasikan kedalam program komputer (Anusya et al. 2010). Pengenalan suara (speech recognition) adalah suatu proses untuk mengenali huruf, kata atau kalimat yang diucapkan. Pengenalan suara lebih dikenal dengan istilah Automatic Speech Recognition atau Computer Speech Recognition dimana penggunaan sebuah mesin/komputer untuk mengenali sebuah suara atau identitas seseorang dari suara yang diucapkan. Umumnya

pengucap

berbicara

di

depan

komputer/mesin

kemudian

komputer/mesin mengenali suara/identitas seseorang dengan tepat sesuai yang diucapkan. Pengenalan pola suara dikenali ke dalam berbagai level tugas,


9

pengenalan dalam tingkat sinyal akustik berupa uji tingkatan dalam susunan unit sub kata berupa fonem, kata, frase dan kalimat (Tavanaei et al. 2011). Pengenalan Suara sering disebut juga teknologi biometrik, termasuk identifikasi, verifikasi (otentifikasi), klasifikasi, segmentasi dan deteksi suara. Sebagai informasi tentang identitas seseorang berdasarkan pengenalan suara. Sistem pengenalan suara pertama hanya mencoba mengenali karakteristik suara seseorang. Ini merupakan model matematika dari sistem fisiologi pada suara manusia. Akan tetapi semakin berkembangnya teknologi banyak peneliti membangun model yang lebih menarik dan spesifik pada sistem pengenalan suara (Beigi, 2011). Pengenalan suara pada dasarnya dibagi menjadi identifikasi suara dan verifikasi suara. Identifikasi suara adalah kegiatan memetakan sinyal suara dari sumber yang tidak dikenal ke dalam database yang berisi suara – suara yang sudah dikenali. Sedangkan verifikasi suara adalah kegiatan menentukan apakah suara yang dimasukkan cocok dengan suara yang telah diperkirakan sebelumnya.Proses identifikasi dapat dibedakan menjadi text-dependent dan textindependent.Text-dependent membutuhkan inputan tertentu yang lebih spesifik seperti password atau kode pin Sedangkan text-independent mengharuskan sistem untuk dapat mengidentifikasi inputan yang lebih bebas (Omer, 2017). Metode ekstraksi ciri dan klasifikasi yang memiliki pengaruh langsung dalam sistem pengenalan suara (Al-Irhaim et al. 2010).

2.5 Sampling Sampling merupakan suatu proses konversi sinyal analog menjadi sinyal digital berupa sekumpulan nilai agar dapat dikenali oleh kumputer. Pada proses sampling akan diambil beberapa sampel data dari sinyal analog. Tiap sampel akan mewakili satu nilai dimana posisi pergerakan grafik pada waktu tertentu. Nilai hasil sampling dimasukkan kedalam fungsi : â Ą

= â Ąđ?’?â Ąâ Ąâ Ąâ Ąâ Ąâ Ąâ Ąâ Ąâ Ąâ Ąâ Ąâ Ąâ Ąâ Ąâ Ąâ Ąâ Ąâ Ąâ Ąâ Ąâ Ąâ Ą

(2.2)


10

Dimana t adalah waktu, dan n adalah nilai sampel pada waktu t (Prasetya et al. 2008). Jika sinyal sampling tidak memenuhi syarat maka akan terjadi aliasing. Aliasing adalah suatu efek dimana sinyal yang dihasilkan memiliki frekuensi yang berbeda dengan sinyal aslinya (Bhaskoro et al. 2014).

2.6 Ekstraksi Fitur Ekstraksi fitur suara bertugas untuk mengubah sinyal suara ke fitur vektor koefisien yang hanya berisi informasi yang diperlukan untuk identifikasi ucapan yang diberikan. Karena setiap ucapan memiliki atribut yang unik yang berbeda yang terkandung dalam kata-kata yang diucapkan atribut ini dapat diekstraksi dari berbagai teknik ekstraksi fitur dan dapat digunakan untuk tugas pengenalan suara. Tujuan ekstraksi ciri untuk mereduksi ukuran data tanpa mengubah karakteristik dari sinyal suara dalam setiap frame yang dapat digunakan sebagai penciri. Ekstraksi ciri didapat dari mengonversikan bentuk sinyal suara ke dalam bentuk representasi secara parameter. Tapi fitur diekstrak harus memenuhi kriteria tertentu ketika berhadapan dengan sinyal suara seperti: metode ekstraksi fitur suara harus sederhana, metode ekstraksi fitur suara harus konsisten dengan waktu, dan harus bisa beradaptasi dengan noise. Sejauh ini metode ekstraksi Mel-Frecuency Ceptral Coefficients atau sering disebut MFCC lebih umum digunakan untuk pengenalan suara, seperti yang telah dilakukan oleh (Arshad et al. 2013; Kamarudin et al. 2014; Putra et al. 2011).

2.6.1

Mel-Frequency Ceptral Coefficient (MFCC)

Proses ekstraksi ciri MFCC merupakan proses pengambilan ciri yang berdasar pada transformasi fourier diskrit. MFCC merupakan salah satu metode ekstraksi ciri dan cara yang paling sering digunakan pada berbagai bidang area pengolahan suara, karena dianggap cukup baik dalam mempresentasikan ciri sebuah sinyal. Cara kerja MFCC didasarkan pada perbedaan frekuensi yang dapat ditangkap oleh telinga manusia sehingga mampu mempresentasikan ciri sinyal suara sebagaimana


11

menusia mempresentasikan (Setiawan et al. 2011). Diagram proses MFCC ditunjukkan pada gambar berikut : Sampling Suara

Pre-Emphasis

Ceptrum

Framing

DCT

Log Mel-Spectrum

Windowing

Log

FFT

Mel-Filterbank Mel-Spectrum

Gambar 2.5 Diagram Proses MFCC

2.6.1.1 Pre-Emphasis Proses pemfilteran sinyal suara diperlukan setelah proses perekaman atau sampling. Tujuan dari pemfilteran adalah untuk mendapatkan bentuk spectral frekuensi sinyal suara yang lebih halus. Filter pre-emphasis didasari oleh hubungan input/output dalam domain waktu yang dinyatakan dalam persamaan :

Dimana:

[đ?’?] = [đ?’?]âˆ’â Ąâˆ? â Ą [đ?’? − ]â Ą, . đ?&#x;— ≤⠥âˆ?≤ .

y [n] = signal hasil pre-emphasize filter s [n] = signal sebelum pre-emphasize filter

Gambar 2.6 Pre-Emphasize Pada Sebuah Frame

(2.3)


12

2.6.1.2 Framing Isyarat suara merupakan isyarat non-stasioner, artinya sifat-sifat satistiknya selalu berubah terhadap waktu. Sehingga tidaklah memungkinkan mengekstraksi ciri spektral dari suara tutur sekaligus. Oleh karena itu, ciri spektral isyarat suara diekstrak melalui sebuah window isyarat suara yang mencirikan bagian suara tertentu sehingga dengannya dapat dibuat suatu asumsi bahwa isyarat suara tersebut stasioner (Beigi, 2011).

Gambar 2.7 b Hi-Pass filtered Frame N= 256

Gambar 2.7 a Frame suara N = 256

Gambar 2.7 Framing

2.6.1.3 Windowing Proses windowing yaitu proses filtering tiap frame dengan cara mengalikan setiap frame tersebut dengan fungsi window tertentu yang ukurannya sama dengan frame. Windowing juga digunakan untuk memastikan kelanjutan suara dari frame awal sampai akhir (Arshad et al. 2013). Fungsi window yang baik harus menyempitkan pada bagian main lobe dan melebar pada bagian side-lobe nya. Pada dasarnya, frame suara dibangun dengan fungsi window. Fungsi dasar window adalah window rectangular. formula fungsi dasar window (Erokyar, 2014) : [đ?’?] = ,

≤đ?’?≤

−

(2.4)


13

Ada banyak fungsi window, namun yang paling sering digunakan dalam penelitian (Omer, 2017; Abdalla et al. 2013) berupa aplikasi pengenalan suara menggunakan Hamming Window. Fungsi window ini menghasilkan sidelobe level yang tidak terlalu tinggi (kurang lebih (-43 dB), selain itu noise yang dihasilkan pun tidak terlalu besar. Formula fungsi Hamming window : [đ?’?] = ,

− ,

đ??œ đ??Ź

đ??…đ?’? −

,

≤đ?’?≤

−

(2.5)

Salah satu 13pectru untuk popularitas jendela Hamming adalah kenyataan bahwa 13pectrum jatuh agak cepat, sehingga memungkinkan untuk isolasi yang lebih baik, terlihat pada beberapa jenis window berikut (Beigi, 2011) :

Gambar 2.8 Hamming Window

2.6.1.4 Fast Fourier Transform Langkah selanjutnya dalam ektraksi fitur pengenalan suara untuk mengubah nilai 13pectrum frekuensi suara dari domain waktu ke domain frekuensi (Ismail et al. 2014). Fast fourier transformation (FFT) bertujuan mendekomposisi sinyal menjadi sinyal sinusoidal, dan terdiri atas dua unit, yaitu unit real dan unit imajiner. FFT digunakan untuk analisis frekuensi, sehingga mempermudah pemrosesan suara karena sesuai dengan pendengaran manusia. FFT adalah algoritma yang mengimplementasikan discrete fouries transform (DFT). DFT


14

merupakan transformasi setiap frame dengan N sample dari domain waktu ke domain frekuensi yang didefinisikan : đ?‘­

= â Ą â Ąâˆ‘

− =

đ??žđ??ą [

− â Ą â Ąđ??…â Ą â Ą

]

(2.6)

Keterangan : N= banyaknya segmen frame u = nilai indeks sinyal x = nilai data ke k N = 0,1,2,3,‌, N-1 dan k=0,1,2,3,‌, N-1 j = √−1 F(u) menyatakan komponen frekuensi spasial dengan u menyatakan kooridinat frekuensi spasial, sedangkan j = √−1 merupakan bilangan komplek. Dengan

memanfaatkan teorema Euler, yaitu :

= đ??œ đ??Ź đ?œ˝ + đ??Źđ??˘ đ?œ˝

(2.7)

Maka persamaan 2.6 , dapat disajikan dalam bentuk :

đ?‘­â Ą

=â Ą ∑

− =

đ??œ đ??Ź

đ??…

− đ??Źđ??˘

đ??…

(2.8)

2.6.1.5 Mel Frequency Wrapping Mel Frequency Wrapping umumnya dilakukan dengan menggunakan Filterbank. Filterbank adalah salah satu bentuk dari filter yang dilakukan dengan tujuan untuk mengetahui ukuran energy dari frequency band tertentu dalam frekuensi, tetapi untuk keperluan MFCC, filterbank harus diterapkan dalam domain frekuensi. Filterbank menggunakan representasi konvolusi dalam melakukan filter terhadap signal. Konvolusi dapat dilakukan dengan melakukan multiplikasi antara spectrum signal dengan koefisien filterbank. Berikut ini adalah rumus yang digunakan dalam perhitungan filterbank (Ismail et al. 2014) :


15

Keterangan :

đ?‘Œ[đ?‘Ą] = â Ą ∑đ?‘ =1 đ?‘†[đ?‘—]đ??ť [đ?‘—]

(2.9)

N = jumlah magnitude spectrum (N ďƒŽ N) S[j] = magnitude spectrum pada frekuensi j Hi [j] = Koefisien filterbank pada frekuensi (1ď‚Ł i ď‚Ł M) M = jumlah channel dalam filterbank

2.6.1.6 Log Nilai algoritma diperoleh dengan mengkonversikan nilai-nilai DFT menjadi satu nilai . Mengurangi nilai mel filterbank dengan mengganti setiap nilai log dasarnya. Dengan menggunakan perintah mathlab "log" untuk mengambil nilai logaritma mel filtered pada segment suara .Telinga manusia kurang sensitif dalam mendengar suara yang mempunyai amplitudo rendah dan tinggi (Ismail et al. 2014). Filter yang digunakan untuk menghitung jumlah tertimbang komponen spektral untuk menyaring output sehingga proses pendekatan dengan skala Mel. Respon masing-masing filter yang diberikan oleh besarnya frekuensi dalam bentuk segitiga dan sama dengan kesatuan pada frekuensi pusat dan menurun secara linear ke nol pada frekuensi pusat dua filter yang berdekatan. Kemudian, masing-masing filter output adalah jumlah dari komponen spektral disaring. Setelah itu kami menggunakan persamaan berikutnya untuk menghitung frekuensi yang diberikan f di HZ (Martinez et al. 2012) : đ?‘­â Ą

=[

đ?&#x;— ∗đ??Ľ đ??

â Ą[ + ]

2.6.1.7 Discrete Cosinus Transform (DCT)

]

(2.10)

DCT merupakan langkah terakhir dari proses utama ekstraksi fitur MFCC. Konsep dasar dari DCT adalah mendekorelasikan mel spectrum sehingga menghasilkan representasi yang baik dari property spectral local. Pada dasarnya konsep dari DCT sama dengan inverse fourier transform.


16

Berikut adalah formula yang digunakan untuk menghitung DCT : đ?‘Şđ?’? = â Ą ∑đ?‘˛= đ??Ľ đ?? đ?‘ş

Keterangan :

đ??œ đ??Ź [đ?’?

−

đ??…

�

] â Ą; â Ąâ Ąđ?’? = , , ‌ đ?‘˛

(2.11)

Sk = keluaran dari proses filterbank pada index k K = jumlah koefisien yang diharapkan

Koefisien ke nol dari DCT pada umunya akan dihilangkan, walaupun sebenarnya mengindikasikan energy dari frame sinyal tersebut. Hal ini dilakukan karena berdasarkan penelitian-penelitian yang pernah dilakukan, koefisien ke nol ini tidak reliable terhadap pengenalan suara.

2.6.1.8 Cepstrum Cepstrum adalah sebutan kebalikan untuk spectrum. Cepstrum biasa digunakan untuk mendapatkan informasi dari suatu sinyal suara yang diucapkan oleh manusia. Pada langkah terakhir ini, spektrum log mel dikonversi menjadi cepstrum menggunakan Discrete Cosine Transform (DCT) yang merupakan nilai dari hasil mel frequency yang diubah menjadi domain waktu.

2.7 Discrete Wavelet Transform (DWT) Transformasi Wavelet merupakan teknik pemrosesan sinyal multiresolusi. Memberikan jalan alternative untuk analisis sinyal suara, beda dengan shourt time fourier (STFT) pada nilai lebar kostanta, dimana transformasi wavelet memiliki nilai konstanta yang mirip dengan filter pendengaran manusia. Nilai koefisien wavelet diperoleh dengan menghitung korelasi antara masing-masing sinyal. Tetapi menggunakan murni transformasi wavelet sebagai filter suara tidak memberikan kinerja yang lebih baik dari pada MFCC terlihat pada penelitian (Ali et al. 2014; Pandiaraj, S. & Kumar, K.R.S, 2015).


17

Proses transformasi Wavelet dilakukan dengan mengkonvolusi sinyal dengan data tapis (filter) atau dengan proses perata-rataan dan pengurangan secara berulang, yang sering disebut dengan metode filter bank. Prinsip dasar dari DWT adalah bagaimana cara mendapatkan representasi waktu dan skala dari sebuah sinyal menggunakan teknik filter digital dan operasi sub-sampling. Transformasi Wavelet diskret bertujuan mengurangi redundansi yang terjadi pada transformasi Wavelet kontinu. Transformasi Wavelet diskret menganalisis suatu sinyal dengan skala yang berbeda. Sebuah sinyal dilewatkan dalam dua filter DWT yaitu highpass filter dan lowpass filter agar frekuensi dari sinyal tersebut dapat dianalisis. Pembagian sinyal menjadi frekuensi tinggi dan frekuensi rendah dalam proses highpass filter dan lowpass filter disebut sebagai dekomposisi. Proses dekomposisi ini dapat melalui satu atau lebih tingkatan. Dengan formula DWT sebagai berikut : đ?’? đ?’‚

đ?’?

â Ą[ ] = ∑đ?’? [đ?’?] [

− đ?’?]

â Ą[ ] = ∑đ?’? [đ?’?] [

(2.12)

− đ?’?]

(2.13)

Dalam hal ini y[k] tinggi dan y[k] rendah adalah hasil dari highpass filter dan lowpass filter, x[n] merupakan sinyal asal, h[n] adalah highpass filter, dan g[n] adalah lowpass filter. Dengan menggunakan koefisien DWT ini maka dapat dilakukan

proses

inverse

discrete

wavelet

transform

(IDWT)

untuk

merekonstruksi menjadi sinyal asal. Proses rekonstruksi ini sepenuhnya merupakan kebalikan dari proses dekomposisi sesuai dengan tingkatan pada proses dekomposisi. Dengan demikian, persamaan rekonstruksi pada masingmasing tingkatan dapat ditulis sebagai berikut: [đ?’?] = â Ą ∑ (

đ?’?

â Ą[

] [−đ?’? +

] +â Ą

đ?’? đ?’‚

â Ą[ ] [−đ?’? +

])

(2.14)


18

2.8 Nagham Nagham adalah kata yang berasal dari bahasa Arab yang artinya lagu/irama. Populernya istilah Nagham berasal dari para qori dan qoriah dari Mesir yang pernah mengajarkan ilmunya di Indonesia pada tahun 1973. Yang artinya melagukan/melantun bacaan Al-Qur’an atau membaguskan suara dalam membaca Al-Qur’an. Nagham kemudian terkenal dengan sebutan Seni Baca Al-Qur’an. Seni Baca al-Quran merupakan satu ilmu merupakan kaedah seni suara yang mengaplikasikan nada, tempo dan irama di dalam pembacaan al-Quran (Zakaria, M.Z. & Ismail, M.Y, 2013). Seni Baca Al-Qur’an sama halnya dengan melantunkan bacaan Al-Qur’an secara indah yang sesuai dengan kaidah-kaidah membaca Al-Qur'an yang senantiasa mengekspresikan secara indah, makna dan isi pesan-pesan Al-Qur'an baik dalam bentuk perintah, larangan, harapan dan himbauan. Irama ekspresif seperti ini dianggap sebagai cara baca yang sangat ideal. Dengan kata lain alunan suara yang indah dalam ragam nada, baik mulai dari rendah, menengah, tinggi dan tertinggi bahkan dengan tambahan nada (overtune) memiliki ciri yang khas. Yaitu ilmu yang mempelajari lagu-lagu yang digunakan dalam membaca al-qur’an. Tingkatan dalam pembacaan al-qur’an berdasarkan penggunaan lagu terdiri dari tiga tingkatan : 1. Mu’allam adalah membaca alqur’an pada tingkat belajar, sehingga pembacaan difokuskan pada benar atau salahnya bacaan dan tidak menggunakan lagu. Dalam beberapa hal mu’allam memiliki persamaan dengan tahsin. 2. Murottal adalah membaca alqur’an yang memfokuskan pada dua hal yaitu kebenaran bacaan dan lagu alqur’an. Karena konsentrasi bacaan difokuskan pada penerapan tajwid sekaligus lagu, maka porsi lagu alqur’an tidak dibawakan sepenuhnya. Hanya pada nada asli atau jawab pada tingkat suara sedang. 3. Mujawwad adalah membaca alqur’an dengan lagu secara sempurna baik dalam tingkatan nadanya maupun jenis dan variasi lagu.


19

Pada penelitian ini objek yang digunakan adalah teknik melantunkan bacaan alquran secara murottal. 2.8.1

Murottal

ُ ‫ ِّ َت‬yang berarti membaca dengan Pengertian murottal berasal dari bahasa Arab ْ ‫ر‬ lagu (bagus).

Irama dalam kamus besar bahasa Indonesia adalah gerakan

berturut-turut secara terartur, turun naik lagu (bunyi) yang berartutan (AlQusyairi, 2010). Menurut (Dzikron, 2011) metode murottal irama alqur’an (MuriQ) adalah metode praktis membaca alqur’an dan teknik melagukan bacaan alqur’an sesuai tajwid. Metode ini bisa diterapkan untuk anak-anak, remaja, maupun orang tua yang ingin belajar membaca alqur’an dengan benar dan indah, lebih mudah, praktis dan efektif. Tujuan penggunaan bacaan alqur’an dengan menggunakan irama yaitu untuk mempermudah bacaan dan agar mudah diingat dalam bacaan. Membaca alqur’an dengan menggunakan irama akan membuat orang yang membaca alqur’an tidak malas membaca dan membuat orang yang mendengarkannya tertarik untuk mendengarkannya. Tanpa menghilangkan aturan dasar, dengan melagukan ayat-ayat alqur’an dengan baik dan indah dan sesuai dengan ilmu tajwidnya.

2.9 Riset Terkait Untuk memperkuat bahwa hal ini layak untuk diteliti, maka dibawah ini akan dipaparkan beberapa riset yang berkaitan dengan riset yang akan dilakukan. Tabel 2.1 Riset terkait

No.

1.

Judul Jurnal

Performance Measurement Of Mel Frequency Ceptral Coefficient (MFCC) Method In

Peneliti

Afrillia, Y et al. 2017

Tingkat Keakuratan Deteksi

Kelemahan Penelitian

80% dari data suara secara realtime

Ekstraksi fitur berbasis MFCC konvensional dimana masih memiliki kekurangan pada data input suara yang memiliki tingkat noise yang tinggi.


20

Learning System Of AlQur’an Based In Nagham Pattern Recognition 97,1% dikenali dengan Orang yang sama dan Ucapan Kata yang sama

2.

Joint MFCCand Vector Quantization based TextIndependent Speaker Recognition System

86,6 % dikenali dengan Orang yang sama dan Ucapan Kata yang berbeda Omer, A.E. 2017

16,6 % dikenali dengan Orang yang berbeda dengan Ucapan Kata sama

Algoritma MFCC sebagai ekstraksi ciri dan metode VQ sebagai metode pencocokan pola akan tetapi dalam algoritma MFCC tidak mengimplementasikan algoritma Fast Fourier Transform (FFT).

0% jika dengan Orang yang berbeda dengan Ucapan Kata yang berbeda pula

3.

4.

DWT features performance analysis for automatic speech recognition of URDU DWT and MFCC based Feature Extraction Methods for Isolated Word Recognition

Ali, H et al. 2014

Abdalla, M.I., et al. 2013

MFCC Error = 29,33% DWT Error = 60,896%

99,6 %

Tingkat pengenalan yang dicapai untuk fitur berbasis DWT jauh kurang dari yang dicapai untuk kerangka kerja berbasis MFCC.

Kinerja ektraksi fitur melalui dua tahap yaitu pertama ektraksi fitur menggunakan DWT selanjutnya suara diektraksi kembali menggunakn MFCC


21

2.10

Perbedaan Dengan Riset Sebelumnya

Adapun perbedaan riset yang akan dilakukan adalah memodifikasi algoritma MFCC pada proses merubah nilai mel-spectrum menjadi nilai ceptrum. Dimana pada algoritma MFCC umumnya menggunakan DCT sedangkan pada riset ini mencoba menggunakan DWT untuk merubah nilai mel-spectrum menjadi nilai ceptrum.

2.11 Konstribusi Riset Memberikan pengetahuan baru pada algoritma ektraksi fitur untuk pengenalan suara. Diharapkan dapat dijadikan pembanding penelitian sebelumnya untuk ektraksi fitur suara.


22

BAB 3 METODOLOGI PENELITIAN

3.1 Tahapan Penelitian Pada penelitian ini, seluruh prosedur awal penelitian terlebih dahulu harus sudah dilakukan seperti studi literatur dan melakukan konsultasi dengan pembimbing. Setelah ditemukan permasalahan dan merumuskannya maka penelitian bisa dilanjutkan pada proses selanjutnya.

3.2 Diagram Alur Kerja Penelitian Diagram alur kerja penelitian ini di ilustrasikan pada berikut :

Memfokuskan Tujuan Penelitian

Mengumpulkan Data (Sampel)

Identifikasi Masalah

Merancang dan Mengimplementasi Metode

Kesimpulan Penelitian Mengukur Kinerja Metode

Menguji Coba Metode

Gambar 3.1 Alur Kerja Penelitian Secara Umum

Berdasarkan gambar 3.1, alur kerja penelitian secara umum dimulai dengan tahapan mengidentifikasi sebuah masalah yang akan diteliti, kemudian tahapan memfokuskan tujuan penelitian yang diteliti tidak menyebar keruang lingkup yang lain dan dilanjutkan tahapan mengumpulkan data atau sampel yang akan diteliti khususnya suara nagham alquran Juz 30, selanjutnya setelah sampel terkumpulkan maka dilanjutkan tahapan merancang dan mengimplemtasikan sistem dimana sistem dirancang dan diimplementasikan sesuai dengan tujuan penelitian yang telah difokuskan, kemudian pada tahap selanjutnya proses


23

menguji coba metode yang telah dimodifikasi lalu mengukur kinerja metode tersebut sehingga mendapatkan kesimpulan terhadap penelitian.

3.3 Data dan Peralatan Penelitian Data yang digunakan dalam penelitian ini berupa data suara secara real-time dengan pola nagham Al-Qur’an dari 10 surat terakhir Juz 30. Dengan data suara untuk training dilakukan bertahap yaitu dari 10, 20, 30, 40 dan 50 sampling suara dengan karakteristik yang berbeda-beda setiap surat nya dan dengan data testing sebanyak 100 sampling suara dengan karakteristik yang berbeda-beda pula. Alasan pemilihan data secara real-time pada proses training maupun testing yaitu menjaga keaslian sampling suara untuk mendapatkan hasil pengujian kinerja metode modifikasi mel-frequency cepstral coefficient secara optimal.

3.4 Skema Sistem Langkah penelitian secara umum pengenalan pola yang dibangun dalam penelitian ini diilustrasikan pada gambar berikut : Proses Training Input Sampling Suara Ekstraksi Fitur Suara MFCC modifikasi

Model Pola Sinyal Suara Output Pengenalan Pola Suara

Input Sampling Suara Ekstraksi Fitur Suara MFCC modifikasi

Pencocokan Model

Proses Testing

Gambar 3.2 Diagram Skema Sistem Secara Keseluruhan


24

Sampling Suara

Pre-Emphasis

Ceptrum

DWT

Framing

Log Mel-Spectrum

Windowing

Log

FFT

Mel-Filterbank Mel-Spectrum

Gambar 3.3 Diagram Kerja MFCC Modifikasi

Pada gambar 3.2 merupakan diagram skema sistem keseluruhan, ada dua buah proses yaitu proses training dan proses testing. Pada proses training suara yang diinput akan dirubah menjadi sampling suara, selanjutnya suara akan diekstraksi untuk mendapatkan fitur-fitur suara menggunakan metode ektraksi fitur mel-frequency cepstral coefficient. Ini merupakan titik fokus penelitian dimana metode ektraksi

fitur yang akan digunakan, akan dimodifikasi pada

proses merubah nilai mel-spectrum menjadi ceptrum menggunakan formula discrete wavelet transform (DWT) seperti yang diilustrasikan pada gambar 3.3. Pada MFCC umumnya proses merubah nilai mel-spektrum menjadi ceptrum menggunakan formula discrete cosine transform (DCT). Setelah melalui proses MFCC, nilai sebagai ciri dari fitur tersebut akan disimpan pada database. Pada proses testing melalui tahapan yang sama seperti proses training, akan tetapi suara akan diproses merupakan pengambilan suara secara real-time kemudian proses pencocokan model yang telah disimpan pada database sebelumnya pada proses training untuk mendapatkan pengenalan pola suara nagham al’quran.

3.4.1

Sampling Suara

Proses pengambilan nilai sampling suara yaitu proses merubah sinyal analog menjadi sinyal digital. Gambar berikut merupakan flowchart proses sampling suara.


25

Mulai

sampel suara real-time

Apakah g(t)=n ?

Tidak Ya sampling suara

Selesai

Gambar 3.4 Flowchart Sampling Suara

3.4.2

Pre-Emphasis

Proses pre-emphasis bertujuan mempertajam atau memperjelas vokal suara, flowchart digambarkan pada gambar berikut : Mulai

sampling suara pola nagham al-qur’an

Tidak

Apakah sinyal suara (n) sudah selesai dikalkulasi?

Ya Selesai

Gambar 3.5 Flowchart Proses Pre-Emphasis


26

3.4.3

Framing

Proses framming bertujuan membatasi resolusi panjangnya frekuensi suara. Berikut flowchart proses framing : Mulai

sampling suara hasil pre-emphasis

membatasi resolusi suara menjadi 1024 per segmen

Tidak

Apakah sinyal suara sudah selesai diresolusi?

Ya Selesai

Gambar 3.6 Flowchart Proses Framing

3.4.4

Windowing

Proses windowing bertujuan memproyeksikan suara. Banyak formulasi untuk memproyeksikan suara. Berikut flowchart proses hamming windowing yang digunakan sistem. Mulai

sampling suara hasil framming

Hamming windowing

Tidak

Apakah sinyal suara sudah selesai diproyeksikan?

Ya Selesai

Gambar 3.7 Flowchart Proses Windowing


27

3.4.5

Fast Fourier Transform (FFT)

Proses mentransformasi sinyal suara dengan menggunakan perhitungan fast fourier transform. Berikut flowchart proses FFT : Mulai

sampling suara hasil hamming windowing

Fast Fourier Transform

Tidak

Apakah sinyal suara sudah ditransformasikan?

Ya Selesai

Gambar 3.8 Flowchart Proses Fast Fourier Transform

3.4.6

Mel-Frequency Wrapping

Mel-frequency wrapping atau sering disebut mel-filterbank merupakan proses mencari nilai koefisien ciri/fitur khas dari suara. Berikut flowchart mel-filterbank : Mulai

sampling suara hasil transformasi fourier

Mel-filterbank

Tidak

Apakah sinyal suara sudah mendapatkan nilai koefisien mel-filterbank?

Ya

Selesai

Gambar 3.9 Flowchart Proses Mel-Frequency Wrapping


28

3.4.7

Log

Logaritma atau log yaitu nilai fungsi grafis sebagai nilai pengubah x positif. Berikut flowchart proses log : Mulai

sampling suara hasil mel-filterbank

Logaritma mel

Apakah semua sinyal suara mel sudah positif ?

Tidak Ya

Selesai

Gambar 3.10 Flowchart Proses Log

3.4.8 Proses

Discrete Wavelet Transform (DWT) akhir

mel-frequency

cepstral

coefficient

dimana

secara

umum

menggunakan metode discrete cosine transform (DCT) pada penelitian ini peniliti mencoba manggunakan metode discrete wavelet transform (DWT) untuk medapatkan nilai cepstrum atau nilai koefisien ciri/fitur akhir sebagai nilai acuan pola. Berikut flowchart proses akhir metode mel-frequency cepstral coefficient :


29

Mulai

sampling suara hasil logaritma koefisien mel

discrete wavelet transform (DWT)

Tidak

Apakah perhitungan nilai cepstrum sudah selesai?

Ya cepstrum

Selesai

Gambar 3.11 Flowchart Proses Discrete Wavelet Transform

3.5 Paramater Pengukuran Evaluasi Unjuk Kerja Sistem Pengukuran evaluasi unjuk kerja sistem pengenalan pola pada umumnya menggunakan dua parameter, yaitu true detection dan false detection.

True

detection merupakan jumlah pola yang berhasil dikenali per seluruh jumlah pola yang di uji, sedangkan false detection adalah jumlah pola yang tidak berhasil dikenali.


30

BAB 4 HASIL DAN PEMBAHASAN

4.1

HASIL

Hasil yang dibahas meliputi pemilihan sampel training dan testing suara pola nagham al-qur’an, definisi sampling pola suara nagham al-qur’an, algoritma modifikasi metode mel-frequency cepstral coefficient (MFCC), pengukuran unjuk kerja sistem, proses pengenalan pola nagham al-qur’an dan pembahasan.

4.1.1

Sampel training dan testing

Sampel training dan testing berupa sampel suara secara real-time. Data training dan testing ialah 10 surat terakhir dari Juz 30 pada Al-Qur’an. Data testing yang digunakan pada penelitian ini berjumlah 25 sampling suara per-surat nya yang mewakili karakteristik suara yang berbeda dengan tingkat variasi data training yang berbeda-beda pula. Gambar 4.1 menunjukkan sampel frekuensi suara pola nagham pada al-qur’an surat al-kautsar yang juga merupakan salah satu sampel yang digunakan sebagai data training dan testing. Proses training dan testing dilakukan menggunakan metode ektraksi fitur untuk mengenali ciri atau fitur pola nagham dari sampel-sampel pola nagham yang terkandung pada data suara tersebut.

Gambar 4.1 Sinyal Frekuensi Pola Nagham Pada Surat Al-Kautsar Ayat 1-3


31

4.1.2

Hasil sampling suara pola nagham al-qur’an

Setiap suara memiliki sampling suara yang spesifik atau berbeda antara satu suara dengan suara lainnya. Sampling suara ialah nilai sinyal suara asli berupa nilai frekuensi dari suara. Sebelum sinyal suara asli di ektraksi menggunakan modifikasi metode mel-frequency cepstral coefficient (MFCC) untuk mengenal ciri atau fitur khas dari suara itu sendiri, referensi sampling suara sudah harus diketahui untuk melakukan proses berikutnya yaitu proses training maupun proses testing. Dimana Gambar 4.2 menunjukkan sampling suara pola nagham dari surat an-nasr ayat 1-3. Setelah nilai sampling suara diketahui barulah kita dapat memproses suara tersebut untuk mendapatkan informasi yang lebih spesifik sebagai acuan penelitian.

Gambar 4.2 Nilai Sampling Suara Pola Nagham Al-Qur’an Pada Surat Al-Kautsar Ayat 1-3


32

4.1.3

Algoritma modifikasi mel-frequency cepstral coefficient (MFCC)

Proses modifikasi metode mel-frequency cepstral coefficient (MFCC) pada tahapan akhir alur kerja metode MFCC dimana secara umum untuk mendapatkan nilai cepstrum biasanya menggunakan discrete cosine transform (DCT) pada penelitian ini peneliti mecoba menggunakan discrete wavelet transform (DWT) sebagaimana telah dipaparkan pada bab sebelumnya. Berikut ini algoritma modifikasi mel-frequency cepstral coefficient (MFCC) : 1. Input (x) yaitu sampling suara berupa nilai sinyal suara asli. Yaitu suatu proses konversi sinyal analog menjadi sinyal digital berupa sekumpulan nilai agar dapat dikenali oleh kumputer.

Gambar 4.3 Sampling Sinyal Suara Surat Al-Kautsar Ayat 1-3

Gambar 4.3 merupakan tampilan spektrum sampling suara pola nagham surat an-nasr ayat 1-3 dimana pada gambar menunjukan gambar grafik waktu (s) terhadap amplitudo dan gambar spectrogram yang merupakan representasi visual dari sinyal akustik. Umumnya disajikan dalam ruang dua dimensi, dengan bagian horizontal mewakili time dan bagian vertikal mewakili frekuensi. Intensitas amplitudo pada suatu frekuensi dan pada suatu waktu


33

{time,frekuensi} di dalam spektogram dinyatakan dengan nilai warna tertentu (grayscale atau RGB).

Gambar 4.4 Nilai Sampling Suara Surat Al-Kautsar Ayat 1-3

Sinyal suara yang direpresentasikan seperti yang terlihat pada gambar 4.3 sebenarnya mengandung nilai-nilai yang terlihat pada gambar 4.4 yang merupakan nilai-nilai dari sinyal digital atau nilai dari sampling suara yang siap diproses oleh komputer. 2. Pre-emphasis, memproses pengiriman sinyal melalui filter yang menekankan terhadap frekuensi tinggi dengan tujuan untuk mempertajam suara dan meningkatkan energy pada frekuensi tinggi, dengan formulasi : [đ?’?] = [đ?’?]− âˆ? [đ?’? − ] , [

nilai sinyal suara

Dari nilai sinyal suara asli menjadi,

] ďƒ¨ [

. đ?&#x;— ≤ âˆ?≤ . ]

indeks (n)


34

y[0] = 620 [0] - 1. 620 [0-1]

y[5] = 780 [5] – 1. 780 [5-1] = 3900 – 3120 = 780

= 0 - (-620) = -620 y[1] = 524 [1] – 1. 524 [1-1]

y[6] = 524 [6] – 1. 524 [6-1]

= 524 – 0 = 524

= 3144 – 2620 = 524

y[2] = 492 [2] – 1. 492 [2-1]

y[7] = 524 [7] – 1. 524 [7-1]

= 984 – 492 = 492

= 3144 – 2620 = 524

y[3] = 556 [3] – 1. 556 [3-1]

y[8] = 428 [8] – 1. 428 [8-1]

= 1668 - 1112 = 556

= 3424 – 2996 = 428

y[4] = 684 [4] – 1.684[4-1] = 2736 – 2052 = 684 Jadi, [ -620, 524, 492, 556, 684, 780, 524, 428 ]

Gambar 4.5 Sinyal Suara Proses Pre-Emphasis

Gambar 4.5 merupakan hasil sinyal suara proses pre-emphasis dimana bahwa grafik suara domain waktu terhadap amplitudo terlihat lebih kecil dari pada grafik suara domain waktu terhadap amplitudo pada proses sampling suara yaitu grafik suara asli pada gambar 4.4. walaupun grafik terlihat lebih kecil bukan berarti ada informasi yang hilang pada proses ini pre-emphasis. Ini hasil


35

ektraksi fitur awal sebagai proses mempertajam suara sehingga sinyal suara lebih jelas. 3. Framing dan Windowing, Framing sebagai fungsi membatasi resolusi panjangnya frekuensi sinyal suara, dilakukan fungsi buffer secara otomatis pada pemograman delphi dengan framing sebesar 1024 per segmen suara. Windowing, merupakan proses memproyeksi suara pada setiap bagian sinyal yang telah dibuat pada proses framing. Hal ini dilakukan untuk meminimalkan diskontinuitas pada bagian awal dan akhir sinyal dan mengintegrasikan garisgaris frekuensi terdekat. Dengan menggunakan formulasi

Hamming

windowing : [đ?’?] = ,

w [0] = 0,54 – 0,46 cos

= 0,54 – 0,46 cos (0)

− ,

. , . −

= 0,54 – 0,46 (1) = 0,08 w [1] = 0,54 – 0,46 cos

. , . −

đ??œ đ??Ź(

đ??…đ?’? ), −

≤đ?’?≤

w [5] = 0,54 – 0,46 cos

−

. , . −

= 0,54 – 0,46 cos (3,92)

= 0,54 – 0,46 (0,99) = 0,08 w [6] = 0,54 – 0,46 cos

. , . −

= 0,54 – 0,46 cos (0,785)

= 0,54 – 0,46 cos (4,71)

= 0,54 – 0,46 (0,99) = 0,08

= 0,54 – 0,46 (0,99) = 0,08

w [2] = 0,54 – 0,46 cos

. , . −

w [7] = 0,54 – 0,46 cos

. , . −

= 0,54 – 0,46 cos (1,57)

= 0,54 – 0,46 cos (5,49)

= 0,54 – 0,46 (0,99) = 0,08

= 0,54 – 0,46 (0,99) = 0,08

w [3] = 0,54 – 0,46 cos

. , . −

w [8] = 0,54 – 0,46 cos

. , . −

= 0,54 – 0,46 cos (2,35)

= 0,54 – 0,46 cos (0,785)

= 0,54 – 0,46 (0,99) = 0,08

= 0,54 – 0,46 (0,99) = 0,08

w [4] = 0,54 – 0,46 cos

. , . −

= 0,54 – 0,46 cos (3,14)

= 0,54 – 0,46 (0,99) = 0,08

Jadi, nilai proyeksi windowingnya sebesar 0,08.


36

Gambar 4.6 Proses Framing Dan Windowing

Gambar 4.6 merupakan hasil sinyal suara dari proses pre-emphasis yang telah dilakukan proses framing dan windowing terlihar grafik sinyal suara nya sudah berubah menjadi segi batasan tinggi dan lebar gelombang suara. 4. Fast Fourier Transform (FFT), bertujuan mendekomposisi sinyal menjadi sinyal sinusoidal, yang terdiri atas dua unit, yaitu unit real dan unit imajiner. Dalam pemrosesan sinyal suara, FFT akan mengubah sinyal suara dalam domain waktu menjadi domain frekuemsi. Dengan formulasi : đ?‘­

=

−

∑ =

dimana, N = 0,1,2,3,‌, N-1

(đ??œ đ??Ź (

dan

đ??…

) − đ??Źđ??˘ (

k = 0,1,2,3,‌, N-1

đ??…

))

Gambar 4.7 Proses Fast Fourier Transform (FFT)


37

Gambar 4.7 merupakan hasil sinyal suara yang telah ditransformasikan menggunakan fast forier transform (FFT) terlihat semakin jelas nilai koefisien awal yang dihasilkan setelah ditransformasikan. 5. Mel-frequency Wrapping / Filterbank dan Log, yaitu proses mencari koefisien ciri/fitur khas dari sinyal suara. Menggunakan formulasi :

dimana Hi [j] = (1ď‚Ł i ď‚Ł M),

đ?’€[ ] = ∑ đ?‘ş[ ]đ?‘Ż [ ] =

Log, logaritma yaitu nilai fungsi grafis sebagai nilai pengubah ke sub x positif. Menggunakan formulasi : đ?‘­

=[

đ?&#x;— ∗đ??Ľ đ??

[ + ]

]

Gambar 4.8 Proses Mel-Filterbank dan Log

Gambar 4.8 merupakan spectrogram/spectrum hasil sinyal suara yang telah ditransformasikan menggunakan fast forier transform (FFT) terlihat semakin jelas nilai koefisien awal yang dihasilkan setelah ditransformasikan. 6. Discrete Wavelet Transform (DWT), berupa gelombang singkat yang berfungsi untuk memeriksa sinyal secara bersamaan dalam waktu dan frekuensi dengan hanya membandingkan nilai koefisien ciri/fitur sinyal suara dari sinyal suara tetangga terdekat. dengan menggunakan formulasi :


38

đ?’? đ?’‚

[ ] = ∑ [đ?’?] [ đ?’?

[đ?’?] = ∑ (

đ?’?

− đ?’?];

[ ] [−đ?’? +

đ?’?

]+

[ ] = ∑ [đ?’?] [ đ?’? đ?’‚

đ?’?

[ ] [−đ?’? +

− đ?’?]; ])

Gambar 4.9 Proses Akhir Mengahasilkan Nilai Cepstrum Menggunakan Discrete Wavelet Transform (DWT)

Gambar 4.9 merupakan spectrogram/spectrum hasil sinyal akhir berupa nilai koefisien akhir yaitu nilai cepstrum yang mejadi nilai koefisien ciri/fitur dari pola nagham al-qur’an pada sistem penghafalan al-qur’an yang kemudian akan disimpan menjadi pola acuan untuk proses pengujian sebagai pola nagham alqur’an. 7. Cepstrum, berupa nilai koefisien dari ciri/fitur sinyal suara ini merupakan hasil dari metode ektraksi ciri modifikasi mel-frequency cepstral coefficient yaitu mendapatkan nilai koefisien sebagai nilai khas sinyal suara tersebut agar pola sinyal suara mudah dikenali.

Setelah proses training selesai dengan mengaplikasikan algoritma tersebut maka nilai ceptrum yang merupakan nilai koefisien ciri/fitur dari pola nagham al-qur’an tersebut akan disimpan sebagai model pola sinyal suara sebagai nilai acuan untuk proses testing nantinya.


39

4.1.4

Pengukuran Unjuk Kerja Sistem

Untuk mengukur evaluasi unjuk kerja modifikasi mel-frequency cepstral coefficient (MFCC) pada sistem penghafalan al-qur’an berdasarkan pola nagham pada umumnya menggunakan dua parameter, yaitu detection rate dan false positive rate. Detection rate adalah perbandingan antara jumlah pengenalan pola nagham yang berhasil dikenali. Sedangkan false positive rate adalah banyaknya jumlah suara yang tidak dikenali. Pengukuran unjuk kerja sistem dilakukan dengan menggunakan nilai toleransi istimewa yaitu 0.3, 0.4, 0.5 dan 0.6. Data testing berupa suara secara real-time dari sampling suara dengan karakteristing yang berbeda-beda. Paparan detail terlihat pada tabel 4.1 sebagai berikut :


Tabel 4.1 Hasil unjuk kerja modifikasi mel-frequency cepstral coefficient (MFCC) pada sistem penghafalan al-qur’an untuk pengenalan pola nagham al-qur’an

Juz 30

Sampling Suara Training

Surat An-nas

2

5

10

Surat Al-Falaq

2

5

Sampling Suara Testing 5 15 25 Jumlah 5 15 25 Jumlah 5 15 25 Jumlah 5 15 25 Jumlah 5 15 25

Pengukuran unjuk kerja modifikasi Mel-Frequency Cepstral Coefficient (MFCC) 0.3

0.4

0.5

0.6

TL

L

TL

L

TL

L

TL

L

4 8 6 40% 3 6 5 31% 2 4 2 18% 4 8 10 49% 3 6 8

1 7 19 60% 2 9 20 69% 3 11 23 82% 1 7 15 51% 2 9 17

2 6 5 29% 3 5 3 24% 3 2 3 18% 2 9 9 44% 2 3 8

3 9 20 71% 2 10 22 76% 2 13 22 82% 3 6 18 60% 3 12 17

2 3 4 20% 2 3 3 18% 1 1 2 9% 2 3 5 22% 1 1 5

3 12 21 80% 3 12 22 82% 4 14 23 91% 3 12 20 78% 4 14 20

1 2 3 13% 1 1 2 9% 0 1 0 2% 1 2 3 13% 0 1 2

4 13 22 87% 4 14 23 91% 5 14 25 98% 4 13 22 87% 5 14 23

False Positive Rate

Detection Rate

45% 32% 18% 32% 45% 25% 13% 28% 30% 13% 7% 17% 45% 37% 27% 36% 30% 18% 23%

55% 68% 82% 68% 55% 75% 87% 72% 70% 87% 93% 83% 55% 63% 75% 64% 70% 82% 77%

40


10

Surat Al-Lahab

Surat Al-Ikhlas

2

5

10

2

5

10

Jumlah 5 15 25

38% 2 4 4

62% 3 11 21

29% 2 1 3

71% 3 14 22

16% 1 1 2

84% 4 14 23

7% 0 0 1

93% 5 15 24

Jumlah 5 15 25 Jumlah 5 15 25 Jumlah 5 15 25 Jumlah 5 15 25 Jumlah 5 15 25 Jumlah 5

22% 2 3 7 27% 2 1 3 13% 1 2 2 11% 2 4 8 31% 2 4 6 27% 1

78% 3 12 18 73% 3 14 22 87% 4 13 23 89% 3 11 17 69% 3 11 19 73% 4

13% 2 2 5 20% 1 2 2 11% 1 1 1 7% 2 3 5 22% 1 3 2 13% 1

87% 3 13 20 80% 4 13 23 89% 4 14 24 93% 3 12 20 78% 4 12 23 87% 4

9% 1 1 3 11% 1 1 2 9% 0 0 1 2% 1 1 3 11% 1 2 3 13% 0

91% 4 14 22 89% 4 14 23 91% 5 15 24 98% 4 14 22 89% 4 13 22 87% 5

2% 1 0 1 4% 0 0 1 2% 0 0 1 2% 1 0 1 4% 1 0 2 7% 0

98% 4 15 24 96% 5 15 24 98% 5 15 24 98% 4 15 24 96% 4 15 23 93% 5

24% 25% 10%

76% 75% 90%

10% 15% 30% 10% 16% 19% 20% 7% 8% 12% 10% 5% 5% 7% 30% 13% 17% 20% 25% 15% 13% 18% 10%

90% 85% 70% 90% 84% 81% 80% 93% 92% 88% 90% 95% 95% 93% 70% 87% 83% 80% 75% 85% 87% 82% 90%

41


2

15 25 Jumlah 5

Surat An-Nasr

15 25 Jumlah 5

10

Surat Al-Kafirun

2

5

10

5 15 25 Jumlah 5 15 25 Jumlah 5 15 25 Jumlah 5 15 25 Jumlah 5 15

2 2 11% 2

13 23 89% 3

1 1 7% 1

14 24 93% 4

0 1 2% 1

15 24 98% 4

0 1 2% 1

15 24 98% 4

3

12

2

13

1

14

0

15

2

23

1

24

1

24

0

25

16% 2 2

84% 3 13

9% 1 1

91% 4 14

7% 0 0

93% 5 15

2% 1 0

98% 4 15

2 13% 1 0 1 4% 4 8 15 60% 3 6 6 33% 2 5

23 87% 4 15 24 96% 1 7 10 40% 2 9 19 67% 3 10

1 7% 1 1 1 7% 2 6 11 42% 3 5 4 27% 3 2

24 93% 4 14 24 93% 3 9 14 58% 2 10 21 73% 2 13

2 4% 0 0 0 0% 2 4 7 29% 2 3 4 20% 1 1

23 96% 5 15 25 100% 3 11 18 71% 3 12 21 80% 4 14

0 2% 0 0 0 0% 1 3 5 20% 1 1 3 11% 0 1

25 98% 5 15 25 100% 4 12 20 80% 4 14 22 89% 5 14

5% 5% 7%

95% 95% 93%

25%

75%

10% 4% 13%

90% 96% 87%

20%

80%

5% 5% 10% 10% 2% 2% 5% 45% 35% 38% 39% 45% 25% 17% 29% 30% 15%

95% 95% 90% 90% 98% 98% 95% 55% 65% 62% 61% 55% 75% 83% 71% 70% 85%

42


Surat Al-Kautsar

2

5

10

Surat Al-Ma’un

2

5

10

25 Jumlah 5 15 25 Jumlah 5 15 25 Jumlah 5 15 25

7 31% 1 1 1 7% 1 1 1 7% 1 1 0

18 69% 4 14 24 93% 4 14 24 93% 4 14 25

3 18% 1 1 1 7% 0 1 1 4% 0 0 0

22 82% 4 14 24 93% 5 14 24 96% 5 15 25

2 9% 0 1 0 2% 0 1 0 2% 0 0 0

23 91% 5 14 25 98% 5 14 25 98% 5 15 25

0 2% 0 1 0 2% 0 0 0 0% 0 0 0

25 98% 5 14 25 98% 5 15 25 100% 5 15 25

Jumlah 5 15 25 Jumlah 5 15 25 Jumlah 5 15 25

4% 4 8 11 51% 3 7 11 47% 2 6 9

96% 1 7 14 49% 2 8 14 53% 3 9 16

0% 2 9 10 47% 2 3 8 29% 2 3 7

100% 3 6 15 53% 3 12 17 71% 3 12 18

0% 2 3 7 27% 2 1 5 18% 1 5 5

100% 3 12 18 73% 3 14 20 82% 4 10 20

0% 1 3 5 20% 1 2 3 13% 1 2 2

100% 4 12 20 80% 4 13 22 87% 4 13 23

12% 19% 10% 7% 2% 6% 5% 5% 2% 4% 5% 2%

88% 81% 90% 93% 98% 94% 95% 95% 98% 96% 95% 98%

0% 2% 45% 38% 33% 39% 40% 22% 27% 30% 30% 27% 23%

100% 98% 55% 62% 67% 61% 60% 78% 73% 70% 70% 73% 77%

43


Surat Quraisy

2

5

10

Surat Al-Fiil

2

5

10

Juumlah 5 15 25 Jumlah 5 15 25 Jumlah 5 15 25 Jumlah 5 15 25 Jumlah 5 15 25 Jumlah 5 15 25 Jumlah

38% 2 2 3 16% 2 2 2 13% 2 1 2 11% 2 3 5 22% 2 1 3 13% 1 2 2 11%

62% 3 13 22 84% 3 13 23 87% 3 14 23 89% 3 12 20 78% 3 14 22 87% 4 13 23 89%

27% 1 1 3 11% 1 1 1 7% 1 1 2 9% 2 2 3 16% 1 1 2 9% 1 1 1 7%

73% 4 14 22 89% 4 14 24 93% 4 14 23 91% 3 13 22 84% 4 14 23 91% 4 14 24 93%

24% 1 1 2 9% 1 1 1 7% 0 0 2 4% 1 1 3 11% 1 1 0 4% 0 0 1 2%

76% 4 14 23 91% 4 14 24 93% 5 15 23 96% 4 14 22 89% 4 14 25 96% 5 15 24 98%

11% 0 1 1 4% 0 0 1 2% 0 0 0 0% 1 0 1 4% 0 0 1 2% 0 0 1 2%

89% 5 14 24 96% 5 15 24 98% 5 15 25 100% 4 15 24 96% 5 15 24 98% 5 15 24 98%

27% 20% 8% 9% 12% 20% 7% 5% 11% 15% 3% 6% 8% 30% 10% 12% 17% 20% 5% 6% 10% 10% 5% 5% 7%

73% 80% 92% 91% 88% 80% 93% 95% 89% 85% 97% 94% 92% 70% 90% 88% 83% 80% 95% 94% 90% 90% 95% 95% 93%

*TL : Tidak Lulus, *L : Lulus

44


45

Pada tabel 4.1 diatas adalah pengukuran kinerja modifikasi MFCC pada sistem penghafalan al-qur’an secara rinci dalam mengenali pola nagham al-qur’an pada 10 surat terakhir juz 30 dalam al-qur’an dengan jumlah data training maupun data testing yang memiliki variasi jumlah data yang berbeda-beda dan dalam berbagai nilai toleransi yaitu 0.3, 0.4, 0.5 dan 0.6 seperti yang sudah dipaparkan sebelumnya didalam tabel 4.1 diatas. Kedudukan nilai toleransi dan banyak data training yang dilakukan sangat mempengaruhi tingkat pengenalan pola nagham pada sistem penghafalan alqur’an. Semakin banyak variasi data training dan data testing dengan semakin besar nilai toleransi maka akan semakin tinggi tingkat keakuratan pengenalan pola nagham al-qur’an pada sistem penghafalan al-qur’an ini.

Tabel 4.2 Unjuk kerja modifikasi MFCC setiap surat berdasarkan toleransi rate

No. Surat Ke1. 114.

Juz 30

Surat An-Nas (6)

2.

113. Surat Al-Falaq (5)

3.

112. Surat Al-Ikhlas (4)

4.

111. Surat Al-Lahab (5)

5.

110. Surat An-Nasr (3)

6.

109.

Surat Al-Kafirun (6)

Toleransi rate 0.3 0.4 0.5 0.6 0.3 0.4 0.5 0.6 0.3 0.4 0.5 0.6 0.3 0.4 0.5 0.6 0.3 0.4 0.5 0.6 0.3 0.4

Nilai rata-rata TL L 30% 70% 24% 76% 16% 84% 8% 92% 24% 76% 16% 84% 11% 89% 7% 93% 17% 83% 13% 87% 7% 93% 3% 97% 23% 77% 14% 86% 9% 91% 4% 96% 11% 89% 7% 93% 4% 96% 1% 99% 41% 59% 29% 71%


46

7.

108.

Surat Al-Kausar (3)

8.

107.

Surat Al-Maa’un (7)

9.

106.

Surat Quraisy (4)

10.

105.

Surat Al-Fiil (5)

0.5 0.6 0.3 0.4 0.5 0.6 0.3 0.4 0.5 0.6 0.3 0.4 0.5 0.6 0.3 0.4 0.5 0.6

19% 11% 6% 4% 1% 1% 45% 34% 23% 15% 13% 9% 7% 2% 16% 10% 6% 3%

81% 89% 94% 96% 99% 99% 55% 66% 77% 85% 87% 91% 93% 98% 84% 90% 94% 97%

*TL : Tidak Lulus, *L : Lulus

Tabel 4.2 memaparkan nilai rata-rata berdasarkan nilai toleransi atau toleransi rate pada 10 surat juz 30 dalam pengenalan pola nagham al-qur’an dengan mengabaikan variasi jumlah data training dan data testing. Akan terlihat jelas persentase tingkat keakuratan pengenalan pola nagham al-qur’an. Dimana tingkat ketidak lulusan pengenalan pola tertinggi pada nilai toleransi yang kecil yaitu pada toleransi rate 0.3 atau 30%. Dimana maksud dari nilai toleransi ini adalah toleransi error. Semakin kecil nilai toleransi error atau toleransi rate maka akan semakin rumit pengenalan pola nagham al-qur’an. Sehingga pada toleransi rate 0.3 yang hanya 30% memberikan toleransi error dalam mengenali pola nagham al-qur’an memiliki nilai ketidak lulusan tertinggi dalam pengenalan pola nagham al-qur’an pada sistem penghafalan al-qur’an terlihat secara terperinci pada grafik gambar 4.10. Dan sebaliknya semakin besar nilai toleransi error atau toleransi rate yang diberikan maka akan semakin mudah pengenalan pola nagham alqur’an. Sehingga pada toleransi rate 0.6 memiliki nilai Kelulusan tertinggi dalam pengenalan pola nagham al-qur’an pada sistem penghafalan al-qur’an yang terilustrasi pada grafik gambar 4.11.


47

Grafik Pengenalan Pola Nagham Berdasarkan Nilai Toleransi Kategori "Tidak Lulus" 45% 40% Persentase

35% 30% 25%

nilai toleransi 0.3 nilai toleransi 0.4 nilai toleransi 0.5 nilai toleransi 0.6

20% 15% 10% 5% 0% 1

2

3

4

5

6

7

8

9

10

Data Surat Al-Qur'an

Gambar 4.10 Grafik Unjuk Kerja Modifikasi MFCC Berdasarkan Toleransi Rate Pada Kategori Tidak Lulus

Gambar 4.10 menjelaskan unjuk kerja metode ektraksi fitur yaitu metode modifikasi MFCC berdasarkan nilai toleransi yaitu 0.3, 0.4, 0.5, dan 0.6 pada 10 surat terakhir juz 30 al-qur’an dalam pengenalan pola nagham al-qur’an pada sistem penghafalan al-qur’an yang Tidak Lulus. Dimana pada surat ke-8 yaitu surat Al-Ma’un dengan berbagai varian nilai toleransi memiliki tingkat ketidak lulusan tertinggi atau bisa dikatakan dengan tingkat keakuratan terendah dalam mengenali pola nagham al-qur’an pada sistem penghafalan al-qur’an. Tingkat ketidak lulusan tertinggi atau tingkat keakuratan terendah yaitu pada nilai toleransi 0.3 yang mencapai 45%, dibandingkan nilai toleransi dalam varian lain dan dibandingkan surat lainnya.


48

Grafik Pengenalan Pola Nagham Berdasarkan Nilai Toleransi Kategori "Lulus" 100%

Persentase

80% nilai toleransi 0.3 nilai toleransi 0.4 nilai toleransi 0.5 nilai toleransi 0.6

60% 40% 20% 0% 1

2

3

4

5

6

7

8

9

10

Data Surat Al-Qur'an

Gambar 4.11 Grafik Unjuk Kerja Modifikasi MFCC Berdasarkan Toleransi Rate Pada Kategori Lulus

Gambar 4.11 menjelaskan unjuk kerja metode ektraksi fitur yaitu metode modifikasi MFCC berdasarkan nilai toleransi yaitu 0.3, 0.4, 0.5, dan 0.6 pada 10 surat terakhir juz 30 al-qur’an dalam pengenalan pola nagham al-qur’an pada sistem penghafalan al-qur’an yang Lulus. Dimana tingkat Kelulusan atau tingkat keakuratan tertinggi dalam pengenalan pola nagham al-qur’an pada sistem penghafalan al-qur’an terdapat pada surat ke-5 dan ke-7 yaitu surat An-Nasr dan Al-Kausar. Pada surat An-Nasr pencapaian keakuratan pengenalan pola tertinggi yaitu pada toleransi rate 0.6 yang mencapai 99% sedangkan pada surat Al-Kausar pencapaian keakuratan pengenalan pola tertinggi pada toleransi rate 0.5 dan 0.6 dimana pencapaian keakuratan pengenalan pola nagham pada toleransi rate tersebut kedua-dua nya mencapai 99%.


49

Tabel 4.3 Persentase keseluruhan unjuk kerja modifikasi MFCC sistem penghafalan al-qur’an pada pengenalan pola nagham al-qur’an

No. 1. 2. 3. 4. 5. 6. 7. 8. 9. 10.

Surat Ke114. 113. 112. 111. 110. 109. 108. 107. 106. 105.

Juz 30 Surat An-Nas (6) Surat Al-Falaq (5) Surat Al-Ikhlas (4) Surat Al-Lahab (5) Surat An-Nasr (3) Surat Al-Kafirun (6) Surat Al-Kausar (3) Surat Al-Maa’un (7) Surat Quraisy (4) Surat Al-Fiil (5) Nilai rata-rata

False Positive Rate 25% 20% 12% 15% 9% 29% 4% 32% 10% 11% 17%

Detection Rate 75% 80% 88% 85% 91% 71% 96% 68% 90% 89% 83%

Tabel 4.3 ini merupakan hasil presentase dari keseluruhan 10 surat terakhir juz 30 dalam al-qur’an. Secara keseluruhan sistem penghafalan al-qur’an memiliki tingkat keakuratan atau detection rate dan false positive rate rata-rata per surat nya. Pencapaian tingkat keakuratan atau detection rate tertinggi pada nilai ratarata detection rate per surat nya yaitu pada Surat Al-Kausar yang mencapai 96%. Dimana panjang pendeknya durasi sinyal suara pola nagham al-qur’an, kedudukan nilai toleransi dan banyak data training pada sistem penghafalan al-qur’an sangat mempengaruhi tingkat keakuratan.


50

Unjuk Kerja Modifikasi mel-frequency cepstral coefficient Pada Sistem Penghafalan Al-Qur'an Dalam Pengenalan Pola Nagham Al-Qur'an

100% 80% 60% 40% 20% 0% 1

2

3

4

5

6

False Positive Rate

7

8

9

10

Detection Rate

Gambar 4.12 Grafik Unjuk Kerja Modifikasi Mel-Frequency Cepstral Coefficient (MFCC) Secara Keseluruhan Per-Surat

Gambar 4.12 merupakan ilustrasi hasil dari tabel 4.3 yang mana menjelaskan unjuk kerja metode modifikasi mel-frequency cepstral coefficient (MFCC) secara keseluruhan per-surat dari 10 surat terakhir juz 30 dalam al-qur’an dalam pengenalan pola nagham al-qur’an. Terlihat jelas bahwa detection rate tertinggi terdapat pada surat ke-7 yaitu surat Al-Kausar. Dan false positive rate tertinggi terdapat pada surat ke-8 yaitu surat Al-Ma’un. Yang mana panjang pendeknya durasi sinyal suara pola nagham al-qur’an menjadi salah satu faktor yang mempengaruhi tingkat keakuratan dalam pengenalan pola nagham al-qur’an.


51

Kinerja Metode Modifikasi mel-frequency cepstral coefficients (MFCC) Pada Sistem Penghafalan Al-Qur'an Dalam Pengenalan Pola Nagham Al-Qur'an

17%

83%

Detection Rate False Positive Rate

Gambar 4.13 Diagram Kinerja Modifikasi MFCC Dengan Tingkat Keakuratan Secara Keseluruhan

Gambar 4.13 merupakan gambar diagram kinerja modifikasi mel-frequency cepstral coefficient (MFCC) dengan tingkat keakuratan secara keseluruhan mencapai 83%. Dan dapat disimpulkan bahwa metode hasil modifikasi melfrequency cepstral coefficient (MFCC) dimana pada proses merubah nilai cepstrum dengan menggunakan discrete wavelet transform (DWT) dapat memberikan perubahan peningkatan hasil keakuratan sistem dalam pengenalan pola nagham al-qur’an dengan model yang lebih bervariasi baik pada data testing maupun data training dan dalam berbagai kedudukan toleransi rate yang bervariasi hasil modifikasi metode mel-frequency cepstral coefficient (MFCC) mampu memberikan peningkatan keakuratan pada sistem penghafalan al-qur’an dalam pengenalan pola nagham al-qur’an dibandingkan dengan hanya menggunakan mel-frequency cepstral coefficient (MFCC) konvensional.


52

4.1.5

Hasil Pengenalan Pola Nagham Al-Qur’an

Pengenalan pola nagham al-qur’an pada sistem penghafalan al-qur’an menggunakan dua parameter, yaitu detection rate dan false positive rate. Detection rate adalah pengenalan pola nagham yang berhasil dikenali dengan indikasi “Lulus” pada sistem penghafalan al-qur’an. Sedangkan false positive rate yaitu pengenalan pola nagham yang tidak berhasil dikenali dengan indikasi “Tidak Lulus” pada sistem penghafalan al-qur’an. Pencapaian indikasi pengenalan pola nagham dikatakan “Lulus” atau “ Tidak Lulus” bervariasi ini berdasarkan nilai toleransi error yang dipilih. Pada toleransi rate 0.3 indikasi pencapaian pengenalan pola nagham dikatakan “Lulus” jika >=70% kemiripan sinyal suara pola nagham dengan pola nagham yang telah disimpan sebagai model nilai acuan pada sistem penghafalan al-qur’an. Dan selanjutnya jika pada toleransi rate 0.4 indikasi pencapaian pengenalan pola nagham dikatakan “Lulus” jika >=60%, jika pada toleransi rate 0.5 indikasi pencapaian pengenalan pola nagham dikatakan “Lulus” jika >=50%, dan pada toleransi rate 0.6 indikasi pencapaian pengenalan pola nagham dikatakan “Lulus” jika kemiripan sinyal suara pola nagham hanya dengan pencapaian >=40% saja ini sudah dikatakan “Lulus”. 4.2 Pembahasan Berdasarkan hasil penelitian yang telah dilakukan, hasil unjuk kerja modifikasi metode ektraksi fitur yaitu modifikasi mel-frequency cepstral coefficient (MFCC) pada sistem penghafalan al-qur’an secara rinci dalam mengenali pola nagham alqur’an pada 10 surat terakhir juz 30, dengan nilai toleransi yang bervariasi dan banyaknya data training yang dilakukan sangat mempengaruhi tingkat pengenalan pola nagham pada sistem penghafalan al-qur’an. Semakin banyak variasi data training dan data testing dengan semakin besar toleransi rate maka akan semakin tinggi tingkat keakuratan pengenalan pola nagham al-qur’an pada sistem penghafalan al-qur’an. Dapat disimpulkan bahwa metode hasil modifikasi mel-frequency cepstral coefficient (MFCC) dimana pada proses merubah nilai cepstrum dengan


53

menggunakan discrete wavelet transform (DWT) dapat memberikan perubahan peningkatan hasil keakuratan sistem dalam pengenalan pola nagham al-qur’an dengan variasi yang lebih terperinci dibandingkan dengan hanya menggunakan mel-frequency cepstral coefficient (MFCC) konvensional yang hanya dapat mengenali pola nagham dan tidak dalam variasi data yang spesifik.


54

BAB V KESIMPULAN DAN SARAN

5.1

Kesimpulan

Hasil penelitian menunjukkan bahwa bahwa metode hasil modifikasi melfrequency cepstral coefficient (MFCC) dimana pada proses merubah nilai cepstrum dengan menggunakan discrete wavelet transform (DWT) dan dengan pengolahan data yang dilakukan secara real-time dapat memberikan perubahan peningkatan hasil keakuratan sistem dalam pengenalan pola nagham al-qur’an mencapai 83% dengan variasi data yang lebih terperinci dibandingkan dengan hanya menggunakan mel-frequency cepstral coefficient (MFCC) konvensional keakuratan sistem dalam mengenali pola nagham al-qur’an hanya 80% dan tidak dalam variasi data yang lebih spesifik. Dan dengan banyaknya data training yang dilakukan dan nilai toleransi rate yang bervariasi sangat mempengaruhi tingkat pengenalan pola nagham pada sistem penghafalan al-qur’an. Semakin banyak variasi data training dan data testing dan dengan semakin besar nilai toleransi rate maka akan semakin tinggi tingkat keakuratan pengenalan pola nagham al-qur’an pada sistem penghafalan alqur’an. Pengenalan pola nagham tertinggi pada nilai toleransi rate 0.3. dan keakuratan sistem dalam mengenali pola nagham tertinggi pada data surat ke-7 yaitu Surat Al-Kausar detection rate nya mencapai 99% pola yang dikenali. Panjang pendeknya durasi sinyal suara pola nagham al-qur’an menjadi salah satu faktor yang mempengaruhi tingkat keakuratan dalam pengenalan pola nagham alqur’an.


55

5.2

Saran

Untuk penelitian berikutnya dapat menambahkan data yang lebih bervariasi pada sistem penghafalan al-qur’an dalam pengenalan pola nagham al-qur’an berdasarkan jenis suara dan dapat menambahkan algoritma pencocokan pola untuk pengklasifikasian jenis suara. Penambahan pendekatan tersebut tentunya akan mempengaruhi kecepatan komputasi pada pengenalan pola.


56

DAFTAR PUSTAKA

Abdalla, M.I., Abobakr, H.M. & Gaafar, T.S. 2013. DWT and MFCCs based Feature Extraction Methods for Isolated Word Recognition. International Journal Of Computer Application Vol.69 (20). PP : 21-25. Abro, B., Naqvi, A.B. & Hussain, A. 2012. Qur’an Recognition for the Purpose of Memorisation Using Speech Recognition Technique. International Multitopic Conference (INIMIC). Adhoni, Z.A. & Siddiqi, A.A. 2013. A Programming Approach for Digital Quran Applications. International Journal Of Engineering & Computer Science IJECS-IJENS Vol.13 (5). PP : 26-35. Ali, H., Ahmad, N., Zhou, X. & Ali, S.M. 2014. DWT Features Performance Analysis for Automatic Speech Recognition Of Urdu. Spinger Plus 2014 (3) : 204. Al-Irhaim, Y.F. & Saeed, E.G. 2010. Arabic Word Recognition Using Wavelet Neural Network. Third Scientific Conference in Information Technology. PP: 416-420. Al-Qusyairi, Syarif., 2010. “Kamus Akbar Arab-Indonesia Disertai Cara Membaca”. Karya Ilmu. Surabaya. Anusya, M.A. & Katti, S.K. 2010. Mel Frequency Discrete Wavelet Coefficient for Kannada Speech Recognition using PCA. Proceeding of International Conference on Advances in Computer Science (ACEEE). PP : 225-227. Arshad, N.W., Sukri, S.M., Muhammad, L.N., Ahmad, H., Hamid, R., Naim, F. & Naharuddin, N.Z.A. 2013. Makhraj Recognition For AlQuran Recitation using MFCC. International Journal Of Intelligent Information Processing (IJIIP) vol.4 (2). PP : 45-53. Afrillia, Y., Mawengkang, H., Ramli, M., Fadlisyah & Fhonna, R.P. 2017. Performance Measurement Of Mel Frequency Ceptral Coeffiecient (MFCC) Method In Learning System Of Al-Qur’an Based In Nagham Pattern Recoginition. International Coference on Information and Communivation Technology (IconICT). IOP Publishing. 930 (2017) 012036. Afrillia, Y., Mawengkang, H., Ramli, M., Zarlis, M., & Efendi, S. 2017. Perbandingan Unjuk Kerja Walsh Transform Dan Hadamard Transform Pada Pengenalan Huruf Hijaiyah Melalui Suara. Seminar Nasional Matematikan dan Terapan (SIMANTAP 2017). Beigi, H. 2011. Fundamentals Of Speaker Recognition. Spinger : New York.


57

Bhaskoro, B., Susetyo., Ariani, I. & Alamsyah, A.A. 2014. Transformasi Pitch Suara Manusia Menggunakan Metode PSOLA. Jurnal ELKOMIKA Institut Teknologi Nasional Bandung Vol.2 (2). Erokyar, H. 2014. Age And Gender Recognition For Apeech Applications Based On Support Vector Machine. Thesis Master of science in electrical engineering, universitas of south florida. Farhid, M. & Tinati, M.A. 2008. Robust Voice Conversion System Using MFDWC. International Symposium on Telecommunications. PP : 778-781. Gowdy, J.N. & Tufekci, Z. 2000. Feature Extraction Using Dicrete Wavelet Transform for Speech Recognition. Proceending of the IEEE (19). PP: 116123. Gowdy, J.N. & Tufekci, Z. 2000. Mel-Scaled Discrete Wavelet Coefficient for Speech Recogntion. International Conference on Acoustics, Speech and Signal Vol.3 (29). PP: 1351-1354. Hanggarsari, P.N., Fitriawan, H. & Yuniati, Y. 2012. Simulasi Sistem Pengacakan Sinyal Suara Secara Realtime berbasis Fast Fourier Transform (FFT). Electrical Jurnal Rekayasa dan Teknologi Elektro Vol.6 (3). PP : 192-198. Heriyanto. & S.N. Azhari. 2014. Rekayasa Perangkat Lunak Untuk Klasifikasi Bacaan Iqra’ Melalui Voice Recognition Menggunakan Metode Sampling Deviasi Everage Energy dan Deviasi Wave. Jurnal TELEMATIKA Vol.10 (2). PP : 119-128. Hibare, R. & Vibhute, A. 2014. Feature Extraction Techniques in Speech Processing : A Survey. International Journal Of Computer Applications Vol.107 (5). PP : 1-8. Ibrahim, N.J., Idris, M.Y.I., Razak, Z. & Rahman, N.N.A. 2013. Automated tajweed Checking Rules Engine for Quranic Learning. Multicultural Education & Techonology Journal Vol.7 (4). PP : 275-287. I.Daubechies. 1988. Ortonormal bases of Compactly Supported Wavelet. Comm.Pure Apple. Math. PP : 909- 996. Ishaq, M. 2007. Fisika Dasar. Bandung: Graha Ilmu. Ismail, A., Idris, M.Y.I., Noor, N.M., Razak, Z. & Yusof, Z. 2014. MFCC-VQ Approach for Qalqalah Tajweed Rule Checking. Malaysian Journal Of Computer Science Vol. 27 (4). PP : 275-293. Jamaliah, N. 2010. Automated Tajweed Checking Rules Engine For Quranic Verse Recitation. Disertasi Ph.D. Universitas Of Malaya. Jie, Y. & Zhenli, W. 2009. Noise Robust Speech Recognition by Combining Speech Enhancement in the Wavelet Domain and Lin-log RASTA. International Colloqium on Computing, Communication, Control and Management (ISECS). PP : 415 – 418.


58

Kamarudin, N. Nematollahi, M.A. & Abd Rauf bin Hasan. 2014. Feature Extraction Using Spectral Centroid and Mel Frequency Cepstral Coefficient for Quranic Accent Automatic Identification. IEEE Student Conference on Research and Development (SCOReD). Logan, B. 2000. Mel Frequency Cepstral Coefficient for Music Modeling. International Symposium in Music Information Ritival. Martinez, J., Perez, H., Escamilla, E. & Suzuki, M.M. 2012. Speaker Recognition Using Mel-Frequency Ceptral Coefficient (MFCC) and Vector Quantization (VQ) Techniques. International Confernce on Electrical Communication and Computers Vol.10. PP : 248-251. Madan., Akansha. & Gupta, D. 2014 Speech Feature Extraction and Classification : A Comparative Review. International Journal Of Computer Application Vol.90 (9). PP : 20-25. Omer, A.E. 2017. Joint MFCC-and-Vector Quantization based Text-Independent Speaker Recognition System. International Conference on Communication, Control, Computing and Electronic Engineering (ICCCCEE). PP : 1-6. Pandiaraj, S. & Kumar, K.R.S. 2015. Speaker Identification Using Discrete Wavelet Transform. Journal Of Computer Science Vol. 11 (1). PP : 53-56. Prasetya, W., Binyamin., Susanto,B. & Purwadi, J. 2008. Identifikasi Suara Pria dan Wanita Berdasarkan Frekuensi Suara. Jurnal Informatika, Vol 4 (1). Putra, B., Atmaja, B.T. & Prananto, D. 2011. Prototyping Of Quranic Verse Recitation Learning Software Using Speech Recognition Techniques Based on Cepstral Feature. International Conference on Informatic for Development 2011 (ICID 2011). PP : 82-87. Putra, D. & Resmawan, A. 2011. Verifikasi Biometrika Suara Menggunakan Metode MFCC dan DWT. Lontar Komputer : Jurnal I lmiah Teknologi Informasi Vol.2 (1). PP : 8-21. Putra, D. 2010. Pengolahan Citra Digital. Andi. Yogyakarta. Saini, P. & Kaur, P. 2013. Automatic Speech Recognition : A Review. International Journal Of Engineering Trends and Technology Vol.4 (2). PP : 132-136. S Azman Mohd Noah, S.S., Salim, N. & Zainal, H. 2013. Rules and Natural Language Pattern in Extracting Quranic Knowledge. International Conference on Advances in Information Technology for the Holy Quran and Its Sciences. Setiawan, A., Hidayanto, A. & Isnanto, R.R. 2011. Aplikasi Pengenalan Ucapan dengan Ekstraksi Mel-Frequency Cepstral Coefficent (MFCC) melalui Jaringan Syaraf Tiruan (JST) Learninf Vector Quantization (LVQ) untuk


59

Mengoprasikan Kursor Komputer. Jurnal TRANSMISI Vol.13 (3). PP : 8286. Syaifuddin, A. & Suryono. 2014. Fast Fourier Transform (FFT) Untuk Analisis Sinyal Suara Doopler Ultrasonik. Youngster Physics Journal Vol.3 (3). PP : 181-188. Tavanaei, A., Manzuri, M.T. & Sameti, H. 2011. Mel-Scaled Discrete Wavelet Transform and Dynamic Features for the Persian Phoneme Recognition. Internasional Symposium on Artifical Intelligance and Signal Processing (AISP) (2). PP : 138-140. V, Sabitha. & P, Janardhanan. 2015. Speaker Verification System Using MFCC and DWT. IOSR Journal of Electronic & Communication Engineering (IOSR-JECE). PP : 24-29. Zainon, Zahra N.S., Ahmad, Z.A., Ramli, M.A. & Yacoob, S. 2012. Speech Quality based on Arabic Pronunciation Using MFCC and LDA. IEEE International Conference on Control System, Computing and Engineering. PP : 398-403.


60

LAMPIRAN

Mel-Frequency Ceptral Coefficient (Proses Training) procedure TForm2.ALGenericFilter1ProcessData(Sender: TObject; InBuffer: IALAudioBuffer; var OutBuffer: IALAudioBuffer; var SendOutputData: Boolean); var I : Integer; begin inc(N,1); Total:=0; Premphasis:=0; for I := 0 to InBuffer.GetSize() - 1 do begin Total:= Total+InBuffer[ I, 0 ]; //PRE EMPHASIS if I>0 then Premphasis:=Premphasis+(InBuffer[ I, 0 ]-InBuffer[ I-1, 0 ]); inc(M,1); end; //M_sebaran[N]:=Total/(InBuffer.GetSize() - 1); //M_sebaran[N]:= Premphasis; //FRAMMIG 1024 per SEGMEN/BUFFER //* WINDOWING Windowing:=0.54-(0.46*cos(2*3.14*InBuffer.GetSize()/(N))); //Mutiplied M_sebaran[N]:= Premphasi*window M_sebaran[N]:= Premphasis*Windowing; if M_sebaran[N]<>0 then Memo1.Lines.Add(inttostr(N)+' '+floattostr(M_sebaran[N])); end;

Output Nilai Hasil MFCC Hasil Proses Training procedure TForm2.Button2Click(Sender: TObject); begin ALAudioIn2.Start(); NH:=0; L:=0; TL:=0; Memo2.Clear; Memo3.Clear; Label1.Caption:='...'; //Label4.Caption:='...'; end;


61

Mel-Frequency Ceptral Coefficient (Proses Testing) procedure TForm2.ALGenericFilter2ProcessData(Sender: TObject; InBuffer: IALAudioBuffer; var OutBuffer: IALAudioBuffer; var SendOutputData: Boolean); var I : Integer; begin inc(NH,1); Total:=0; Premphasis:=0; for I := 0 to InBuffer.GetSize() - 1 do begin Total:= Total+InBuffer[ I, 0 ]; //PRE EMPHASIS UJI if I>0 then Premphasis:=Premphasis+(InBuffer[ I, 0 ]-InBuffer[ I-1, 0 ]); inc(M,1); end; Windowing:=0.54-(0.46*cos(2*3.14*InBuffer.GetSize()/(N))); M_sebaranH[NH]:=Premphasis*Windowing; if M_sebaran[N]<>0 then Memo2.Lines.Add(inttostr(NH)+' '+floattostr(M_sebaranH[NH])); //BANDINGKAN if NH<=N then begin if M_sebaran[NH]<>0 then if M_sebaranH[NH]<>0 then if M_sebaran[NH]>M_sebaranH[NH] then banding:=M_sebaranH[NH]/M_sebaran[NH] else banding:=M_sebaran[NH]/M_sebaranH[NH]; if abs(banding)>0.4 then begin inc(L,1); Memo3.Lines.Add('+') end else begin inc(TL,1); Memo3.Lines.Add('-') end end; end; procedure TForm2.Button3Click(Sender: TObject); Var u,x Real_fourier, imajiner_fourier, spektrum N_spektrum T_spektrum Real_fourierH, imajiner_fourierH, spektrumH N_spektrumH T_spektrumH, Energi MEL,MELH,logMEL,LogMELH

: : : : : : : :

integer; real; integer; real; real; integer; real; real;


62

wavelet

: real;

begin ALAudioIn2.Stop(); Label2.Caption:='+:= '+inttostr(L); Label3.Caption:='-:= '+inttostr(TL); //cek:=1; if L>TL then cek:=TL/L; if cek<Alpha then Label1.Caption:='LULUS' else Label1.Caption:='TIDAK LULUS'; //------------Transformasi Sinyal Fourier N_spektrum :=0; T_spektrum :=0; N_spektrumH:=0; T_spektrumH:=0; for u:=0 to N-1 do for x:=0 to N-1 do begin Real_fourier:=(1/N)* M_sebaran[x] * cos ((2*PI*u*x)/N); Imajiner_fourier:=-(1/N)* M_sebaran[x] * sin ((2*PI*u*x)/N); //spektrum fourier spektrum:=sqrt(sqr(real_fourier)+sqr(imajiner_fourier)); N_spektrum:=N_spektrum+1; T_spektrum:=T_spektrum+spektrum ; //---tahap II Fourier Hafal Uji Real_fourierH:=(1/N)* M_sebaranH[x] * cos ((2*PI*u*x)/N); Imajiner_fourierH:=-(1/N)* M_sebaranH[x] * sin ((2*PI*u*x)/N); //spektrum fourier spektrumH:=sqrt(sqr(real_fourierH)+sqr(imajiner_fourierH)); N_spektrumH:=N_spektrumH+1; T_spektrumH:=T_spektrumH+spektrumH ; //-----------akhir Transformasi end; //MEL FREQUENCY WRAPPING - MEL FILTER BANK MEL:= T_spektrum; MELH:= T_spektrumH; //LOG logMEL:=2595*ln((MEL+1)*700); logMELH:=2595*ln((MELH+1)*700); //WAVELET for u:=0 to N-1 do


63

for x:=0 to N-1 do begin wavelet:=(abs(M_sebaran[x] - M_sebaranH[x]) + abs(M_sebaran[x] + M_sebaranH[x]))*0.5; end; //---------Analisa Energi Sinyal if T_spektrumH<T_spektrum then Energi:= T_spektrumH/T_spektrum else Energi:= T_spektrum/T_spektrum; //if cek<Alpha then label4.Caption:=inttostr(round(Energi)*100)+' '+'%'; end;

Toleransi Rate procedure TForm2.Button4Click(Sender: TObject); begin ALAudioIn1.Stop(); end; procedure TForm2.N031Click(Sender: TObject); begin Alpha:=0.3; end; procedure TForm2.N041Click(Sender: TObject); begin Alpha:=0.4; end; procedure TForm2.N051Click(Sender: TObject); begin Alpha:=0.5; end; procedure TForm2.N061Click(Sender: TObject); begin Alpha:=0.6; end; procedure TForm2.FormActivate(Sender: TObject); begin Alpha:=0.0000; end; end.


Turn static files into dynamic content formats.

Create a flipbook
Issuu converts static files into: digital portfolios, online yearbooks, online catalogs, digital photo albums and more. Sign up and create your flipbook.