Bagaimana komputer dapat mengenal ucapan manusia?

Sudah pernah melihat robot/mesin yang paham dengan perintah suara manusia? seperti contohnya  fitur baru dari windows yang memungkinkan kita menggunakan perintah suara untuk mengoperasikan komputer. misalkan kita pengen membuka suatu aplikasi, kita tinggal perintahkan dengan kata “Open”. nah, bagaimana itu bisa bekerja? mari simak bersama-sama hasil gugling2 saya..

Ternyata, robot/mesin/komputer yang dapat mengenal suara manusia tersebut menggunakan Teknologi automatic speech recognition (ASR). Yaitu teknologi yang memungkinkan suatu perangkat untuk mengenali dan memahami kata-kata yang diucapkan dengan cara digitalisasi kata dan mencocokkan sinyal digital tersebut dnegan suatu pola tertentu yang tersimpan dalam suatu perangkat. Kata-kata yang diucapkan diubah bentuknya menjadi sinyal digital dengan cara mengubah gelombang suara menjadi sekumpulan angka yang kemudian disesuaikan dengan kode-kode tertentu untuk mengidentifikasi kata-kata tersebut. Hasil dari identifikasi kata yang diucapkan dapat ditampilkan dalam bentuk tulisan atau dapat dibaca oleh perangkat teknologi sebagai sebuah komando untuk melakukan suatu pekerjaan, misalnya penekanan tombol pada telepon genggam yang dilakukan secara otomatis dengan komando suara.

Bagaimana bentuk sistem yang dimaksud?

Alat pengenal ucapan, yang sering disebut dengan speech recognizer,  membutuhkan sampel kata sebenarnya yang diucapkan dari pengguna. Sampel kata akan didigitalisasi, disimpan dalam komputer, dan kemudian digunakan sebagai basis data dalam mencocokkan kata yang diucapkan selanjutnya. Sebagian besar alat pengenal ucapan sifatnya masih tergantung kepada pengeras suara. Alat ini hanya dapat mengenal kata yang diucapkan dari satu atau dua orang saja dan hanya bisa mengenal kata-kata terpisah, yaitu kata-kata yang dalam penyampaiannya terdapat jeda antar kata. Hanya sebagian kecil dari peralatan yang menggunakan teknologi ini yang sifatnya tidak tergantung pada pengeras suara. Alat ini sudah dapat mengenal kata yang diucapkan oleh banyak orang dan juga dapat mengenal kata-kata kontinu, atau kata-kata yang dalam penyampaiannya tidak terdapat jeda antar kata.

Alur Logika Sistem

1)      Penerimaan  data input, yaitu masukan berupa kata-kata yang diucapkan lewat pengeras suara.

2)       Ekstraksi, yaitu penyimpanan data masukan sekaligus pembuatan database untuk template.

3)      Pembandingan/pencocokan, yaitu tahap pencocokan data baru dengan data suara (pencocokan tata bahasa) pada template

___dari berbagai sumber___

www : google, wikipedia, kaskus

Advertisements

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s