Beberapa dari kalian pasti pernah melakukan percakapan dengan smart speaker, google assistant atau siri, kan ya? Baik untuk mengakses sebuah fitur dalam handphone, mencari informasi hingga sekadar ngobrol. Memahami bahwa lawan bicara kalian adalah robot, namun memiliki intonasi natural seperti manusia yang mempermudah kita untuk memahami kalimat yang disampaikan. Pengalaman yang menyenangkan, bukan?
Suara yang kalian dengarkan merupakan salah satu pengaplikasian dari teknologi text to speech (TTS) atau konversi tulisan menjadi suara. Saat ini, penggunaan text to speech di beberapa negara sudah banyak diterapkan, terutama di Tiongkok, sebagai pendukung alat yang akan mengakomodasi kebutuhan dalam sistem edukasi bagi para difabel hingga membantu lansia. Contoh ini juga menjadi salah satu prediksi bahwa akan ada peningkatan penggunaan teknologi suara sebanyak 600% di tahun 2027. Di Indonesia sendiri, tren ini sudah mulai muncul dan tidak lama lagi Indonesia akan ikut meramaikan pasar penggunaan teknologi suara sebagai penunjang kebutuhan atau bahkan mempermudah kegiatan sehari-hari hingga digunakan pada sektor bisnis. Kali ini, kita akan membahas hal paling dasar mengenai text to speech, seperti memahami apa itu text to speech dan bagaimana text to speech bisa menjadi solusi.
Apa sebenarnya TTS atau text to speech itu?
Secara definisi, TTS atau text to speech merupakan sistem yang digunakan untuk mengubah tulisan menjadi suara. Salah satu komponen dalam text to speech bisa mengkonversikan simbol fonetik linguistik menjadi kata-kata sesuai dengan fonem. Text to speech juga sering disebut dengan voice computing yang membutuhkan berbagai macam data rekaman suara untuk diolah sebagai bentuk dasar dari suara, sehingga memiliki karakter yang mirip dengan suara manusia.
Meskipun dikembangkan agar terdengar natural atau manusiawi, untuk menciptakan suara yang memiliki karakter atau emosi yang tercipta dari sebuah konteks kalimat masih menjadi salah satu ‘PR’ bagi para text to speech developer. Bukan tidak mungkin, namun untuk memberikan intonasi dan emosi pada sebuah kata dibutuhkan data perekaman suara yang banyak. Agar karakter suara bisa tercipta, sistem text to speech harus bisa memproses karakter suara dari sebuah kata yang diucapkan oleh pengisi suara.
Emang solusi apa, sih, yang ditawarkan oleh Text to Speech?
Dibalik kecanggihan dan limitasi yang ada, text to speech bisa menjadi solusi dalam berbagai masalah atau inovasi dalam beberapa sektor bisnis, organisasi, penerbit besar, bahkan dalam kehidupan sehari-hari.
Beberapa kegunaan serta solusi yang ditawarkan dengan adanya text to speech, yaitu:
- Menyuarakan konten blog atau caption video – Menjangkau audiens lebih luas termasuk audiens dengan disabilitas, sehingga meningkatkan engagement.
- Membantu proses belajar dan mengajar – Teknologi TTS ditengarai akan sangat membantu mereka yang memiliki kesulitan belajar karena disabilitas yang dimiliki, seperti tuna netra, tuna wicara atau disleksia.
- Memberikan solusi untuk pencinta buku yang tidak memiliki waktu untuk membaca – Permintaan audio buku meningkat hampir 50%, baik karena alasan kenyamanan atau tidak adanya waktu membaca buku fisik.
- Menghemat waktu, uang, dan tenaga – Proses sintesis tulisan menjadi suara membutuhkan waktu yang singkat dan tenaga kerja yang sedikit dibandingkan dengan proses konversi suara dengan cara manual.
- Menciptakan keterikatan antara produk dan pelanggan – Memungkinkan produk kamu untuk menyesuaikan emosi dengan pesan dari produk untuk menciptakan rasa keterikatan. Ini alasan mengapa TTS sering digunakan dalam produk berbasis suara seperti smart speaker.
- Meningkatkan kepuasan pelanggan yang menghubungi Layanan Pelanggan – 74% pelanggan menginginkan interaksi dengan manusia asli. TTS akan memberikan pengalaman seperti berinteraksi dengan manusia asli yang konsisten dapat meningkatkan kepuasan pelanggan.
Ternyata, text to speech bisa diaplikasikan di berbagai sektor dengan berbagai tujuan yang ingin dicapai. Menarik, bukan? Widya Wicara sendiri sudah menggunakan teknologi text to speech ini untuk produk Smart Speaker Widya Wicara Prima, lho! Bagi kalian yang ingin mengetahui contoh text to speech mengkonversi tulisan menjadi suara itu seperti apa, kalian bisa coba langsung menggunakan mesin text to speech yang Widya Wicara punya dengan mengakses https://widyawicara.com/tts.
REFERENSI
Foto oleh Karolina Grabowska dari Pexels
https://voiceintuitive.com/en/2020/10/15/top-tts-trends-for-2021/
https://melroselabs.com/text-to-speech/
http://callej.org/journal/7-2/Kilickaya.html
https://arxiv.org/pdf/1806.00927.pdf
https://www.3playmedia.com/blog/pros-cons-synthesized-speech-audio-description/
https://www.sciencepubco.com/index.php/ijet/article/view/12933
https://ojs.cbn.ac.id/index.php/jukanti/article/view/217
https://jurnalmahasiswa.unesa.ac.id/index.php/jurnal-pendidikan-khusus/article/download/34462/30659