Canggihnya teknologi masa kini terbukti telah memudahkan manusia dalam menjalani pekerjaan mereka. Salah satu yang penggunaannya semakin digandrungi masyarakat adalah teknologi Text to Speech (TTS)
Bagi sebagian orang, teknologi ini mungkin masih terdengar asing. Namun bagi pegiat sosial media dan content creator, teknologi Text to Speech sudah pasti dikenali, atau paling tidak, kamu pernah satu kali mendengar hasil dari pemanfaatan teknologi ini. Namun tentu saja pemanfaatan TTS tak sekedar untuk pembuat konten.
Lalu, apa itu teknologi Text to Speech? Berikut Widya Wicara akan mengenalkannya kepadamu!
Definisi Text to Speech
Teknologi Text to Speech dapat diartikan sebagai sebuah sistem yang mengonversi teks menjadi ucapan. Thierry Dutoit dalam bukunya yang berjudul “An Introduction to Text-to-Speech Synthesis”, mendefinisikan Text to Speech sebagai “production of speech by machines, by way of the automatic phonetization of the sentences to utter”.
Berdasarkan rujukan di atas, secara garis besar memunculkan definisi Text to Speech sebagai sistem yang mampu mengubah teks/tulisan menjadi ucapan secara otomatis melalui cara fonetisasi.
Maksud dari fonetisasi yakni menyusun fonem-fonem sehingga membentuk sebuah ucapan. Mengutip Wikipedia, fonem sendiri diartikan sebagai “istilah linguistik, satuan terkecil dalam sebuah bahasa yang masih bisa menunjukkan perbedaan makna”. Adapun teknologi Text to Speech, diketahui mampu membaca kata apa saja dengan kosa kata tak terbatas.
Sistem Text to Speech tentu tak bisa bekerja maksimal jika tidak didukung dengan kecanggihan teknologi berbasis artificial intelligence (kecerdasan buatan). Sistem ini dapat mengonversi beragam teks, mulai dari buku, berita, konten website, teks sederhana, dan lain sebagainya.
Bukan cuma itu, saat ini sudah banyak ditemui teknologi Text to Speech yang mengadopsi Natural Language Processing (NLP). NLP mampu menghasilkan output suara yang natural dan tidak terdengar seperti robot.
Baca juga artikel Yuk, Kenalan sama Text to Speech Bahasa Indonesia yang dipakai buat Smart Speaker!
Cara Kerja Sistem Text to Speech (TTS)
Pada umumnya, tugas sistem Text to Speech dibagi menjadi dua bagian besar, yakni analisis teks yang mentransformasi tulisan menjadi representasi linguistik, dan sintesa ucapan yang mentransformasi representasi linguistik menjadi sinyal ucapan.
Sebuah studi berjudul “A Prosodic Model of Mandarin Speech And Its Application to Pitch Level Generation for Text-to-Speech” yang diterbitkan oleh Shaw-Hwa Hwang and Sin-Horng Chen (1995), menyebutkan bahwa sistem Text to Speech dibagi menjadi dua sub sistem, yakni Text to Phoneme dan Phoneme to Speech.
Text to Phoneme (bagian konverter teks ke fonem bertugas mengubah input tulisan menjadi rangkaian kode-kode bunyi yang umumnya direpresentasikan dengan kode fonem, durasi, serta pitchnya.
Selanjutnya Phoneme to Speech (bagian konverter fonem ke ucapan) akan menerima kode-kode fonem, durasi, dan pitch tersebut, dan menghasilkan gelombang sinyal ucapan sesuai dengan kalimat yang diinginkan.
Pemanfaatan Text to Speech (TTS)
Teknologi text to speech sudah digunakan di berbagai bidang. Berikut beberapa contoh pemanfaatannya:
- Menunjang Content Creator
Seperti disinggung sebelumnya, teknologi Text to Speech dapat dimanfaatkan oleh para pembuat konten. Misalnya untuk pengganti voice over, narator konten review film, dan mengisi konten-konten lainnya. - Pengumuman Fasilitas Publik
Selain itu, TTS juga umum digunakan untuk memberikan pengumuman atau himbauan secara berulang di fasilitas publik, misalnya membantu otoritas lalu lintas. - Perbankan
Di sektor perbankan, pemanfaatan TTS dapat digunakan sebagai notifikasi/pengingat tagihan pelanggan. - Audiobook
Teknologi TTS dapat mengotomasi pembacaan audiobook dengan hasil sintesis ucapan yang ramah, natural seperti manusia. - Alat Bantu Disabilitas
Teknologi ini bahkan bisa dimanfaatkan sebagai alat bantu bagi penderita disabilitas netra. Misalnya di dunia pendidikan, TTS akan membacakan soal yang akan memudahkan siswa penyandang disabilitas untuk melakukan pengerjaan.
Sekedar ulasan mengenai teknologi Text to Speech tentu tidak akan memuaskan, sehingga kamu harus mencoba memanfaatkan teknologi ini sendiri. Oleh karenanya Widya Wicara Prima mengembangkan teknologi Text to Speech Widya Wicara dengan output natural seperti manusia. Kamu wajib coba!