Pengikut

Minggu, 07 November 2010

Speech Synthesis

Pidato sintesis adalah produksi buatan ucapan manusia. Sebuah sistem komputer yang digunakan untuk tujuan ini disebut synthesizer pidato, dan dapat diimplementasikan dalam perangkat lunak atau perangkat keras. Sebuah teks-to-speech (TTS) sistem mengkonversi teks ke dalam pidato bahasa normal;. Sistem lain membuat representasi linguistik simbolik seperti transkripsi fonetik dalam pidato
pidato disintesis dapat dibuat dengan menggabungkan potongan pidato direkam yang disimpan dalam database. Sistem berbeda dalam ukuran unit pidato disimpan, sebuah sistem yang menyimpan telepon atau diphones menyediakan berbagai keluaran terbesar, tapi mungkin kurang jelas. Untuk domain penggunaan khusus, penyimpanan seluruh kata-kata atau kalimat memungkinkan untuk output berkualitas tinggi. Atau, synthesizer dapat menggabungkan model saluran vokal dan karakteristik suara manusia untuk membuat yang benar-benar "sintetik" output suara.

Kualitas synthesizer pidato dinilai oleh kesamaannya dengan suara manusia dan dengan kemampuannya untuk dipahami. Sebuah program text-to-speech dipahami memungkinkan orang dengan gangguan visual atau membaca cacat untuk mendengarkan karya tulis di komputer rumah. Banyak komputer operasi telah menyertakan synthesizer pidato sejak awal 1980-an..

Teknologi synthesizer

Kualitas yang paling penting dari sebuah sistem sintesis pidato yang alamiah dan dimengerti. Kealamian menggambarkan seberapa dekat output suara seperti ucapan manusia, sedangkan dimengerti adalah kemudahan dengan yang output dipahami.Synthesizer pidato yang ideal adalah baik alam dan dimengerti. sistem sintesis Pidato biasanya mencoba untuk memaksimalkan kedua karakteristik.
Dua teknologi utama untuk menghasilkan bentuk gelombang pidato sintetis dan sintesis sintesis concatenative forman. Setiap teknologi memiliki kekuatan dan kelemahan, dan menggunakan dimaksud sistem sintesis biasanya akan menentukan pendekatan mana yang digunakan.

Forman sintesis

sintesis forman tidak menggunakan sampel suara manusia pada saat runtime.Sebaliknya, keluaran suara sintesis dibuat menggunakan aditif sintesis dan model akustik (sintesis pemodelan fisik) [23] Parameter seperti frekuensi fundamental, menyuarakan,. Dan tingkat kebisingan yang bervariasi dari waktu ke waktu untuk membuat gelombang pidato buatan. Metode ini kadang-kadang disebut sintesis berbasis peraturan, namun sistem concatenative banyak juga memiliki komponen aturan berbasis. Banyak sistem yang didasarkan pada teknologi sintesis forman menghasilkan buatan, robot yang terdengar pidato yang tidak akan pernah salah untuk pidato manusia. Namun, kealamian maksimum tidak selalu tujuan sistem sintesis pidato, dan sistem sintesis forman memiliki keunggulan dibandingkan sistem concatenative. pidato forman-disintesis dapat diandalkan dimengerti, bahkan pada kecepatan yang sangat tinggi, menghindari Glitches akustik yang biasanya wabah sistem concatenative. pidato disintesis kecepatan tinggi digunakan oleh tunanetra untuk navigasi cepat komputer menggunakan pembaca layar. synthesizer forman adalah program biasanya lebih kecil dibandingkan dengan sistem concatenative karena mereka tidak memiliki database contoh pidato. Oleh karena itu mereka dapat digunakan dalam embedded system, di mana memori dan daya mikroprosesor sangat terbatas. Karena sistem forman berbasis memiliki kontrol penuh dari semua aspek pidato output, berbagai prosodies dan intonasi dapat menjadi output, tidak hanya menyampaikan pertanyaan dan pernyataan, tetapi berbagai emosi dan nada suara.
Contoh non-real time-tetapi sangat akurat kontrol intonasi dalam sintesis forman meliputi pekerjaan yang dilakukan pada akhir tahun 1970 untuk mainan Texas Instruments Speak & Spell, dan pada tahun 1980 mesin awal arcade Sega. [24] dan dalam banyak Atari, Inc arcade games. [25] dengan menggunakan LPC TMS5220 Chips. Menciptakan intonasi yang tepat untuk proyek ini adalah telaten, dan hasilnya masih harus dicocokkan dengan interface real-time text-to-speech. [26].

Jadi, kesimpunnya adalah suatu system yang dapat mengubah suara manusia menjadi sebuah text yang dapat di baca. Misalnya ada seseorang yang sedang berpidato kemudian pidato yang sedang dibacakan itu direkam oleh seseorang, kemudian rekaman itu di masukan ke dalam sebuah system yang dapat mengubahnya kedalam sebuah text dokumen.

Sumber : http://en.wikipedia.org/wiki/Speech_synthesis

Tidak ada komentar:

Posting Komentar