TELEMATICS SERVICE
Yang saya harapkan dari adanya Telematika Service ini adalah memberikan sebuah layanan untuk masyarakat. Banyak yang dapat dilakukan pada bidang telematika service ini contohnya adalah Layanan di bidang informasi, layanan di bidang keamanan, dan layanan context aware. Layanan-layanan tersebut adalah kebijakan dari pemerintah yang berdasarkan dari Intruksi Presiden Republik Indonesia (Inpres) nomor 6 tahun 2001, dan isinya adalah sebagai berikut :
1. Layanan Telematika dibidang Informasi
Penggunaan teknologi telematika dan aliran informasi harus selalu ditujukan untuk meningkatkan kesejahteraan masyarakat, termasuk pemberantasan kemiksinan dan kesenjangan, serta meningkatkan kualitas hidup masyarakat. Selain itu, teknologi telematika juga harus diarahkan untuk menjembatani kesenjangan politik dan budaya serta meningkatkan keharmonisan di kalangan masyarakat
Wartel dan Warnet memainkan peranan penting dalam masyarakat. Warung Telekomunikasi dan Warung Internet ini secara berkelanjutan memperluas jangkauan pelayanan telepon dan internet, baik di daerah kota maupun desa, bagi pelanggan yang tidak memiliki akses sendiri di tempat tinggal atau di tempat kerjanya. Oleh karena itu langkah-langkah lebih lanjut untuk mendorong pertumbuhan jangkauan dan kandungan informasi pelayanan publik, memperluas pelayanan kesehatan dan pendidikan, mengembangkan sentra-sentra pelayanan masyarakat perkotaan dan pedesaan, serta menyediakan layanan "e-commerce" bagi usaha kecil dan menengah, sangat diperlukan. Dengan demikian akan terbentuk Balai-balai Informasi. Untuk melayani lokasi-lokasi yang tidak terjangkau oleh masyarakat.
2. Layanan Telematika di bidang Keamanan
Layanan telematika juga dimanfaatkan pada sector-sektor keamanan seperti yang sudah dijalankan oleh Polda Jatim yang memanfaatkan TI dalam rangka meningkatkan pelayanan keamanan terhadap masyarakat. Kira-kira sejak 2007 lalu, membuka layanan pengaduan atau laporan dari masyarakat melalui SMS dengan kode akses 1120. Selain itu juga telah dilaksanakan sistem online untuk pelayanan di bidang Lalu Lintas. Polda Jatim memiliki website di http://www.jatim.polri.go.id, untuk bisa melayani masyarakat melalui internet. Hingga kini masih terus dikembangkan agar dapat secara maksimal melayani masyarakat. Bahkan Badan Reserse dan Kriminal (Bareskrim) Polda Jatim sudah banyak memanfaatkan fasilitas website ini dan sangat bermanfaat dalam menangani kasus-kasus yang sedang terjadi dan lebih mudah dalam memantau setiap perkembangan kasus atau laporan, baik laporan dari masyarakat maupun laporan internal untuk Polda Jatim sendiri. Bukan hanya penanganan kasus kejahatan semata, tapi juga termasuk laporan terkait lalu lintas, intelijen, tindak pidana ringan (tipiring) di masyarakat, pengamanan untuk pemilu, termasuk laporan bencana alam. Masyarakat juga bisa menyampaikan uneg-uneg atau opini mengenai perilaku dan layanan dari aparat kepolisian melalui email atau website . Semoga saja daerah-daerah lainnya yang tersebar diseluruh Indonesia dapat memanfaatkan teknologi telematika seperti halnya Polda Jatim agar terciptanya negara Indonesia yang aman serta disiplin.
Indonesia perlu menciptakan suatu lingkungan legislasi dan peraturan perundang-undangan.Upaya ini mencakup perumusan produk-produk hukum baru di bidang telematika (cyber law) yang mengatur keabsahan dokumen elektronik, tanda tangan digital, pembayaran secara elektronik, otoritas sertifikasi, kerahasiaan, dan keamanan pemakai layanan pemakai layanan jaringan informasi. Di samping itu, diperlukan pula penyesuaian berbagai peraturan perundang-undangan yang telah ada, seperti mengatur HKI, perpajakan dan bea cukai, persaingan usaha, perlindungan konsumen, tindakan pidana, dan penyelesaian sengketa. Pembaruan perauran perundang-udangan tersebut dibutuhkan untuk memberikan arah yang jelas, transparan, objektif, tidak diskriminatif, proporsional, fleksibel, serta selaras dengan dunia internasional dan tidak bias pada teknologi tertentu. Pembaruan itu juga diperlukan untuk membentuk ketahanan dalam menghadapi berbagai bentuk ancaman dan kejahatan baru yang timbul sejalan dengan perkembangan telematika.
3. Layanan Context Aware dan Event-Based
Di dalam ilmu komputer menyatakan bahwa perangkat komputer memiliki kepekaan dan dapat bereaksi terhadap lingkungan sekitarnya berdasarkan informasi dan aturan-aturan tertentu yang tersimpan di dalam perangkat. Gagasan inilah yang diperkenalkan oleh Schilit pada tahun 1994 dengan istilah context-awareness. Context-awareness adalah kemampuan layanan network untuk mengetahui berbagai konteks, yaitu kumpulan parameter yang relevan dari pengguna (user) dan penggunaan network itu, serta memberikan layanan yang sesuai dengan parameter-parameter itu. Beberapa konteks yang dapat digunakan antara lain lokasi user, data dasar user, berbagai preferensi user, jenis dan kemampuan terminal yang digunakan user. Sebagai contoh : ketika seorang user sedang mengadakan rapat, maka context-aware mobile phone yang dimiliki user akan langsung menyimpulkan bahwa user sedang mengadakan rapat dan akan menolak seluruh panggilan telepon yang tidak penting. Dan untuk saat ini, konteks location awareness dan activity recognition yang merupakan bagian dari context-awareness menjadi pembahasan utama di bidang penelitian ilmu komputer.
Tiga hal yang menjadi perhatian sistem context-aware menurut Albrecht Schmidt, yaitu:
1. The acquisition of context
Hal ini berkaitan dengan pemilihan konteks dan bagaimana cara memperoleh konteks yang diinginkan, sebagai contoh : pemilihan konteks lokasi, dengan penggunaan suatu sensor lokasi tertentu (misalnya: GPS) untuk melihat situasi atau posisi suatu lokasi tersebut.
2. The abstraction and understanding of context
Pemahaman terhadap bagaimana cara konteks yang dipilih berhubungan dengan kondisi nyata, bagaimana informasi yang dimiliki suatu konteks dapat membantu meningkatkan kinerja aplikasi, dan bagaimana tanggapan sistem dan cara kerja terhadap inputan dalam suatu konteks.
3. Application behaviour based on the recognized context
Terakhir, dua hal yang paling penting adalah bagaimana pengguna dapat memahami sistem dan tingkah lakunya yang sesuai dengan konteks yang dimilikinya serta bagaimana caranya memberikan kontrol penuh kepada pengguna terhadap sistem.
Pengikut
Minggu, 28 November 2010
Sistem Context-Aware
Layanan Context Aware dan Event-Based
Di dalam ilmu komputer menyatakan bahwa perangkat komputer memiliki kepekaan dan dapat bereaksi terhadap lingkungan sekitarnya berdasarkan informasi dan aturan-aturan tertentu yang tersimpan di dalam perangkat. Gagasan inilah yang diperkenalkan oleh Schilit pada tahun 1994 dengan istilah context-awareness. Context-awareness adalah kemampuan layanan network untuk mengetahui berbagai konteks, yaitu kumpulan parameter yang relevan dari pengguna (user) dan penggunaan network itu, serta memberikan layanan yang sesuai dengan parameter-parameter itu. Beberapa konteks yang dapat digunakan antara lain lokasi user, data dasar user, berbagai preferensi user, jenis dan kemampuan terminal yang digunakan user. Sebagai contoh : ketika seorang user sedang mengadakan rapat, maka context-aware mobile phone yang dimiliki user akan langsung menyimpulkan bahwa user sedang mengadakan rapat dan akan menolak seluruh panggilan telepon yang tidak penting. Dan untuk saat ini, konteks location awareness dan activity recognition yang merupakan bagian dari context-awareness menjadi pembahasan utama di bidang penelitian ilmu komputer.
Tiga hal yang menjadi perhatian sistem context-aware menurut Albrecht Schmidt, yaitu:
1. The acquisition of context
Hal ini berkaitan dengan pemilihan konteks dan bagaimana cara memperoleh konteks yang diinginkan, sebagai contoh : pemilihan konteks lokasi, dengan penggunaan suatu sensor lokasi tertentu (misalnya: GPS) untuk melihat situasi atau posisi suatu lokasi tersebut.
2. The abstraction and understanding of context
Pemahaman terhadap bagaimana cara konteks yang dipilih berhubungan dengan kondisi nyata, bagaimana informasi yang dimiliki suatu konteks dapat membantu meningkatkan kinerja aplikasi, dan bagaimana tanggapan sistem dan cara kerja terhadap inputan dalam suatu konteks.
3. Application behaviour based on the recognized context
Terakhir, dua hal yang paling penting adalah bagaimana pengguna dapat memahami sistem dan tingkah lakunya yang sesuai dengan konteks yang dimilikinya serta bagaimana caranya memberikan kontrol penuh kepada pengguna terhadap sistem.
Sumber :http://mala06-telematika-telematika.blogspot.com/2009/12/layanan-telematika.html
Di dalam ilmu komputer menyatakan bahwa perangkat komputer memiliki kepekaan dan dapat bereaksi terhadap lingkungan sekitarnya berdasarkan informasi dan aturan-aturan tertentu yang tersimpan di dalam perangkat. Gagasan inilah yang diperkenalkan oleh Schilit pada tahun 1994 dengan istilah context-awareness. Context-awareness adalah kemampuan layanan network untuk mengetahui berbagai konteks, yaitu kumpulan parameter yang relevan dari pengguna (user) dan penggunaan network itu, serta memberikan layanan yang sesuai dengan parameter-parameter itu. Beberapa konteks yang dapat digunakan antara lain lokasi user, data dasar user, berbagai preferensi user, jenis dan kemampuan terminal yang digunakan user. Sebagai contoh : ketika seorang user sedang mengadakan rapat, maka context-aware mobile phone yang dimiliki user akan langsung menyimpulkan bahwa user sedang mengadakan rapat dan akan menolak seluruh panggilan telepon yang tidak penting. Dan untuk saat ini, konteks location awareness dan activity recognition yang merupakan bagian dari context-awareness menjadi pembahasan utama di bidang penelitian ilmu komputer.
Tiga hal yang menjadi perhatian sistem context-aware menurut Albrecht Schmidt, yaitu:
1. The acquisition of context
Hal ini berkaitan dengan pemilihan konteks dan bagaimana cara memperoleh konteks yang diinginkan, sebagai contoh : pemilihan konteks lokasi, dengan penggunaan suatu sensor lokasi tertentu (misalnya: GPS) untuk melihat situasi atau posisi suatu lokasi tersebut.
2. The abstraction and understanding of context
Pemahaman terhadap bagaimana cara konteks yang dipilih berhubungan dengan kondisi nyata, bagaimana informasi yang dimiliki suatu konteks dapat membantu meningkatkan kinerja aplikasi, dan bagaimana tanggapan sistem dan cara kerja terhadap inputan dalam suatu konteks.
3. Application behaviour based on the recognized context
Terakhir, dua hal yang paling penting adalah bagaimana pengguna dapat memahami sistem dan tingkah lakunya yang sesuai dengan konteks yang dimilikinya serta bagaimana caranya memberikan kontrol penuh kepada pengguna terhadap sistem.
Sumber :http://mala06-telematika-telematika.blogspot.com/2009/12/layanan-telematika.html
Lingkungan Komputasi
Lingkungan komputasi adalah suatu lingkungan di mana sistem komputer digunakan. Lingkungan komputasi dapat dikelompokkan menjadi empat jenis : komputasi tradisional, komputasi berbasis jaringan, dan komputasi embedded, serta komputasi gri.
Pada awalnya komputasi tradisional hanya meliputi penggunaan komputer meja (desktop) untuk pemakaian pribadi di kantor atau di rumah. Namun, seiring dengan perkembangan teknologi maka komputasi tradisional sekarang sudah meliputi penggunaan teknologi jaringan yang diterapkan mulai dari desktop hingga sistem genggam. Perubahan yang begitu drastis ini membuat batas antara komputasi tradisional dan komputasi berbasis jaringan sudah tidak jelas lagi.
Komputasi berbasis jaringan menyediakan fasilitas pengaksesan data yang luas oleh berbagai perangkat elektronik. Akses tersedia asalkan perangkat elektronik itu terhubung dalam jaringan, baik dengan kabel maupun nirkabel.
Komputasi model terbaru ini juga berbasis jaringan dengan clustered system . Digunakan super computer untuk melakukan komputasinya. Pada model ini komputasi dikembangkan melalui pc-farm . Perbedaan yang nyata dengan komputasi berbasis jaringan adalah bahwa komputasi berbasis grid dilakukan bersama-sama seperti sebuah multiprocessor dan tidak hanya melakukan pertukaran data seperti pada komputasi berbasis jaringan.
lingkungan komputasi itu sendiri bisa diklasifikasikan berdasarkan cara data dan instruksi programnya dihubungkan yang terdiri atas empat kategori berikut ini:
1.Single instruction stream-single data stream (SISD), terdapat satu prosesor dan biasa juga disebut komputer sekuensial, contohnya komputer model van Neumann.
2.Single instruction stream-multiple data stream (SIMD), terdapat sejumlah prosesor dan aliran data, tetapi hanya memiliki satu instruksi/program. Setiap prosesor memiliki memori lokal dan duplikasi program yang sama sehingga masing-masing prosesor akan mengeksekusi instruksi/program yang sama, tetapi pada data yang berbeda dan prosesor bekerja secara sinkron sehingga mendukung paralelisasi pada proses komputasi data.
3.Multiple instruction stream-single data stream (MISD), terdapat sejumlah prosesor, kontrol unit dan aliran instruksi tetapi hanya memiliki satu aliran data. Data yang ada di common memory akan dimanipulasi secara bersamaan oleh semua prosesor, akibatnya akan terjadi kendala jika sejumlah prosesor melakukan update data sedangkan data yang lama masih dibutuhkan oleh sejumlah prosesor lainnya. Sampai saat ini belum ada implementasi mesin komputer yang memenuhi kategori ini.
4.Multiple instruction stream-multiple data stream (MIMD), terdapat sejumlah prosesor, aliran instruksi dan aliran data. Setiap prosesor memiliki kontrol unit, memori lokal serta memori bersama (shared memory) yang mendukung proses paralelisasi dari sisi data dan instruksi. Prosesor dapat bekerja sesuai dengan instruksi program yang berbeda dan pada data yang berbeda. Prosesor juga dapat bekerja secara asinkron.
Tuilsan ini diambil dari sebuah situs di dunia maya.
Pada awalnya komputasi tradisional hanya meliputi penggunaan komputer meja (desktop) untuk pemakaian pribadi di kantor atau di rumah. Namun, seiring dengan perkembangan teknologi maka komputasi tradisional sekarang sudah meliputi penggunaan teknologi jaringan yang diterapkan mulai dari desktop hingga sistem genggam. Perubahan yang begitu drastis ini membuat batas antara komputasi tradisional dan komputasi berbasis jaringan sudah tidak jelas lagi.
Komputasi berbasis jaringan menyediakan fasilitas pengaksesan data yang luas oleh berbagai perangkat elektronik. Akses tersedia asalkan perangkat elektronik itu terhubung dalam jaringan, baik dengan kabel maupun nirkabel.
Komputasi model terbaru ini juga berbasis jaringan dengan clustered system . Digunakan super computer untuk melakukan komputasinya. Pada model ini komputasi dikembangkan melalui pc-farm . Perbedaan yang nyata dengan komputasi berbasis jaringan adalah bahwa komputasi berbasis grid dilakukan bersama-sama seperti sebuah multiprocessor dan tidak hanya melakukan pertukaran data seperti pada komputasi berbasis jaringan.
lingkungan komputasi itu sendiri bisa diklasifikasikan berdasarkan cara data dan instruksi programnya dihubungkan yang terdiri atas empat kategori berikut ini:
1.Single instruction stream-single data stream (SISD), terdapat satu prosesor dan biasa juga disebut komputer sekuensial, contohnya komputer model van Neumann.
2.Single instruction stream-multiple data stream (SIMD), terdapat sejumlah prosesor dan aliran data, tetapi hanya memiliki satu instruksi/program. Setiap prosesor memiliki memori lokal dan duplikasi program yang sama sehingga masing-masing prosesor akan mengeksekusi instruksi/program yang sama, tetapi pada data yang berbeda dan prosesor bekerja secara sinkron sehingga mendukung paralelisasi pada proses komputasi data.
3.Multiple instruction stream-single data stream (MISD), terdapat sejumlah prosesor, kontrol unit dan aliran instruksi tetapi hanya memiliki satu aliran data. Data yang ada di common memory akan dimanipulasi secara bersamaan oleh semua prosesor, akibatnya akan terjadi kendala jika sejumlah prosesor melakukan update data sedangkan data yang lama masih dibutuhkan oleh sejumlah prosesor lainnya. Sampai saat ini belum ada implementasi mesin komputer yang memenuhi kategori ini.
4.Multiple instruction stream-multiple data stream (MIMD), terdapat sejumlah prosesor, aliran instruksi dan aliran data. Setiap prosesor memiliki kontrol unit, memori lokal serta memori bersama (shared memory) yang mendukung proses paralelisasi dari sisi data dan instruksi. Prosesor dapat bekerja sesuai dengan instruksi program yang berbeda dan pada data yang berbeda. Prosesor juga dapat bekerja secara asinkron.
Tuilsan ini diambil dari sebuah situs di dunia maya.
MANAJEMEN DATA TELEMATIKA
MANAJEMEN DATA TELEMATIKA
Telemetri adalah suatu teknologi yang memungkinkan pengukuran terpencil dan pelaporan informasi . Kata ini berasal dari bahasa Yunani akar = remote tele, dan metron = ukuran.Sistem yang memerlukan petunjuk eksternal dan data untuk mengoperasikan memerlukan mitra telemetri, telekomando .
Meskipun istilah yang biasa merujuk pada nirkabel mentransfer data mekanisme (misalnya menggunakan radio atau inframerah sistem), juga mencakup data yang ditransfer melalui media lain, seperti telepon atau jaringan komputer, link kabel optik atau komunikasi lainnya. Selain itu, ini biasa digunakan dalam "Dewan Hoki" untuk menggambarkan tembakan yang solid. Banyak sistem telemetri modern mengambil keuntungan dari biaya rendah dan ubiquity of GSM jaringan dengan menggunakan SMS untuk menerima dan mengirimkan data telemetri.
Aplikasi :
Balap Mobil
Telemetri telah menjadi faktor kunci dalam balap motor modern. Pertama kali dikembangkan di Australia oleh Engineer & pengemudi mobil balap, James Horley pada tahun 1987. Horley mengembangkan 'Modem Racing' dalam hubungannya dengan sponsornya Netcomm Australia.Terobosan ini memungkinkan kru pit untuk memantau ECU mobil dan suhu ban bahkan memanfaatkan array sensor, pengumpul data dan link radio. menggunakan pertama di dunia telemetri dalam olahraga motor selama Castrol 500 di Melbourne Sandown Raceway sebagai bagian dari kejuaraan Australia di mana Horley berhasil diuji dan berlari Grup A Nissan Turbo ke posisi 5. Horley melanjutkan untuk mengembangkan sebuah versi dari transmisi data khusus untuk televisi, di mana panel instrumen mobil bisa ditampilkan selama siaran TV. Inisiatif ini pertama kali digunakan oleh 7 jaringan Australia selama World Touring Car Championship di Bathurst 1000 pada tahun 1987 dan sekarang digunakan oleh banyak penyiar cakupan berbagai motorsport di seluruh dunia. [4]
Telemetri memungkinkan para insinyur lomba untuk menafsirkan sejumlah besar data yang dikumpulkan selama tes atau ras, dan menggunakannya untuk benar lagu mobil untuk kinerja yang optimal. Sistem yang digunakan di beberapa seri, yaitu Formula Satu , telah menjadi maju ke titik di mana waktu putaran potensi mobil dapat dihitung dan ini adalah apa pengemudi diharapkan untuk bertemu. Beberapa contoh pengukuran yang berguna pada sebuah mobil balap termasuk percepatan (G angkatan) dalam 3 sumbu, pembacaan suhu, kecepatan roda, dan perpindahan dari suspensi. Dalam Formula 1, masukan driver juga dicatat sehingga tim dapat menilai kinerja pengemudi dan, dalam kasus kecelakaan, FIA dapat menentukan atau mengesampingkan kesalahan driver sebagai kemungkinan penyebab.
Akhir perkembangan telemetri melihat dua arah, yang memungkinkan para insinyur kemampuan untuk memperbarui kalibrasi pada mobil secara real time, mungkin ketika sedang keluar di trek. Dalam Formula 1, dua-arah telemetri muncul di awal tahun sembilan puluhan dari elektronik TAG, dan terdiri dari tampilan pesan pada dashboard tim mana yang bisa update.pengembangannya berlanjut sampai Mei 2001, di mana titik itu pertama yang diizinkan pada mobil. Pada tahun 2002 tim mampu mengubah pemetaan mesin dan menonaktifkan sensor mesin tertentu dari lubang-lubang sementara mobil berada di jalur. [ rujukan? ] Untuk musim 2003, FIA dilarang telemetri dua arah dari Formula 1, [ rujukan? ] Namun teknologi masih ada dan akhirnya bisa menemukan jalan ke dalam bentuk-bentuk lain dari mobil balap atau jalan.
Selain telemetri yang juga telah diterapkan pada penggunaan balap Yacht. [ klarifikasi diperlukan Untuk apa? Oleh siapa?] Teknologi yang diterapkan pada Oracle AS-76. [ rujukan? ]
Pertanian
Kebanyakan kegiatan yang berkaitan dengan tanaman sehat dan hasil yang baik tergantung pada ketersediaan data tepat waktu cuaca dan tanah. Oleh karena itu, stasiun cuaca nirkabel memainkan peran penting dalam pencegahan penyakit dan irigasi presisi. Stasiun-stasiun ini mengirimkan parameter utama yang dibutuhkan untuk keputusan yang baik dengan stasiun pangkalan: suhu udara dan kelembaban relatif , curah hujan dan basah daun (untuk model prediksi penyakit), radiasi matahari dan kecepatan angin (untuk menghitungevapotranspirasi ), dan kadang-kadang juga kelembaban tanah, penting untuk memahami kemajuan air ke dalam tanah dan akar untuk keputusan irigasi.
Karena iklim mikro lokal dapat bervariasi secara signifikan, data tersebut perlu datang dari kanan dalam tanaman. Pemantauan stasiun biasanya mengirimkan data kembali oleh terestrialradio meskipun kadang-kadang satelit sistem yang digunakan. Tenaga surya sering digunakan untuk membuat stasiun independen dari infrastruktur lokal.
Manajemen Air
Telemetri telah menjadi sangat diperlukan untuk aplikasi pengelolaan air, termasuk kualitas air dan sungai mengukur fungsi. aplikasi utama meliputi AMR ( pembacaan meter otomatis ),air tanah monitoring, deteksi kebocoran di pipa distribusi dan pengawasan peralatan. Setelah data yang tersedia dalam waktu hampir nyata memungkinkan reaksi cepat ke kejadian di lapangan.
Pertahanan, ruang dan eksplorasi sumber daya sistem
Telemetri adalah teknologi yang memungkinkan untuk sistem yang kompleks besar seperti rudal, RPVs, pesawat ruang angkasa , rig minyak dan pabrik kimia karena memungkinkan pemantauan otomatis, peringatan, dan pencatatan yang diperlukan untuk aman, operasi efisien. Space lembaga seperti NASA , ESA , dan lembaga lainnya menggunakan telemetri / sistem telekomando untuk mengumpulkan data dari operasi pesawat ruang angkasa dan satelit.
Telemetri sangat penting dalam tahap pengembangan rudal, satelit dan pesawat karena sistem akan hancur setelah / selama pengujian. Insinyur perlu parameter sistem kritis untuk menganalisis (dan meningkatkan) kinerja sistem. Tanpa telemetri, data ini sering tidak tersedia.
Rocketry
Dalam peroketan, peralatan telemetri merupakan bagian integral dari jangkauan roket aset yang digunakan untuk memantau kemajuan suatu peluncuran roket . Beberapa masalah khusus lingkungan yang ekstrim (suhu, percepatan, getaran ...), yang pasokan energi , yaitu alignment tepat dari antena dan (pada jarak yang panjang, misalnya di spaceflight ) sinyalwaktu perjalanan .
Musuh kecerdasan
Telemetri adalah sumber intelijen yang penting bagi AS dan Inggris ketika Soviet rudal yang diuji. Untuk tujuan ini, AS mengoperasikan pos pendengar di Iran . Akhirnya, Rusia menemukan semacam ini pengumpulan intelijen AS dan terenkripsi telemetri mereka sinyal tes rudal. Telemetri adalah sumber vital bagi Soviet yang akan beroperasi mendengarkan kapal di Teluk Cardigan untuk menguping pada tes rudal Inggris dilakukan di luar sana.
Pemantauan Energi
Di pabrik-pabrik, bangunan, dan rumah-rumah, konsumsi energi sistem seperti HVAC dipantau di beberapa lokasi, bersama dengan parameter yang terkait (misalnya suhu) melalui telemetri nirkabel untuk satu lokasi sentral. Informasi ini dikumpulkan dan diproses memungkinkan keputusan cerdas tentang penggunaan energi yang paling efisien untuk dilaksanakan.Sistem tersebut juga memfasilitasi perawatan prediktif .
Sumber Daya distribusi
Banyak sumber daya yang harus didistribusikan di wilayah yang luas. Telemetri sangat penting dalam kasus ini, karena memungkinkan sistem untuk menyalurkan sumber daya untuk tempat yang membutuhkannya.
Kedokteran
Telemetri juga digunakan untuk pasien ( biotelemetry ) yang beresiko abnormal jantung aktivitas, umumnya di unit perawatan koroner . pasien tersebut dilengkapi dengan mengukur, merekam dan perangkat transmisi. Log data dapat berguna dalam diagnosis dari pasien kondisi tersebut dengan dokter . Fungsi sinyal dapat mengingatkan perawat jika pasien menderita dari atau berbahaya kondisi akut.
Juga sistem yang tersedia dalam perawatan medis-bedah untuk memantau kondisi dimana kondisi jantung mungkin dikesampingkan. Atau untuk memantau respon terhadap obat antiarrhythmic seperti Digoxin .
Jadi, kesimpulan yang saya dapat ambil adalah manajemen data telematika aplikasinya dapat berguna dalam berbagai bidang pekerjaan.
Sumber : http://en.wikipedia.org/wiki/Telemetry
Telemetri adalah suatu teknologi yang memungkinkan pengukuran terpencil dan pelaporan informasi . Kata ini berasal dari bahasa Yunani akar = remote tele, dan metron = ukuran.Sistem yang memerlukan petunjuk eksternal dan data untuk mengoperasikan memerlukan mitra telemetri, telekomando .
Meskipun istilah yang biasa merujuk pada nirkabel mentransfer data mekanisme (misalnya menggunakan radio atau inframerah sistem), juga mencakup data yang ditransfer melalui media lain, seperti telepon atau jaringan komputer, link kabel optik atau komunikasi lainnya. Selain itu, ini biasa digunakan dalam "Dewan Hoki" untuk menggambarkan tembakan yang solid. Banyak sistem telemetri modern mengambil keuntungan dari biaya rendah dan ubiquity of GSM jaringan dengan menggunakan SMS untuk menerima dan mengirimkan data telemetri.
Aplikasi :
Balap Mobil
Telemetri telah menjadi faktor kunci dalam balap motor modern. Pertama kali dikembangkan di Australia oleh Engineer & pengemudi mobil balap, James Horley pada tahun 1987. Horley mengembangkan 'Modem Racing' dalam hubungannya dengan sponsornya Netcomm Australia.Terobosan ini memungkinkan kru pit untuk memantau ECU mobil dan suhu ban bahkan memanfaatkan array sensor, pengumpul data dan link radio. menggunakan pertama di dunia telemetri dalam olahraga motor selama Castrol 500 di Melbourne Sandown Raceway sebagai bagian dari kejuaraan Australia di mana Horley berhasil diuji dan berlari Grup A Nissan Turbo ke posisi 5. Horley melanjutkan untuk mengembangkan sebuah versi dari transmisi data khusus untuk televisi, di mana panel instrumen mobil bisa ditampilkan selama siaran TV. Inisiatif ini pertama kali digunakan oleh 7 jaringan Australia selama World Touring Car Championship di Bathurst 1000 pada tahun 1987 dan sekarang digunakan oleh banyak penyiar cakupan berbagai motorsport di seluruh dunia. [4]
Telemetri memungkinkan para insinyur lomba untuk menafsirkan sejumlah besar data yang dikumpulkan selama tes atau ras, dan menggunakannya untuk benar lagu mobil untuk kinerja yang optimal. Sistem yang digunakan di beberapa seri, yaitu Formula Satu , telah menjadi maju ke titik di mana waktu putaran potensi mobil dapat dihitung dan ini adalah apa pengemudi diharapkan untuk bertemu. Beberapa contoh pengukuran yang berguna pada sebuah mobil balap termasuk percepatan (G angkatan) dalam 3 sumbu, pembacaan suhu, kecepatan roda, dan perpindahan dari suspensi. Dalam Formula 1, masukan driver juga dicatat sehingga tim dapat menilai kinerja pengemudi dan, dalam kasus kecelakaan, FIA dapat menentukan atau mengesampingkan kesalahan driver sebagai kemungkinan penyebab.
Akhir perkembangan telemetri melihat dua arah, yang memungkinkan para insinyur kemampuan untuk memperbarui kalibrasi pada mobil secara real time, mungkin ketika sedang keluar di trek. Dalam Formula 1, dua-arah telemetri muncul di awal tahun sembilan puluhan dari elektronik TAG, dan terdiri dari tampilan pesan pada dashboard tim mana yang bisa update.pengembangannya berlanjut sampai Mei 2001, di mana titik itu pertama yang diizinkan pada mobil. Pada tahun 2002 tim mampu mengubah pemetaan mesin dan menonaktifkan sensor mesin tertentu dari lubang-lubang sementara mobil berada di jalur. [ rujukan? ] Untuk musim 2003, FIA dilarang telemetri dua arah dari Formula 1, [ rujukan? ] Namun teknologi masih ada dan akhirnya bisa menemukan jalan ke dalam bentuk-bentuk lain dari mobil balap atau jalan.
Selain telemetri yang juga telah diterapkan pada penggunaan balap Yacht. [ klarifikasi diperlukan Untuk apa? Oleh siapa?] Teknologi yang diterapkan pada Oracle AS-76. [ rujukan? ]
Pertanian
Kebanyakan kegiatan yang berkaitan dengan tanaman sehat dan hasil yang baik tergantung pada ketersediaan data tepat waktu cuaca dan tanah. Oleh karena itu, stasiun cuaca nirkabel memainkan peran penting dalam pencegahan penyakit dan irigasi presisi. Stasiun-stasiun ini mengirimkan parameter utama yang dibutuhkan untuk keputusan yang baik dengan stasiun pangkalan: suhu udara dan kelembaban relatif , curah hujan dan basah daun (untuk model prediksi penyakit), radiasi matahari dan kecepatan angin (untuk menghitungevapotranspirasi ), dan kadang-kadang juga kelembaban tanah, penting untuk memahami kemajuan air ke dalam tanah dan akar untuk keputusan irigasi.
Karena iklim mikro lokal dapat bervariasi secara signifikan, data tersebut perlu datang dari kanan dalam tanaman. Pemantauan stasiun biasanya mengirimkan data kembali oleh terestrialradio meskipun kadang-kadang satelit sistem yang digunakan. Tenaga surya sering digunakan untuk membuat stasiun independen dari infrastruktur lokal.
Manajemen Air
Telemetri telah menjadi sangat diperlukan untuk aplikasi pengelolaan air, termasuk kualitas air dan sungai mengukur fungsi. aplikasi utama meliputi AMR ( pembacaan meter otomatis ),air tanah monitoring, deteksi kebocoran di pipa distribusi dan pengawasan peralatan. Setelah data yang tersedia dalam waktu hampir nyata memungkinkan reaksi cepat ke kejadian di lapangan.
Pertahanan, ruang dan eksplorasi sumber daya sistem
Telemetri adalah teknologi yang memungkinkan untuk sistem yang kompleks besar seperti rudal, RPVs, pesawat ruang angkasa , rig minyak dan pabrik kimia karena memungkinkan pemantauan otomatis, peringatan, dan pencatatan yang diperlukan untuk aman, operasi efisien. Space lembaga seperti NASA , ESA , dan lembaga lainnya menggunakan telemetri / sistem telekomando untuk mengumpulkan data dari operasi pesawat ruang angkasa dan satelit.
Telemetri sangat penting dalam tahap pengembangan rudal, satelit dan pesawat karena sistem akan hancur setelah / selama pengujian. Insinyur perlu parameter sistem kritis untuk menganalisis (dan meningkatkan) kinerja sistem. Tanpa telemetri, data ini sering tidak tersedia.
Rocketry
Dalam peroketan, peralatan telemetri merupakan bagian integral dari jangkauan roket aset yang digunakan untuk memantau kemajuan suatu peluncuran roket . Beberapa masalah khusus lingkungan yang ekstrim (suhu, percepatan, getaran ...), yang pasokan energi , yaitu alignment tepat dari antena dan (pada jarak yang panjang, misalnya di spaceflight ) sinyalwaktu perjalanan .
Musuh kecerdasan
Telemetri adalah sumber intelijen yang penting bagi AS dan Inggris ketika Soviet rudal yang diuji. Untuk tujuan ini, AS mengoperasikan pos pendengar di Iran . Akhirnya, Rusia menemukan semacam ini pengumpulan intelijen AS dan terenkripsi telemetri mereka sinyal tes rudal. Telemetri adalah sumber vital bagi Soviet yang akan beroperasi mendengarkan kapal di Teluk Cardigan untuk menguping pada tes rudal Inggris dilakukan di luar sana.
Pemantauan Energi
Di pabrik-pabrik, bangunan, dan rumah-rumah, konsumsi energi sistem seperti HVAC dipantau di beberapa lokasi, bersama dengan parameter yang terkait (misalnya suhu) melalui telemetri nirkabel untuk satu lokasi sentral. Informasi ini dikumpulkan dan diproses memungkinkan keputusan cerdas tentang penggunaan energi yang paling efisien untuk dilaksanakan.Sistem tersebut juga memfasilitasi perawatan prediktif .
Sumber Daya distribusi
Banyak sumber daya yang harus didistribusikan di wilayah yang luas. Telemetri sangat penting dalam kasus ini, karena memungkinkan sistem untuk menyalurkan sumber daya untuk tempat yang membutuhkannya.
Kedokteran
Telemetri juga digunakan untuk pasien ( biotelemetry ) yang beresiko abnormal jantung aktivitas, umumnya di unit perawatan koroner . pasien tersebut dilengkapi dengan mengukur, merekam dan perangkat transmisi. Log data dapat berguna dalam diagnosis dari pasien kondisi tersebut dengan dokter . Fungsi sinyal dapat mengingatkan perawat jika pasien menderita dari atau berbahaya kondisi akut.
Juga sistem yang tersedia dalam perawatan medis-bedah untuk memantau kondisi dimana kondisi jantung mungkin dikesampingkan. Atau untuk memantau respon terhadap obat antiarrhythmic seperti Digoxin .
Jadi, kesimpulan yang saya dapat ambil adalah manajemen data telematika aplikasinya dapat berguna dalam berbagai bidang pekerjaan.
Sumber : http://en.wikipedia.org/wiki/Telemetry
Jumat, 26 November 2010
Kebutuhan Middleware
KEBUTUHAN MIDDLEWARE
Middleware platform ke arah terhadap pengembangan
Middleware pasar pada tahun 2005, pasar software, Tahun Baru besar. Dalam situasi pasar perangkat lunak permainan pecah, seperti alat Perang Dunia II awal pengembangan, middleware, ini dipentaskan besar adegan setelah adegan dari drama itu, dapat dikatakan cukup untuk menarik popularitas, menang cukup menangis. Seperti banyak fans gila untuk Tahun Baru sebagai besar, perusahaan perangkat lunak dalam negeri dan asing memiliki semua membungkuk ke pasar middleware, rahmat memesona, adalah semua middleware dan gila. perusahaan perangkat lunak dalam negeri dan asing, tanpa kecuali, untuk menyanyikan pujian dari middleware, harus membangun diri sebagai pemeran utama film ini, tidak sabar untuk mengumumkan salah satu di pemimpin pasar middleware di lapangan, tujuannya adalah sepenuhnya tercermin dalam keuntungan mereka sendiri untuk menciptakan hasil pasar yang bagus, untuk mendapatkan lebih besar mungkin di box office.
Terkenal direktur, portofolio investasi superstar dan astronomi Baru Tahun Bioskop menjamin akses ke pasar efek besar. Middleware tidak terkecuali, perusahaan yang terkenal, tim teknis super deluxe, investasi yang signifikan merupakan jaminan keuntungan bagi pasar. Dengan meningkatnya permintaan untuk integrasi, tidak hanya bisnis kebutuhan middleware integrasi berbagai data, informasi perusahaan integrasi, integrasi aplikasi dan proses integrasi juga tak terpisahkan dari middleware, tujuan ini menyediakan untuk pengembangan middleware kondisi bagus.
Di pasar middleware, asap, 's penuh sesak, pemandangan sangat besar, produsen utama telah indah. IBM mengatakan ia adalah seorang vendor perangkat lunak middleware, Oracle juga mengumumkan bahwa pengiriman pasar middleware yang pertama: Ini adalah dijelaskan dalam perusahaan-perusahaan di middleware oleh tingkat perhatian.
Menurut statistik yang terkait, produk middleware, pasar global pada tahun 2005 masih dipertahankan pertumbuhan yang kuat, dan dalam beberapa tahun ke depan pasar akan produk-produk middleware untuk pertumbuhan lanjutan.
Dengan perusahaan internasional dan produsen dalam negeri terus meningkatkan investasi di bidang middleware, memungkinkan teknologi middleware penelitian dan pengembangan terus memperkuat. Setelah masa perjuangan, pasar database dan pola dasar pasar sistem operasi untuk menstabilkan, untuk sementara waktu tidak akan memiliki kekuatan untuk mematahkan pola ini terjadi, memungkinkan vendor perangkat lunak yang telah membuat perubahan strategis untuk membuka medan perang baru, jadi middleware pasar menjadi medan pertempuran vendor perangkat lunak yang banyak, vendor perangkat lunak memiliki harapan setiap yang di middleware akses pasar untuk mereka sendiri sepertiga dari acre tanah. Ini belanja intens, yang mengarah ke middleware produk dan pasar terus diperkuat dan ditingkatkan.
Selain itu, lokalisasi teknologi middleware, yang membuat pasar middleware dengan produsen asing dalam kompetisi tersebut, meskipun pada posisi yang kurang menguntungkan, tetapi juga akses untuk kelangsungan hidup mereka sendiri dan pengembangan dan pertumbuhan dan, akhirnya, memiliki tempat sendiri di bidang middleware , yang secara bertahap memperoleh tanah. Namun, di pasar middleware, seperti IBM, Oracle, BEA ini perusahaan software terkenal internasional, dengan kekuatan yang besar, tegas untuk dominasi pasar Zhanzhao, adalah yang pertama. Jumlah perusahaan perangkat lunak dalam negeri, seperti Link Timur, pencipta, Pu-yuan, dan hanya dapat memainkan peran pendukung dalam Eselon II.
Informasi perusahaan integrasi, integrasi kebutuhan informasi warisan aset, dan pengembangan SOA dan layanan Web, teknologi middleware telah dibuat di tingkat arsitektur perangkat lunak yang telah secara signifikan diperluas. Saat ini, karena dampak yang dirasakan dari middleware berkembang, telah penambahan untuk sistem operasi, database dan sistem langsung ke pelanggan di luar bagian dari klien yang dikenal sebagai middleware.
Tidak peduli seberapa disebut, tidak peduli bagaimana definisi middleware, kami tidak dapat memberikan jenis unik teknologi middleware? Atau aplikasi? Atau berbagi dua. Selama periode ini melihat kebaikan kebajikan dan kebijaksanaan melihat bijaksana. Pada tahun 2005, jenis middleware bervariasi. Selain sebuah middleware pesan, middleware objek, database, middleware dan jenis middleware tradisional lainnya telah menjadi semakin keluar dari citra lama tingkat murni teknis, mulai beralih ke bisnis-jenis middleware. Saat ini, pengejaran dapat memenuhi aplikasi enterprise, bisa lebih fleksibel sesegera mungkin untuk perusahaan layanan TI, dan telah menjadi ESB, pengembangan komponen middleware berorientasi tujuan penting tersebut.
Lain, platform middleware telah dalam arti kecenderungan pembangunan. Dalam produk middleware sederhana tidak dapat memenuhi kebutuhan bisnis keadaan, middleware platform perangkat lunak telah menjadi sebuah kebutuhan. Middleware akan dapat untuk mencapai pembangunan, penyebaran, operasi, manajemen, integrasi dan integrasi keamanan platform terbuka.
Jadi, menurut kesimpulan yang saya ambil dari penulisan diatas adalah middleware itu sendiri adalah sebuah perangkat lunak yang dipakai oleh beberapa perusahaan misalnya oleh IBM. Dan ini menjadi sebuah kebutuhan dalam dunia bisnis.
Sumber ini diambil dari : /middleware-platform-in-the-direction-towards-the.html
Middleware platform ke arah terhadap pengembangan
Middleware pasar pada tahun 2005, pasar software, Tahun Baru besar. Dalam situasi pasar perangkat lunak permainan pecah, seperti alat Perang Dunia II awal pengembangan, middleware, ini dipentaskan besar adegan setelah adegan dari drama itu, dapat dikatakan cukup untuk menarik popularitas, menang cukup menangis. Seperti banyak fans gila untuk Tahun Baru sebagai besar, perusahaan perangkat lunak dalam negeri dan asing memiliki semua membungkuk ke pasar middleware, rahmat memesona, adalah semua middleware dan gila. perusahaan perangkat lunak dalam negeri dan asing, tanpa kecuali, untuk menyanyikan pujian dari middleware, harus membangun diri sebagai pemeran utama film ini, tidak sabar untuk mengumumkan salah satu di pemimpin pasar middleware di lapangan, tujuannya adalah sepenuhnya tercermin dalam keuntungan mereka sendiri untuk menciptakan hasil pasar yang bagus, untuk mendapatkan lebih besar mungkin di box office.
Terkenal direktur, portofolio investasi superstar dan astronomi Baru Tahun Bioskop menjamin akses ke pasar efek besar. Middleware tidak terkecuali, perusahaan yang terkenal, tim teknis super deluxe, investasi yang signifikan merupakan jaminan keuntungan bagi pasar. Dengan meningkatnya permintaan untuk integrasi, tidak hanya bisnis kebutuhan middleware integrasi berbagai data, informasi perusahaan integrasi, integrasi aplikasi dan proses integrasi juga tak terpisahkan dari middleware, tujuan ini menyediakan untuk pengembangan middleware kondisi bagus.
Di pasar middleware, asap, 's penuh sesak, pemandangan sangat besar, produsen utama telah indah. IBM mengatakan ia adalah seorang vendor perangkat lunak middleware, Oracle juga mengumumkan bahwa pengiriman pasar middleware yang pertama: Ini adalah dijelaskan dalam perusahaan-perusahaan di middleware oleh tingkat perhatian.
Menurut statistik yang terkait, produk middleware, pasar global pada tahun 2005 masih dipertahankan pertumbuhan yang kuat, dan dalam beberapa tahun ke depan pasar akan produk-produk middleware untuk pertumbuhan lanjutan.
Dengan perusahaan internasional dan produsen dalam negeri terus meningkatkan investasi di bidang middleware, memungkinkan teknologi middleware penelitian dan pengembangan terus memperkuat. Setelah masa perjuangan, pasar database dan pola dasar pasar sistem operasi untuk menstabilkan, untuk sementara waktu tidak akan memiliki kekuatan untuk mematahkan pola ini terjadi, memungkinkan vendor perangkat lunak yang telah membuat perubahan strategis untuk membuka medan perang baru, jadi middleware pasar menjadi medan pertempuran vendor perangkat lunak yang banyak, vendor perangkat lunak memiliki harapan setiap yang di middleware akses pasar untuk mereka sendiri sepertiga dari acre tanah. Ini belanja intens, yang mengarah ke middleware produk dan pasar terus diperkuat dan ditingkatkan.
Selain itu, lokalisasi teknologi middleware, yang membuat pasar middleware dengan produsen asing dalam kompetisi tersebut, meskipun pada posisi yang kurang menguntungkan, tetapi juga akses untuk kelangsungan hidup mereka sendiri dan pengembangan dan pertumbuhan dan, akhirnya, memiliki tempat sendiri di bidang middleware , yang secara bertahap memperoleh tanah. Namun, di pasar middleware, seperti IBM, Oracle, BEA ini perusahaan software terkenal internasional, dengan kekuatan yang besar, tegas untuk dominasi pasar Zhanzhao, adalah yang pertama. Jumlah perusahaan perangkat lunak dalam negeri, seperti Link Timur, pencipta, Pu-yuan, dan hanya dapat memainkan peran pendukung dalam Eselon II.
Informasi perusahaan integrasi, integrasi kebutuhan informasi warisan aset, dan pengembangan SOA dan layanan Web, teknologi middleware telah dibuat di tingkat arsitektur perangkat lunak yang telah secara signifikan diperluas. Saat ini, karena dampak yang dirasakan dari middleware berkembang, telah penambahan untuk sistem operasi, database dan sistem langsung ke pelanggan di luar bagian dari klien yang dikenal sebagai middleware.
Tidak peduli seberapa disebut, tidak peduli bagaimana definisi middleware, kami tidak dapat memberikan jenis unik teknologi middleware? Atau aplikasi? Atau berbagi dua. Selama periode ini melihat kebaikan kebajikan dan kebijaksanaan melihat bijaksana. Pada tahun 2005, jenis middleware bervariasi. Selain sebuah middleware pesan, middleware objek, database, middleware dan jenis middleware tradisional lainnya telah menjadi semakin keluar dari citra lama tingkat murni teknis, mulai beralih ke bisnis-jenis middleware. Saat ini, pengejaran dapat memenuhi aplikasi enterprise, bisa lebih fleksibel sesegera mungkin untuk perusahaan layanan TI, dan telah menjadi ESB, pengembangan komponen middleware berorientasi tujuan penting tersebut.
Lain, platform middleware telah dalam arti kecenderungan pembangunan. Dalam produk middleware sederhana tidak dapat memenuhi kebutuhan bisnis keadaan, middleware platform perangkat lunak telah menjadi sebuah kebutuhan. Middleware akan dapat untuk mencapai pembangunan, penyebaran, operasi, manajemen, integrasi dan integrasi keamanan platform terbuka.
Jadi, menurut kesimpulan yang saya ambil dari penulisan diatas adalah middleware itu sendiri adalah sebuah perangkat lunak yang dipakai oleh beberapa perusahaan misalnya oleh IBM. Dan ini menjadi sebuah kebutuhan dalam dunia bisnis.
Sumber ini diambil dari : /middleware-platform-in-the-direction-towards-the.html
Sabtu, 13 November 2010
Layanan Telematika
Layanan Telematika
Susan Kuchinskas melihat bagaimana penyedia layanan telematika (TSPS) OEM membantu meningkatkan loyalitas merek dan membuka peluang pendapatan baru
Sementara mobil gentar tentang cara terbaik untuk memberikan konten dan layanan untuk mobil, TSPS adalah menjilati daging mereka di peluang baru.
Roger Lanctot dari Strategy Analytics berpikir OEM menjalankan risiko hanya menjadi pion dalam permainan dikendalikan oleh operator, produsen handset, pengembang aplikasi, dan penyedia layanan-semua mencari untuk mengekstrak pendapatan dari pemilik mobil. (Untuk lebih dari Strategy Analytics, lihat 'Strategy Analytics: "integrasi Device adalah kisah besar" '.)Di sisi lain, TSPS dapat membantu OEM dengan melakukan semua berat mengangkat-mengurus semua kegiatan di luar bisnis inti produsen mobil '.Dan ini adalah persis di mana TSPS mencari untuk memperluas dan mengembangkan diri mereka.
Di masa lalu, telematika penyedia layanan yang digunakan untuk bertindak hanya sebagai pusat layanan panggilan darurat. Bahkan peran koordinator layanan darurat sedang berkembang karena kemampuan untuk menggabungkan informasi dari berbagai sumber, menurut Gary Wallace, wakil presiden hubungan badan untuk ATX Group, yang kekuatan Mercedes Benz Tele Bantuan program di Amerika Serikat dan BMW Membantu program di Amerika Serikat dan Eropa Barat
Sumber : http://social.telematicsupdate.com/industry-insight/reinventing-telematics-service-provider
Susan Kuchinskas melihat bagaimana penyedia layanan telematika (TSPS) OEM membantu meningkatkan loyalitas merek dan membuka peluang pendapatan baru
Sementara mobil gentar tentang cara terbaik untuk memberikan konten dan layanan untuk mobil, TSPS adalah menjilati daging mereka di peluang baru.
Roger Lanctot dari Strategy Analytics berpikir OEM menjalankan risiko hanya menjadi pion dalam permainan dikendalikan oleh operator, produsen handset, pengembang aplikasi, dan penyedia layanan-semua mencari untuk mengekstrak pendapatan dari pemilik mobil. (Untuk lebih dari Strategy Analytics, lihat 'Strategy Analytics: "integrasi Device adalah kisah besar" '.)Di sisi lain, TSPS dapat membantu OEM dengan melakukan semua berat mengangkat-mengurus semua kegiatan di luar bisnis inti produsen mobil '.Dan ini adalah persis di mana TSPS mencari untuk memperluas dan mengembangkan diri mereka.
Di masa lalu, telematika penyedia layanan yang digunakan untuk bertindak hanya sebagai pusat layanan panggilan darurat. Bahkan peran koordinator layanan darurat sedang berkembang karena kemampuan untuk menggabungkan informasi dari berbagai sumber, menurut Gary Wallace, wakil presiden hubungan badan untuk ATX Group, yang kekuatan Mercedes Benz Tele Bantuan program di Amerika Serikat dan BMW Membantu program di Amerika Serikat dan Eropa Barat
Sumber : http://social.telematicsupdate.com/industry-insight/reinventing-telematics-service-provider
Minggu, 07 November 2010
Yang Kita dapat dari Adanya Telematika
Sebagai mahasiswa di bidang computer khususnya dalam bidang system informasi yang kita dapat dari telematika adalah ilmu-ilmu mengenai multimedia yang ada di computer. Semua permasalahan dapat dipecahkan oleh telamatika ini. Telamtika dapat membantu banyak orang untuk memecahkan masalahnya dan dapat mengungkapkan kebenaran yang terjadi. Misalnya foto-foto yang di edit dapat di ungkap kebenarannya karena semua itu hanya editan saja.
Jadi dengan adanya telamtika ini sangat berguna sekali, dan kita harus belajar lebih banyak lagi mengenai ilmu di bidang telematika ini. Karena kita akan mendapat banyak ilmu jika kita mempelajarinya, dan kita juga dapat membantu banyak orang yang membutuhkan. Karena orang-iorang dibidangnya masih jarang sekali yang menguasai ilmu telematika ini.
Contohnya saja bapak Roy Suryo yang sudah membantu banyak orang untuk mengungkpan suatu kebenaran dari kejahatan orang-orang yang menggunakan computer untuk mencelakakan orang lain untuk mendapat keuntungan. Ini bisa di ungkapkan dari kenjagalan-kenjagalan pada gambar atau semacamnya. Jadi, kita harus banyak belajar lagi mengenai ilmu dari telematika ini, karena banyak sekali manfaatnya
Jadi dengan adanya telamtika ini sangat berguna sekali, dan kita harus belajar lebih banyak lagi mengenai ilmu di bidang telematika ini. Karena kita akan mendapat banyak ilmu jika kita mempelajarinya, dan kita juga dapat membantu banyak orang yang membutuhkan. Karena orang-iorang dibidangnya masih jarang sekali yang menguasai ilmu telematika ini.
Contohnya saja bapak Roy Suryo yang sudah membantu banyak orang untuk mengungkpan suatu kebenaran dari kejahatan orang-orang yang menggunakan computer untuk mencelakakan orang lain untuk mendapat keuntungan. Ini bisa di ungkapkan dari kenjagalan-kenjagalan pada gambar atau semacamnya. Jadi, kita harus banyak belajar lagi mengenai ilmu dari telematika ini, karena banyak sekali manfaatnya
Perbedaan Perkembangan Telematika di Indonesia dengan di Luar Negeri
Perbedaan Perkembangan Telematika
di Indonesia dengan di Luar Negeri
di Indonesia dengan di Luar Negeri
Menurut saya perkembangan telematika yang ada di Indonesia dengan yang ada di Luar Negeri tidak terlalu jauh perbedaannya. Karena telematika di Indonesia sendiri sudah luyaman maju dengan yang ada di luar negeri. Walaupun tidak di semua wilayah di Indonesia yang mengalami kemajuan hanya di beberapa kota besar saja yang sudah mempunyai telematika yang bagus. Ini dikarenakan di beberapa wilayah Indonesia masih ada orang-orang yang buta mengenai alat-alat tekhnologi yang canggih. Disinal latak perbedaannya yang cukup menonjol di bandingkan dengan luar negeri.
Sumber Daya Manusianya juga sangat kecil yang bisa menguasai pada bidang telematika ini, sehingga hanya ada beberapa orang dapat menguasai dalam bidang ini. Sedangkan di luar negeri sudah banyak orang yang sudah ahli dibidangnya. Dan juga fasilitas yang tersedia di Negara-negara lain sudah banyak yang menggunakan alat-alat elektronik yang canggih dan menggunakan computer.
Jadi, menurut saya jika Indonesia ingin maju di bidang telamatika maka sumber dayanya harus diperbaiki terlebih dahulu. Jangan ada lagi orang-orang yang buta dengan computer dan bila perlu fasilitas yang menggunakan computer diperbanyak agar orang-orang dapat menggunakannya. Sehingga kita dapat maju dan bersaing dengan Negara-negara lain yang ada di laur sana yang sudah sangat maju mengenai ilmu computer.
Speech Recognition
Pengenalan pembicaraan (juga dikenal sebagai pengenalan suara otomatis atau pengakuan komputer pidato) mengkonversi diucapkan kata-kata untuk teks. The "pengenalan suara" istilah kadang-kadang digunakan untuk merujuk kepada sistem pengakuan yang harus dilatih untuk kasus-speaker tertentu seperti untuk perangkat lunak pengenal yang paling desktop. Menyadari pembicara dapat menyederhanakan tugas menerjemahkan pidato.
Pengenalan pembicaraan adalah solusi yang lebih luas yang mengacu pada teknologi yang dapat mengenali pidato tanpa ditargetkan pada pembicara tunggal seperti sistem call center yang dapat mengenali suara sewenang-wenang. Aplikasi pengenalan pembicaraan termasuk user interface seperti suara panggilan suara (misalnya, "Call home"), call routing (misalnya, "Saya ingin membuat collect call"), kontrol alat domotic, pencarian (misalnya, menemukan podcast di mana tertentuKata-kata itu diucapkan), sederhana entri data (misalnya, memasukkan nomor kartu kredit), persiapan dokumen terstruktur (misalnya, sebuah laporan radiologi), pengolahan pidato-ke-teks (misalnya, kata prosesor atau email), dan pesawat udara (biasanya disebut Input langsung suara).
Dynamic waktu warping (DTW) berbasis speech recognition
Artikel utama: Dynamic warping waktu
Dynamic waktu warping adalah suatu pendekatan yang secara historis digunakan untuk pengenalan suara tapi kini sebagian besar telah mengungsi akibat pendekatan HMM berbasis lebih berhasil. Dynamic waktu warping adalah suatu algoritma untuk mengukur kesamaan antara dua sekuen yang mungkin berbeda dalam waktu atau kecepatan. Misalnya, kesamaan dalam pola berjalan akan terdeteksi, bahkan jika dalam satu video orang itu berjalan perlahan-lahan dan jika di lain mereka berjalan lebih cepat, atau bahkan jika ada percepatan dan deselerasi selama satu pengamatan. DTW telah diterapkan ke video, audio, dan grafik - memang, setiap data yang dapat berubah menjadi representasi linier dapat dianalisis dengan DTW.
Sebuah aplikasi terkenal telah pengenalan suara otomatis, untuk mengatasi dengan kecepatan berbicara yang berbeda. Secara umum, ini adalah metode yang memungkinkan komputer untuk menemukan kecocokan yang optimal antara dua sekuens diberikan (misalnya time series) dengan pembatasan tertentu, yaitu urutan yang "bengkok" non-linear untuk mencocokkan satu sama lain. Metode sequence alignment yang sering digunakan dalam konteks model Markov tersembunyi.
Jadi, kesimpulannya adalah sebuah system yang dapat menyimpan suara dengan merekamnya dan kita dapat mendengarkannya kembali. Ini bisa juga digunakan pada telepon selular bila telepon selular yang kita pakai tidak aktif maka otomatis jika ada telepon masuk maka suara rekaman kita akan terdengar yang menyampikan tolong tinggalkan pesan anda.
Sumber : http://en.wikipedia.org/wiki/Speech_recognition
Pengenalan pembicaraan adalah solusi yang lebih luas yang mengacu pada teknologi yang dapat mengenali pidato tanpa ditargetkan pada pembicara tunggal seperti sistem call center yang dapat mengenali suara sewenang-wenang. Aplikasi pengenalan pembicaraan termasuk user interface seperti suara panggilan suara (misalnya, "Call home"), call routing (misalnya, "Saya ingin membuat collect call"), kontrol alat domotic, pencarian (misalnya, menemukan podcast di mana tertentuKata-kata itu diucapkan), sederhana entri data (misalnya, memasukkan nomor kartu kredit), persiapan dokumen terstruktur (misalnya, sebuah laporan radiologi), pengolahan pidato-ke-teks (misalnya, kata prosesor atau email), dan pesawat udara (biasanya disebut Input langsung suara).
Dynamic waktu warping (DTW) berbasis speech recognition
Artikel utama: Dynamic warping waktu
Dynamic waktu warping adalah suatu pendekatan yang secara historis digunakan untuk pengenalan suara tapi kini sebagian besar telah mengungsi akibat pendekatan HMM berbasis lebih berhasil. Dynamic waktu warping adalah suatu algoritma untuk mengukur kesamaan antara dua sekuen yang mungkin berbeda dalam waktu atau kecepatan. Misalnya, kesamaan dalam pola berjalan akan terdeteksi, bahkan jika dalam satu video orang itu berjalan perlahan-lahan dan jika di lain mereka berjalan lebih cepat, atau bahkan jika ada percepatan dan deselerasi selama satu pengamatan. DTW telah diterapkan ke video, audio, dan grafik - memang, setiap data yang dapat berubah menjadi representasi linier dapat dianalisis dengan DTW.
Sebuah aplikasi terkenal telah pengenalan suara otomatis, untuk mengatasi dengan kecepatan berbicara yang berbeda. Secara umum, ini adalah metode yang memungkinkan komputer untuk menemukan kecocokan yang optimal antara dua sekuens diberikan (misalnya time series) dengan pembatasan tertentu, yaitu urutan yang "bengkok" non-linear untuk mencocokkan satu sama lain. Metode sequence alignment yang sering digunakan dalam konteks model Markov tersembunyi.
Jadi, kesimpulannya adalah sebuah system yang dapat menyimpan suara dengan merekamnya dan kita dapat mendengarkannya kembali. Ini bisa juga digunakan pada telepon selular bila telepon selular yang kita pakai tidak aktif maka otomatis jika ada telepon masuk maka suara rekaman kita akan terdengar yang menyampikan tolong tinggalkan pesan anda.
Sumber : http://en.wikipedia.org/wiki/Speech_recognition
Speech Synthesis
Pidato sintesis adalah produksi buatan ucapan manusia. Sebuah sistem komputer yang digunakan untuk tujuan ini disebut synthesizer pidato, dan dapat diimplementasikan dalam perangkat lunak atau perangkat keras. Sebuah teks-to-speech (TTS) sistem mengkonversi teks ke dalam pidato bahasa normal;. Sistem lain membuat representasi linguistik simbolik seperti transkripsi fonetik dalam pidato
pidato disintesis dapat dibuat dengan menggabungkan potongan pidato direkam yang disimpan dalam database. Sistem berbeda dalam ukuran unit pidato disimpan, sebuah sistem yang menyimpan telepon atau diphones menyediakan berbagai keluaran terbesar, tapi mungkin kurang jelas. Untuk domain penggunaan khusus, penyimpanan seluruh kata-kata atau kalimat memungkinkan untuk output berkualitas tinggi. Atau, synthesizer dapat menggabungkan model saluran vokal dan karakteristik suara manusia untuk membuat yang benar-benar "sintetik" output suara.
Kualitas synthesizer pidato dinilai oleh kesamaannya dengan suara manusia dan dengan kemampuannya untuk dipahami. Sebuah program text-to-speech dipahami memungkinkan orang dengan gangguan visual atau membaca cacat untuk mendengarkan karya tulis di komputer rumah. Banyak komputer operasi telah menyertakan synthesizer pidato sejak awal 1980-an..
Teknologi synthesizer
Kualitas yang paling penting dari sebuah sistem sintesis pidato yang alamiah dan dimengerti. Kealamian menggambarkan seberapa dekat output suara seperti ucapan manusia, sedangkan dimengerti adalah kemudahan dengan yang output dipahami.Synthesizer pidato yang ideal adalah baik alam dan dimengerti. sistem sintesis Pidato biasanya mencoba untuk memaksimalkan kedua karakteristik.
Dua teknologi utama untuk menghasilkan bentuk gelombang pidato sintetis dan sintesis sintesis concatenative forman. Setiap teknologi memiliki kekuatan dan kelemahan, dan menggunakan dimaksud sistem sintesis biasanya akan menentukan pendekatan mana yang digunakan.
Forman sintesis
sintesis forman tidak menggunakan sampel suara manusia pada saat runtime.Sebaliknya, keluaran suara sintesis dibuat menggunakan aditif sintesis dan model akustik (sintesis pemodelan fisik) [23] Parameter seperti frekuensi fundamental, menyuarakan,. Dan tingkat kebisingan yang bervariasi dari waktu ke waktu untuk membuat gelombang pidato buatan. Metode ini kadang-kadang disebut sintesis berbasis peraturan, namun sistem concatenative banyak juga memiliki komponen aturan berbasis. Banyak sistem yang didasarkan pada teknologi sintesis forman menghasilkan buatan, robot yang terdengar pidato yang tidak akan pernah salah untuk pidato manusia. Namun, kealamian maksimum tidak selalu tujuan sistem sintesis pidato, dan sistem sintesis forman memiliki keunggulan dibandingkan sistem concatenative. pidato forman-disintesis dapat diandalkan dimengerti, bahkan pada kecepatan yang sangat tinggi, menghindari Glitches akustik yang biasanya wabah sistem concatenative. pidato disintesis kecepatan tinggi digunakan oleh tunanetra untuk navigasi cepat komputer menggunakan pembaca layar. synthesizer forman adalah program biasanya lebih kecil dibandingkan dengan sistem concatenative karena mereka tidak memiliki database contoh pidato. Oleh karena itu mereka dapat digunakan dalam embedded system, di mana memori dan daya mikroprosesor sangat terbatas. Karena sistem forman berbasis memiliki kontrol penuh dari semua aspek pidato output, berbagai prosodies dan intonasi dapat menjadi output, tidak hanya menyampaikan pertanyaan dan pernyataan, tetapi berbagai emosi dan nada suara.
Contoh non-real time-tetapi sangat akurat kontrol intonasi dalam sintesis forman meliputi pekerjaan yang dilakukan pada akhir tahun 1970 untuk mainan Texas Instruments Speak & Spell, dan pada tahun 1980 mesin awal arcade Sega. [24] dan dalam banyak Atari, Inc arcade games. [25] dengan menggunakan LPC TMS5220 Chips. Menciptakan intonasi yang tepat untuk proyek ini adalah telaten, dan hasilnya masih harus dicocokkan dengan interface real-time text-to-speech. [26].
Jadi, kesimpunnya adalah suatu system yang dapat mengubah suara manusia menjadi sebuah text yang dapat di baca. Misalnya ada seseorang yang sedang berpidato kemudian pidato yang sedang dibacakan itu direkam oleh seseorang, kemudian rekaman itu di masukan ke dalam sebuah system yang dapat mengubahnya kedalam sebuah text dokumen.
Sumber : http://en.wikipedia.org/wiki/Speech_synthesis
pidato disintesis dapat dibuat dengan menggabungkan potongan pidato direkam yang disimpan dalam database. Sistem berbeda dalam ukuran unit pidato disimpan, sebuah sistem yang menyimpan telepon atau diphones menyediakan berbagai keluaran terbesar, tapi mungkin kurang jelas. Untuk domain penggunaan khusus, penyimpanan seluruh kata-kata atau kalimat memungkinkan untuk output berkualitas tinggi. Atau, synthesizer dapat menggabungkan model saluran vokal dan karakteristik suara manusia untuk membuat yang benar-benar "sintetik" output suara.
Kualitas synthesizer pidato dinilai oleh kesamaannya dengan suara manusia dan dengan kemampuannya untuk dipahami. Sebuah program text-to-speech dipahami memungkinkan orang dengan gangguan visual atau membaca cacat untuk mendengarkan karya tulis di komputer rumah. Banyak komputer operasi telah menyertakan synthesizer pidato sejak awal 1980-an..
Teknologi synthesizer
Kualitas yang paling penting dari sebuah sistem sintesis pidato yang alamiah dan dimengerti. Kealamian menggambarkan seberapa dekat output suara seperti ucapan manusia, sedangkan dimengerti adalah kemudahan dengan yang output dipahami.Synthesizer pidato yang ideal adalah baik alam dan dimengerti. sistem sintesis Pidato biasanya mencoba untuk memaksimalkan kedua karakteristik.
Dua teknologi utama untuk menghasilkan bentuk gelombang pidato sintetis dan sintesis sintesis concatenative forman. Setiap teknologi memiliki kekuatan dan kelemahan, dan menggunakan dimaksud sistem sintesis biasanya akan menentukan pendekatan mana yang digunakan.
Forman sintesis
sintesis forman tidak menggunakan sampel suara manusia pada saat runtime.Sebaliknya, keluaran suara sintesis dibuat menggunakan aditif sintesis dan model akustik (sintesis pemodelan fisik) [23] Parameter seperti frekuensi fundamental, menyuarakan,. Dan tingkat kebisingan yang bervariasi dari waktu ke waktu untuk membuat gelombang pidato buatan. Metode ini kadang-kadang disebut sintesis berbasis peraturan, namun sistem concatenative banyak juga memiliki komponen aturan berbasis. Banyak sistem yang didasarkan pada teknologi sintesis forman menghasilkan buatan, robot yang terdengar pidato yang tidak akan pernah salah untuk pidato manusia. Namun, kealamian maksimum tidak selalu tujuan sistem sintesis pidato, dan sistem sintesis forman memiliki keunggulan dibandingkan sistem concatenative. pidato forman-disintesis dapat diandalkan dimengerti, bahkan pada kecepatan yang sangat tinggi, menghindari Glitches akustik yang biasanya wabah sistem concatenative. pidato disintesis kecepatan tinggi digunakan oleh tunanetra untuk navigasi cepat komputer menggunakan pembaca layar. synthesizer forman adalah program biasanya lebih kecil dibandingkan dengan sistem concatenative karena mereka tidak memiliki database contoh pidato. Oleh karena itu mereka dapat digunakan dalam embedded system, di mana memori dan daya mikroprosesor sangat terbatas. Karena sistem forman berbasis memiliki kontrol penuh dari semua aspek pidato output, berbagai prosodies dan intonasi dapat menjadi output, tidak hanya menyampaikan pertanyaan dan pernyataan, tetapi berbagai emosi dan nada suara.
Contoh non-real time-tetapi sangat akurat kontrol intonasi dalam sintesis forman meliputi pekerjaan yang dilakukan pada akhir tahun 1970 untuk mainan Texas Instruments Speak & Spell, dan pada tahun 1980 mesin awal arcade Sega. [24] dan dalam banyak Atari, Inc arcade games. [25] dengan menggunakan LPC TMS5220 Chips. Menciptakan intonasi yang tepat untuk proyek ini adalah telaten, dan hasilnya masih harus dicocokkan dengan interface real-time text-to-speech. [26].
Jadi, kesimpunnya adalah suatu system yang dapat mengubah suara manusia menjadi sebuah text yang dapat di baca. Misalnya ada seseorang yang sedang berpidato kemudian pidato yang sedang dibacakan itu direkam oleh seseorang, kemudian rekaman itu di masukan ke dalam sebuah system yang dapat mengubahnya kedalam sebuah text dokumen.
Sumber : http://en.wikipedia.org/wiki/Speech_synthesis
Audio Data
Penjelasan
Audio data datang dalam berbagai bentuk kadang-kadang membingungkan. Jumlah cara mendasar di mana suara dapat diwakili sebenarnya cukup kecil. Berbagai jenis file audio adalah karena fakta bahwa ada cukup beberapa pendekatan untuk data audio mengompresi dan sejumlah cara yang berbeda dari kemasan data. Kami pertama-tama menjelaskan bagaimana data audio sendiri diwakili, maka bagaimana itu dibungkus ke file. Orang sering berbicara tentang format audio sembarangan tanpa membedakan antara format data dan format file, tetapi sangat penting untuk menjaga perbedaan ini dalam pikiran banyak format file dapat berisi tanggal direpresentasikan di lebih dari satu cara dan sebagian besar representasi data dapat dikemas di lebih dari satu format file. Mengatakan bahwa file suara adalah ". Wav" file mengatakan apa-apa tentang format data audio. Demikian pula, mengatakan bahwa file berisi data PCM mengatakan apa-apa tentang format file.
Perwakilan dari Sound itu Sendiri
Fundamental Aspek Representasi Sound
Suara terdiri dari variasi terdengar dalam tekanan udara. Mikrofon mengubah variasi tekanan udara menjadi tegangan yang bervariasi. Untuk mewakili suara digital, kita harus mengkonversi tegangan ini bervariasi menjadi serangkaian angka yang mewakili amplitudonya. Proses ini dikenal sebagai konversi analog-ke-digital. Data Audio terdiri dari angka tersebut dikatakan dalam format modulasi kode pulsa, disingkat PCM. Audio data sering disimpan dalam format lain, biasanya dalam rangka untuk kompres itu, namun hampir selalu dimulai dalam format PCM.
Angka-angka yang dihasilkan oleh konverter analog-ke-digital, secara umum, sewenang-wenang. Meskipun data tekanan asli memiliki dimensi dynes per sentimeter persegi, hubungan antara nilai-nilai tekanan aktual dan nomor-nomor yang dihasilkan oleh konversi analog-ke-digital ditentukan baik oleh karakteristik respon mikrofon dan oleh preamplifier di analog-ke -digital converter. Kita jarang mengetahui sifat yang tepat baik mikrofon atau konverter analog-ke-digital. Selanjutnya, kita biasanya menyesuaikan konverter analog-ke-digital, atau preamplifier yang mendahului, untuk memilih tingkat input yang terbaik. Kami ingin menggunakan rentang dinamis terbesar mungkin, sehingga dapat mengambil keuntungan dari detail penuh sinyal, sementara pada saat yang sama memastikan bahwa kami tidak melampaui batas dari elektronik dan kliping menghindari, yang mendistorsi sinyal.Oleh karena itu, hampir tidak pernah terjadi bahwa kita tahu berapa banyak dynes per sentimeter persegi nomor mewakili. Untuk sebagian besar tujuan ini tidak masalah karena semua kita peduli tentang adalah amplitudo relatif dari sinyal. tingkat tekanan absolut yang menarik untuk beberapa pekerjaan di psychophysics pendengaran. Dalam hal ini, perlu untuk mengkalibrasi sistem dan memperbaiki parameter (seperti keuntungan preamplifier).
Tekanan udara variasi, dan oleh karena itu tegangan yang sesuai yang dihasilkan oleh mikrofon, yang terus menerus dalam dua-dimensi. Artinya, nilai-nilai bervariasi terus menerus, dan mereka ada di setiap titik waktu. Namun, sistem digital seperti komputer tidak dapat secara langsung merupakan sinyal kontinyu. Sebaliknya, ia harus mengukur sinyal pada himpunan terhingga kali diskrit. Ini dikenal sebagai sampling. Furtheremore, harus membuat penggunaan jumlah terbatas tingkat amplitudo diskrit. Ini dikenal sebagai kuantisasi. Jumlah level yang digunakan dikenal sebagai resolusi. Resolusi biasanya dinyatakan dalam bit, yaitu, sebagai logaritma-2 dasar tentang jumlah sebenarnya. Sebuah sistem dengan resolusi 8 bit memanfaatkan 2 ^ 8 = 256 level. Sebuah sistem dengan resolusi 16 bit memanfaatkan 2 ^ 16 = 65.536 level. Tingkat sampling dan resolusi menentukan kualitas representasi digital dari suara. "CD-kualitas" suara memiliki resolusi 16 bit dan tingkat sampling dari 44.100 sampel per detik.
Berikut ini adalah terus menerus gelombang:
dan di sini adalah representasi sampel dan terkuantisasi itu:
Sampling Rate
Tingkat pengambilan sampel adalah jumlah kali per detik bahwa amplitudo dari sinyal diukur dan memiliki dimensi sampel per detik. Semakin tinggi sampling rate, semakin akurat sinyal sampel akan mewakili sinyal asli. Pemilihan sampling rate ditentukan oleh Teorema Sampling Nyquist. Teorema ini menyatakan bahwa jika frekuensi maksimum di mana sinyal asli mengandung energi adalah F, maka jika sampel pada tingkat yang ketat lebih besar dari 2F sampel per detik, maka akan mungkin untuk merekonstruksi sinyal asli sempurna dari sinyal sampel. Dengan kata lain, sinyal sampel akan berisi semua informasi dalam sinyal asli.
Penting untuk dicatat bahwa laju sampling harus benar-benar lebih besar dari 2F.Sampling pada tingkat tepat 2F dapat mengakibatkan kesalahan. Sebagai contoh, anggaplah bahwa sinyal asli adalah gelombang sinus frekuensi F. Jika kita sampel pada frekuensi 2F, dengan sampel pertama pada waktu 0, semua contoh kami akan memiliki nilai 0. Gelombang sinus yang asli tidak bisa direkonstruksi dari seperti sinyal sampel. Hal ini mudah dilihat dalam ilustrasi berikut. Semua menunjukkan empat 1Hz gelombang sinus. Dua di sebelah kiri memiliki fase 0. Dua di sebelah kanan memiliki fase π. Kedua atas memiliki amplitudo 1.0. Dua bawah memiliki amplitudo 2.0. Jika kita sampel di dua sampel per detik dengan offset 0, semua contoh kami akan 0 pada semua empat kasus. Sinyal sampel tidak akan berisi informasi yang diperlukan untuk memutuskan mana dari empat sinyal asli untuk merekonstruksi.
Furthermore, teorema Nyquist didasarkan pada asumsi bahwa sinyal asli panjang tak terhingga. Jika tidak, sampling di lebih dari laju Nyquist dari 2F belum tentu mengizinkan reconsruction sempurna. Jika tingkat sampling hanya sedikit lebih besar dari tingkat Nyquist, kenaikan mungkin tidak menggeser titik sampling di atas cukup jauh untuk membuat nilai terkuantisasi berbeda. Perhatikan lagi contoh kita dari gelombang sinus. Mari kita anggap bahwa frekuensi adalah 1000 Hz. Jika kita sampel pada tingkat 2000 sampel per detik kita mungkin berakhir dengan setiap sampel sama dengan 0. Misalkan kita sampel pada tingkat tahun 2001 sampel per detik, yang secara teknis satsifies kriteria Nyquist. Jika sinyal cukup panjang, bahkan jika sampel pertama berada pada nol, beberapa sampel akan menjadi jarak yang signifikan dari nol dan akan ada informasi yang cukup untuk merekonstruksi sinyal.Tetapi jika sinyal cukup pendek, akan diambil sampel pada titik-titik dimana nilai yang begitu dekat dengan nol yang mungkin tidak dibedakan dari nol ketika terkuantisasi. Akibatnya, untuk sinyal pendek perlu menggunakan tingkat sampling secara signifikan lebih tinggi daripada frekuensi Nyquist.
Intuitif mungkin tampak bahwa jika suatu sinyal diambil pada tingkat terlalu rendah akibat akan menjadi bahwa komponen frekuensi yang lebih tinggi akan hilang, tetapi bahwa komponen frekuensi yang lebih rendah akan terpengaruh. Sayangnya, hal ini tidak terjadi. Sebaliknya, apa yang terjadi adalah bahwa energi dari frekuensi yang lebih tinggi diperlakukan seolah-olah berada di frekuensi yang lebih rendah; energi ditambahkan ke energi benar-benar hadir pada frekuensi yang lebih rendah. distorsi ini dikenal sebagai aliasing.
Dalam rangka untuk mendigitalkan sinyal tanpa bahaya aliasing, adalah kebiasaan untuk lulus melalui sebuah low-pass filter pertama dalam rangka untuk menghilangkan energi apapun di atas frekuensi Nyquist. Sebagai contoh, jika kita tertarik pada energi hingga 8Khz, kita dapat sampel pada frekuensi sedikit lebih dari 16.000 sampel per detik, setelah menyaring energi di atas 8Khz. Namun, realisasi fisik low-pass filter tidak cukup dengan memberikan 100% dari energi yang di bawah frekuensi cutoff dan menghilangkan semua energi di atasnya. Penurunan energi di atas frekuensi cutoff nominal bertahap. Jika kita menggunakan filter dengan cutoff nominal 8Khz, kita mungkin masih memiliki energi yang signifikan di daerah sedikit di atas 8Khz. Oleh karena itu, agar aman, jika kita tahu bahwa kita tertarik energi hingga F frekuensi, kami menggunakan low-pass filter dengan cutoff nominal F dan kita memilih tingkat sampling secara signifikan atas 2F. Dengan begitu, laju sampling kami akan cukup tinggi bahwa setiap energi di wilayah tepat di atas frekuensi cutoff nominal tidak akan alias. Praktek yang umum adalah dengan menggunakan tingkat sampling 2.5F. Konverter analog-ke-digital lama yang memungkinkan pilihan tarif sampling harus memiliki filter analog variabel sebelum digitizer. Saat ini, pengolahan sinyal hardware sangat cepat dan murah bahwa pendekatan yang biasa adalah dengan menggunakan low-pass filter dengan frekuensi cutoff tetap, maka sampel pada tingkat tinggi. Sinyal sampel ini kemudian downsampled (dikonversi ke tingkat sampling yang lebih rendah) setelah digital low-pass filter.
Tingkat sampling yang paling umum saat ini adalah 44.100 sampel per detik. Ini adalah tingkat pengambilan sampel yang digunakan untuk CD musik. Karena pasar musik jauh lebih besar dari yang lain (seperti pasar untuk penelitian fonetik akustik), off-the-rak perangkat keras dan perangkat lunak dirancang untuk spesifikasinya.Tingkat sampling memungkinkan untuk konten frekuensi sampai sedikit di atas 20kHz, yang mencakup seluruh rentang bahwa manusia bisa mendengar. Memang, kebanyakan orang dewasa tidak dapat mendengar frekuensi hampir yang tinggi.
Ketika bahan digitalisasi untuk penelitian linguistik, Anda dapat menghemat ruang dengan menggunakan tingkat sampling yang lebih rendah, mengatakan 22.050 sampel per detik. Semua informasi linguistik dalam pidato di bawah 8KHz, sehingga tingkat ini lebih dari cukup.
Sampling rate lain yang kadang-kadang terlihat adalah 8.000 sampel per detik.Angka ini sesuai (menggunakan pengali sebesar 2,5 daripada 2,0 dibahas di atas) untuk frekuensi maksimum 3.2KHz, yang merupakan batas atas dari band telepon.Tingkat ini adalah karena itu cocok untuk aplikasi yang melibatkan pembicaraan telepon. Hal ini terlalu rendah untuk pidato berkualitas baik atau musik, dan tidak diterima untuk penelitian fonetik kebanyakan.
Resolusi
Kesalahan yang dihasilkan oleh mengkuantisasi sinyal dikenal sebagai kebisingan kuantisasi. Kualitas sinyal terkuantisasi dapat diukur dengan menghitung rasio signal-to-noise (SNR), di mana kebisingan yang dimaksud adalah noise kuantisasi. Setiap bit resolusi menambahkan sekitar 6 desibel untuk sinyal-to-noise rasio. Sebuah resolusi 8 bit sehingga menghasilkan suatu SNR sekitar 48dB. Sebuah resolusi 16 bit, mampu memberikan SNR sekitar 96dB. Beberapa digitizers tua, seperti yang digunakan pada PC dan Macintoshen pada 1980-an dan awal 1990-an, hanya menghasilkan resolusi 8 bit, sehingga terkadang menemukan file lama suara 8-bit.Resolusi 16 bit ini dipertimbangkan diidamkan untuk tujuan seperti penelitian fonetik akustik dan musik berkualitas profesional. Hampir semua digitizers yang digunakan saat ini memberikan resolusi 16 bit atau lebih tinggi.
Pengaruh kuantisasi dapat dipahami secara intuitif dengan membandingkan sinyal terkuantisasi dengan sinyal kontinyu asli. Berikut ini adalah sinyal kontinyu dilapis dengan kuantisasi 2-bit:
Ketika digitalisasi sinyal analog, penting untuk mengatur tingkat input digitizer dengan benar. Ini berarti bahwa nilai-nilai ekstrim dari sinyal input harus hanya dalam kisaran digitizer. Jika mereka melebihi jangkauan digitizer, hasilnya akan menjadi bentuk distorsi yang dikenal sebagai kliping. overloading signifikan juga dapat merusak digitizer. Di sisi lain, jika tingkat input dipasang terlalu rendah, hasilnya akan efektif resolusi daripada yang lebih kecil optimal. Jika digitizer telah tersedia 65.536 tingkat tetapi sinyal hanya berkisar lebih dari setengah rentang masukan, hanya setengah dari tingkat yang digunakan. Akibatnya sinyal digital dengan resolusi 15 bit bukan 16 yang tersedia.
Saluran
Sebuah aliran tunggal suara, seperti yang dari rekaman mono biasa, merupakan satu saluran. Stereo membutuhkan dua saluran. musik Quadriphonic memerlukan empat saluran. Rekaman dilakukan di studio musik profesional mungkin memiliki banyak saluran sebelum pencampuran, satu untuk masing-masing instrumen dan penyanyi.Dalam prakteknya, nilai-nilai umum adalah satu dan dua.
Kecelakaan Representasi
Signedness
Bilangan bulat yang digunakan untuk merepresentasikan nilai amplitudo dapat ditandatangani atau unsigned. Sejumlah ditandatangani adalah salah satu yang mungkin baik positif atau negatif. Sejumlah unsigned mungkin tidak akan pernah negatif. Apakah nomor yang digunakan adalah unsigned ditandatangani atau tidak berpengaruh pada resolusi. Jumlah tingkat amplitudo yang berbeda tetap sama.Sebagai contoh, di tingkat representasi mesin biasa bilangan bulat (dikenal sebagai representasi 2's-melengkapi), 16 bit masuk bilangan bulat berkisar antara -32768 dan 32767. 16 bit unsigned integer rentang nilai dari 0 sampai 65.535. Dalam kedua kasus jumlah tingkat amplitudo adalah 65.536. Oleh karena itu, tidak terlalu penting apakah representasi terdaftar atau unsigned digunakan, tetapi untuk beroperasi pada nilai-nilai benar perlu untuk mengetahui representasi dimaksudkan. Misalnya, pola bit 1111111111111111 merupakan nilai 65.535, nilai maksimum, sebagai unsigned integer tetapi -1, di tengah rentang amplitudo, sebagai pelengkap 2's-integer ditandatangani.
Endianness
Ingat dari penjelasan kami sebelumnya endianness yang menafsirkan rangkaian komputer yang berbeda multibyte dengan cara yang berbeda. Sejak 16 bit integer mengambil dua byte, mereka dipengaruhi oleh endianness. Software Audio umumnya akan mengkonversi data urutan byte yang salah yang diperlukan. Anda hanya akan perlu berurusan dengan endian-ness jika Anda menulis perangkat lunak pemrosesan level rendah audio atau jika Anda mengalami data audio mentah sehingga perangkat lunak Anda tidak dapat menentukan urutan byte data dari header. Jika Anda menemukan sebuah file mentah dengan urutan byte yang salah, harus mudah untuk mendeteksi karena akan terdengar seperti kebisingan.
Kompresi
Audio data memakan banyak ruang, setidaknya dibandingkan dengan teks. Sebuah single kedua audio compact disc memakan sekitar ruang sebanyak 15.000 kata dari teks ASCII, yaitu, 60 halaman dari sebuah buku khas. Berikut adalah grafik yang menunjukkan jumlah ruang yang ditempati oleh jangka waktu yang berbeda suara mono pada tingkat sampling yang berbeda. Sebuah disk 10GB, misalnya, akan mengadakan hanya sekitar 31 jam audio pada tingkat-CD.
1 second 1 minute 1 hour
44,100 samples/second 16 bit l88.2KB 5.3MB 317.5MB
22,050 samples/second 16 bit 44.1KB 2.6MB 158.8MB
16,000 samples/second 16 bit 32.0KB 1.9MB 115.2MB
Perhatikan bahwa dalam tabel ini KB singkatan dari 1.000 byte dan untuk MB 1.000.000 byte. Ini adalah definisi yang digunakan oleh International Electrotechnical Commission, badan internasional yang menetapkan standar di bidang elektronik dan listrik. Disk produsen menggunakan unit untuk menggambarkan ukuran produk mereka. Sebaliknya, programer komputer umumnya menggunakan KB berarti 1.024 byte dan MB berarti 1024 * 1024 = 1.048.576 byte.
Karena data audio menempati banyak ruang, ada telah lama motivasi untuk kompres itu. Memang, kompresi audio mendahului penggunaan komputer digital dan digital transmisi data. Bell Laboratories melakukan penelitian perintis pada lokasi informasi dalam pidato dalam domain frekuensi sehingga AT & T bisa pak karena banyak percakapan telepon ke satu baris mungkin. Penelitian ini menunjukkan bahwa sebagian besar informasi dalam pidato terletak di antara 300 dan 3.000 Hz. Itu sebabnya, bahkan hari ini, sirkuit telepon menyaring energi semua di luar band ini.
teknik kompresi terdiri dari dua jenis dasar: lossless dan lossy. Sebuah teknik kompresi lossless adalah salah satu yang menghasilkan sinyal dikompresi dari mana sinyal asli dapat direkonstruksi dengan sempurna. Tidak ada informasi yang hilang sebagai akibat dari kompresi. Sebuah teknik kompresi lossy adalah salah satu yang membuang informasi. Sinyal asli tidak dapat direkonstruksi sempurna dari sinyal dikompresi dengan metode lossy.
Sebuah program atau perangkat keras yang kompres dan dekompresi data dikenal sebagai codec, kependekan dari "kompresor - decompressor".
Sebagai kecepatan prosesor, tingkat transmisi data, dan kapasitas hard drive dan media penyimpanan lainnya telah meningkat, motivasi untuk mengompresi data audio telah menurun. Untuk data penelitian, tidak ada alasan untuk menggunakan kompresi, pasti tidak kompresi lossy. Jika Anda khawatir dengan ruang yang diambil oleh rekaman Anda sendiri, berikut adalah beberapa saran untuk meminimalkan penyimpanan sementara menghindari kompresi lossy. Namun, data audio komersial, seperti musik, masih sering dikompresi dalam rangka meningkatkan jumlah yang akan muat di pemain portabel dan mengurangi waktu yang dibutuhkan untuk download.
Lossless Compression
Teknik kompresi lossless tidak banyak digunakan karena jumlah kompresi yang mereka hasilkan relatif kecil. Tingkat kompresi yang diperoleh tergantung pada isi file.Dengan pidato, kompresi lossless mengurangi ukuran file di terbaik untuk sekitar 25% dari ukuran aslinya, paling buruk sampai sekitar 50%. Tenang musik klasik hampir kompres serta pidato, sedangkan "berisik" musik modern, cenderung untuk kompres buruk, sering menjadi sekitar 75% dari ukuran aslinya. Saat ini, pengguna utama kompresi lossless tampaknya penggemar rekaman konser live. Dua format, FLAC dan SHN (Mempersingkat), sangat populer.
Di daerah seperti penelitian fonetik, penggunaan kompresi lossless yang diinginkan.Mereka menghasilkan data audio harus mempertimbangkan untuk menggunakan salah satu teknik lossless jika mereka akan memampatkan sama sekali. Informasi lebih lanjut tentang kompresi lossless dapat ditemukan di sini.
Kompresi lossy
Ada banyak teknik kompresi lossy, sebagian besar yang sekarang jarang ditemui.Dua teknik kompresi lossy adalah beberapa kepentingan: minidisc dan mp3. Minidisc kompresi ini penting karena recorder minidisc telah digunakan untuk pengumpulan data linguistik. kompresi MP3 adalah penting karena banyak audio didistribusikan dalam bentuk ini.
Minidisc Kompresi
Minidiscs kecil (7cm x 7cm) media penyimpan diperkenalkan oleh Sony pada tahun 1991. Mereka menyediakan penyimpanan data digital pada perangkat jauh lebih murah daripada digital audio tape recorder.
Data audio pada minidiscs dikompresi menggunakan Adaptive Transform Acoustic Coding, biasanya dikenal sebagai ATRAC. Algoritma ATRAC dijelaskan di sini.ATRAC coding kompres data ke sekitar 20% dari ukuran aslinya dengan kehilangan minimal informasi. Audio Minidisc umumnya dianggap "kualitas CD dekat". Karena kompleksitas dari algoritma kompresi, sulit untuk menentukan dengan tepat bagaimana mendistorsi sinyal. Namun, tampak bahwa minidisc kompresi tidak berpengaruh pada pengukuran yang paling fonetik. Jenis-satunya pekerjaan yang kompresi minidisc mungkin bermasalah adalah pengukuran tingkat rendah, komponen frekuensi tinggi dari spektrum, misalnya di frikatif lemah atau semburan berhenti.Perbandingan hati-hati pengukuran forman vokal yang diperoleh dari pidato pidato minidisc terkompresi dan dikompresi oleh Maciej Baranowski mengungkapkan tidak ada perbedaan.
Kompresi MP3
kompresi MP3 secara luas digunakan untuk musik serta untuk pidato streaming melalui internet. MP3 adalah suatu bentuk kompresi MPEG, sebuah standar yang dirancang untuk multimedia, termasuk video serta audio. MPEG singkatan dari Moving Picture Experts Group, sebuah kelompok kerja bersama dari International Standar Organization dan International Electrotechnical Commission. MP3 adalah singkatan untuk "MPEG, Layer 3". MPEG sebenarnya satu set algoritma kompresi, untuk berbagai jenis data dan derajat kompresi. Dari waktu ke waktu versi baru dari standar MPEG dikeluarkan, yang berisi algoritma tambahan untuk menampung data input format baru dan bitrate. Versi ini tidak boleh bingung dengan lapisan. Berbagai standar dapat dibaca di sini.
Untuk informasi lebih lanjut tentang kompresi MPEG, lihat MPEG Audio Web Page.
Kemasan
Ikhtisar
data Audio dapat datang tanpa kemasan sama sekali. File yang berisi data audio hanya dikenal sebagai file mentah. Mereka biasanya berisi terkompresi pulsa modulasi kode mono (PCM) data. Agar dapat menggunakan file-file seperti itu, perlu diketahui, atau mampu mengetahui, laju sampling, resolusi, signedness, dan endianness data.
Bentuk sederhana kemasan terdiri dari header. Ini adalah beberapa informasi di awal ("head") dari file. header biasanya akan berisi satu atau lebih byte, yang dikenal sebagai "angka ajaib", mengidentifikasi jenis file, dan informasi dasar tentang data audio, yakni laju sampling, resolusi, dan jumlah saluran. Header juga dapat mengidentifikasi kompresi yang digunakan, jika ada, dan menentukan aspek kebetulan dalam representasi, misalnya apakah data tersebut ditandatangani atau unsigned. Header juga mungkin menunjukkan jumlah data, yaitu jumlah byte atau sampel yang mengikuti header. Karena pasar yang dominan untuk data audio adalah industri musik, header mungkin berisi informasi seperti judul dan pemain. Format file yang dimaksudkan untuk penelitian mungkin berisi catatan pengolahan data telah mengalami.
Bentuk yang lebih kompleks kemasan memberikan semacam struktur pohon, di mana file terdiri dari "potongan" informasi, masing-masing yang pada gilirannya mungkin mengandung potongan lainnya. The WAVE dan format file AIFF adalah dari jenis ini. format file tersebut biasanya memungkinkan berkas mengandung beberapa bagian data audio, seperti beberapa lagu. Mereka juga dapat menyediakan untuk pencantuman informasi tambahan tentang audio, seperti daftar bermain. Beberapa format file yang dimaksudkan sebagai format file multimedia umum. Oleh karena itu mereka tidak hanya memberikan data audio tapi untuk jenis data lainnya, seperti video, gambar diam, atau animasi.
Common Jenis File
Di sini kita menggambarkan jenis file audio yang paling umum. diskusi di sini juga akan memberikan pembaca gambaran umum baik dari organisasi file audio.
Baku Sound File
File suara yang terdiri dari hanya data audio PCM disebut file suara mentah.Beberapa i perangkat audio o /, perangkat terutama ditujukan untuk penelitian yang lebih tua daripada pasar komersial, menghasilkan file-file tersebut. Mereka tidak lagi sering terlihat.
Sejak file suara baku tidak memiliki header di mana untuk menyimpan informasi, perlu untuk mengetahui tingkat sampling, resolusi, signedness, dan jumlah saluran.Beberapa parameter kadang-kadang dikodekan dalam nama file, tetapi tidak ada konvensi yang benar-benar umum. sufiks Filename kadang-kadang digunakan untuk menyampaikan resolusi dan signedness. Sebagai contoh, akhiran. Sb ini mungkin mengindikasikan bahwa sampel yang terdiri dari satu byte, yaitu, memiliki resolusi 8 bit, dan ditandatangani. Akhiran uw dalam sistem ini. Mengindikasikan bahwa setiap sampel diwakili oleh kata dua-byte, yaitu, memiliki resolusi 16 bit, dan ditandatangani.
AU / File SND
file AU adalah contoh yang baik dari tipe file sederhana yang terdiri dari sebuah header yang diikuti oleh data. Sebenarnya ada dua jenis file AU. akhiran ini. au awalnya digunakan oleh Sun untuk file audio headerless mengandung μ-hukum kompresi audio sampel di 8.000 sampel per detik. Selanjutnya, format yang ada diadopsi. Format SND pada komputer NeXT adalah sama dengan format AU. file AU terdiri dari sebuah header dengan format berikut diikuti dengan sepotong data audio tunggal. Nilai numerik di header harus disimpan dalam format big-endian.
Berikut adalah struktur header file format AU:
Bytes Offset Content
4 0 Magic number: .snd
4 3 Offset of the sound data from the beginning of the file = 23 + N
4 7 Number of bytes of audio data
4 11 Sound format code
4 15 Sampling rate in samples per second
4 19 Number of channels
N 23 Optional text describing data
K 23+N Audio data
Perhatikan bahwa penggunaan lapangan ukuran 4 byte membatasi ukuran data audio ke 4294967295 byte, yang sesuai dengan 13 jam 32 menit audio 16 bit linear PCM mono di CD biasa laju sampling 44.100 sampel per detik.
Perhatikan bahwa penggunaan lapangan ukuran 4 byte membatasi ukuran File GELOMBANG
Apa mungkin adalah format yang paling umum digunakan saat ini adalah format WAVE, biasanya ditandai dengan akhiran. Wav. file GELOMBANG sebenarnya kasus khusus, untuk audio, dari format RIFF untuk file multimedia. Format RIFF adalah standar Microsoft. Spesifikasi lengkap yang terkandung dalam dokumen Microsoft Multimedia Standar Update, Revisi 3.0, 15 April 1994. Salinan bisa di-download di sini. Format RIFF merupakan turunan dari format Interchange Format File yang dikembangkan oleh Electronic Arts.
Ada juga sedikit varian dari format RIFF dikenal sebagai format RIFX. RIFX berbeda dari RIFF di endianess data integer. data RIFF diwajibkan untuk little-endian; RIFX data yang diperlukan untuk menjadi besar-endian. Dalam semua hal lainnya format RIFX identik dengan format RIFF kecuali kenyataan bahwa angka ajaib ini RIFX daripada RIFF. Format RIFF dikembangkan untuk digunakan dengan prosesor Intel.Format RIFX merupakan adaptasi untuk prosesor Motorola, yang memiliki endianness berlawanan.
Penjelasan indah-ilustrasi format WAVE dapat ditemukan di sini
Berikut adalah struktur dari file GELOMBANG sederhana sesuai standar: data audio ke 4294967295 byte, yang sesuai dengan 13 jam 32 menit audio 16 bit linear PCM mono di CD biasa laju sampling 44.100 sampel per detik.
Bytes Content Offset
4 Magic number: RIFF/RIFX 0
4 WAVE chunk size = file size - 8 4
4 WAVE identifier: WAVE 8
4 Format chunk identifier: fmt 12
4 Format chunk size: 16 16
2 Sound format code 20
2 Number of channels 22
4 Sampling rate 24
4 Average data rate in bytes per second 28
2 Bytes per sample*
32
2 Bits per sample*
34
4 Chunk identifier: data 36
4 Chunk length in bytes: N 40
N Audio data 44
Satu kadang-kadang menemukan file sederhana yang tidak sesuai dengan standar.Dalam hal ini, header file segera diikuti dengan data audio. Chunk data pengenal dan panjang potongan yang hilang. file tersebut dapat dikonversi ke dalam format standar RepairWave.
Hal ini dimungkinkan untuk standar-sesuai file GELOMBANG menjadi lebih kompleks.Mereka mungkin mengandung beberapa bagian data, dan mereka mungkin berisi potongan jenis lainnya, seperti daftar putar, daftar isyarat, padding (untuk menyebabkan data audio untuk memulai pada lokasi tertentu), dan informasi teks yang berisi tentang asal-usul file tersebut dan pengolahan telah mengalami. Hal ini dibolehkan GELOMBANG file untuk menyertakan jenis potongan non-standar. Sesuai standar software hanya akan melewatkan potongan yang tidak tahu bagaimana menangani.
File AIFF
AIFF format yang secara luas digunakan pada komputer Apple dan, sebagai hasilnya, dalam perangkat lunak pengolahan profesional audio. Seperti, RIFF / GELOMBANG, AIFF ("Audio Interchange File Format") merupakan turunan dari format Interchange Format File yang dikembangkan oleh Electronic Arts. Ia lebih sederhana dari RIFF / format WAVE di tersebut memang ditujukan hanya untuk data audio dan mendukung berbagai format yang lebih kecil data audio.
Sebuah file AIFF terdiri dari header yang diikuti oleh satu atau lebih "potongan".Sebuah file AIFF suara minimal itu terdiri dari header dan sepotong suara. Selain suara potongan, berbagai potongan lain yang mungkin, termasuk penanda posisi dalam data gelombang, perintah synthesizer MIDI, dan komentar.
Data audio dalam file AIFF selalu terkompresi PCM. Header berisi informasi tentang jumlah saluran, sampling rate, dan resolusi. Data audio, seperti semua data integer dalam format ini, disimpan dalam format big-endian.
Informasi lebih lanjut dapat ditemukan di sini.
MP3 File
File MP3 ditandai terutama oleh pemahaman mereka, seperti dijelaskan di atas.Namun, tidak seperti beberapa jenis lain data terkompresi, yang dapat dikemas dalam berbagai cara, data dikompresi MP3 biasanya dikemas dalam cara tertentu.Hal ini tentu saja mungkin untuk data menanamkan dalam format MP3, yaitu, lengkap dengan header frame, dalam satu jenis paket. Sebagai contoh, sebuah file WAVE mungkin berisi data MP3. Dalam hal ini, chunk data terdiri dari suara MP3 terkompresi ditambah header frame. Kenyataan bahwa data terdiri dari data MPEG ditunjukkan oleh nilai 80 untuk kode format data.
Sebuah file MP3 terdiri dari satu set frame data. Setiap frame data dimulai dengan sebuah header byte empat. Header bisa diikuti oleh dua byte data Cyclic Redundancy Check (untuk mendeteksi kesalahan / koreksi), ditandai dengan penetapan 16 bit header. Sisa dari frame berisi data audio. Dalam sebuah file MP3 murni, tidak ada header file secara keseluruhan, meskipun mungkin ada satu jika data MP3 yang tertanam di dalam paket yang lain.
Penjelasan, baik rinci tentang format file MP3 dapat ditemukan di sini.
OGG File
Ogg Vorbis adalah format audio baru dimaksudkan terutama untuk musik. Hal ini kira-kira sebanding dengan format MP3, tetapi non-proprietary dan open source. Ogg Vorbis terdiri dari algoritma kompresi dan format file. Algoritma kompresi adalah algoritma kompresi persepsi, seperti ATRAC dan MP3. Hal ini dilaporkan suara yang lebih baik daripada MP3 pada tingkat bit yang lebih rendah.
Format file adalah sedikit berbeda dari yang lain telah kita bahas. Sebuah file ogg atau bitstream harus dimulai dengan tiga paket header:
1. Header identifikasi;
2. Header komentar;
3. Header setup;
Setiap paket header dimulai dengan enam "vorbis" urutan byte. Header identifikasi berisi informasi tentang versi Ogg Vorbis dan sifat dasar dari audio, seperti sampling rate. Header berisi informasi rinci pengaturan untuk digunakan oleh decoder. Header komentar terdiri dari daftar string, masing-masing berisi nama field dan nilai string yang dipisahkan oleh tanda sama. Nama field harus terdiri dari karakter ASCII non-kontrol. Nilai lapangan sewenang-wenang UTF-8 string. Standar ini mendefinisikan satu set nama field standar seperti "TITLE", "DATE", dan "PENGARANG"; nama field
tambahan dapat digunakan.
Spesifikasi format ogg dapat dibaca on-line di sini atau download sebagai file PDF di sini. Informasi lebih lanjut dan perangkat lunak dapat diperoleh dari Ogg Vorbis Proyek.
RAM File
Domba jantan ekstensi atau ra umumnya digunakan untuk file Real Audio. Ini digunakan untuk streaming audio. Sebuah file RAM adalah file teks biasa setiap baris yang berisi URL dari file audio. URL tidak hanya berisi lokasi dari file audio, tetapi parameter yang akan dilewatkan ke program yang memainkan audio streaming. Tidak ada format audio RAM tertentu. File audio yang URL titik mungkin dalam format yang didukung oleh pemain, misalnya MP3. Informasi tentang Real Audio dapat ditemukan di sini.
Jika Anda perlu untuk men-download file audio yang tercantum dalam file RAM, Anda mungkin menemukan curl berguna. Dalam beberapa kasus, adalah masalah untuk men-download file audio. Dalam hal ini, Anda dapat memutar audio streaming dan menangkap menggunakan vsound.
Bekerja Dengan File Audio
Konversi Satu Format untuk lain
sox dapat mengkonversi format audio yang paling umum. (Pastikan untuk mendapatkan versi saat Sox ada setidaknya satu ketinggalan jaman, dahulu resmi Sox halaman web masih Facebook [http://www.spies.com/Sox/].. Situs web ini situs Sourceforge.) Sebuah tutorial tentang penggunaan sox dapat ditemukan di sini.
Salah satu format yang sox tidak menangani adalah MPEG. Anda dapat menggunakan pemutar mpeg mpg123 untuk mengubah MPEG ke format baku (16 bit PCM stereo linier, urutan byte asli) dengan menggunakan flag s-perintah baris untuk mengirim output ke standard output bukan kartu suara. Anda kemudian dapat menggunakan sox untuk mengkonversi data mentah ke format lain. Sebagai contoh, urutan dari perintah akan mengkonversi MP3 dengan tingkat sampling dari 22.050 ke format WAVE:
mpg123-s foo.mp3> foo.raw
sox-w-s-r 22050-c 1 foo.wav foo.raw
Format yang lain sox tidak menangani adalah format ogg. The oggdec Program, bagian dari paket vorbistools didownload dari website Ogg Vorbis Proyek, ogg mengkonversi format WAVE atau PCM mentah.
Sebuah alat serupa sndfile-mengkonversi, yang merupakan bagian dari paket libsndfile. libsndfile adalah library yang memungkinkan programmer C untuk membaca dan menulis berbagai format file audio. sndfile-mengkonversi disediakan sebagai demonstrasi penggunaan perpustakaan. Hal ini ditemukan dalam direktori contoh distribusi libsndfile. Ia tidak memiliki semua fungsi sox, seperti efek suara, namun memiliki sintaks sederhana. Hal ini juga menangani beberapa format data yang sox tidak, seperti floating point data.
Alat lain yang berguna adalah ffmpeg. Hal ini ditujukan terutama untuk mengkonversi format video, tapi karena file video biasanya berisi audio juga, itu juga dapat mengkonversi berbagai media format audio, terutama format yang digunakan untuk tujuan komersial dan tidak biasanya ditemui dalam penelitian linguistik.
Stream audio dapat diambil dari file video RealMedia (ekstensi biasanya rm.) Menggunakan RealMedia Analyzer, yang tersedia untuk GNU / Linux, OS / 2, MS Windows, dan DOS.
Solusi yang lebih umum tersedia pada sistem GNU / Linux untuk situasi di mana Anda memiliki kemampuan untuk memutar file audio, tetapi tidak memiliki program yang dapat ekstrak. Situasi ini muncul ketika sebuah codec berpemilik hanya tersedia dalam bentuk biner atau hanya sebagai bagian dari program closed-source.vsound berkaitan dengan situasi ini dengan mencegat panggilan untuk membuka / dev / dsp, file device umumnya digunakan sebagai antarmuka ke kartu suara, dan menggantikannya dengan file yang normal untuk kartu suara. Hasilnya adalah bahwa data audio decode yang telah dikirim ke kartu suara adalah bukan ditulis ke dalam file.
Memperoleh Informasi Tentang File tersebut
Sebagaimana dibahas di atas, akhiran nama file sering memberikan informasi tentang format file audio. Utilitas file mengakui banyak format file audio. (Catatan bahwa program file yang disediakan dengan beberapa versi Unix, seperti SunOs, lebih rendah daripada yang satu ini.) Program sndfile-info, disediakan sebagai demonstrasi penggunaan perpustakaan libsndfile, akan memberikan informasi rinci tentang file suara di berbagai format. InfoWave memberikan penjelasan rinci tentang isi dari file WAVE.
Sumber : http://billposer.org/Linguistics/Computation/LectureNotes/AudioData.html
Audio data datang dalam berbagai bentuk kadang-kadang membingungkan. Jumlah cara mendasar di mana suara dapat diwakili sebenarnya cukup kecil. Berbagai jenis file audio adalah karena fakta bahwa ada cukup beberapa pendekatan untuk data audio mengompresi dan sejumlah cara yang berbeda dari kemasan data. Kami pertama-tama menjelaskan bagaimana data audio sendiri diwakili, maka bagaimana itu dibungkus ke file. Orang sering berbicara tentang format audio sembarangan tanpa membedakan antara format data dan format file, tetapi sangat penting untuk menjaga perbedaan ini dalam pikiran banyak format file dapat berisi tanggal direpresentasikan di lebih dari satu cara dan sebagian besar representasi data dapat dikemas di lebih dari satu format file. Mengatakan bahwa file suara adalah ". Wav" file mengatakan apa-apa tentang format data audio. Demikian pula, mengatakan bahwa file berisi data PCM mengatakan apa-apa tentang format file.
Perwakilan dari Sound itu Sendiri
Fundamental Aspek Representasi Sound
Suara terdiri dari variasi terdengar dalam tekanan udara. Mikrofon mengubah variasi tekanan udara menjadi tegangan yang bervariasi. Untuk mewakili suara digital, kita harus mengkonversi tegangan ini bervariasi menjadi serangkaian angka yang mewakili amplitudonya. Proses ini dikenal sebagai konversi analog-ke-digital. Data Audio terdiri dari angka tersebut dikatakan dalam format modulasi kode pulsa, disingkat PCM. Audio data sering disimpan dalam format lain, biasanya dalam rangka untuk kompres itu, namun hampir selalu dimulai dalam format PCM.
Angka-angka yang dihasilkan oleh konverter analog-ke-digital, secara umum, sewenang-wenang. Meskipun data tekanan asli memiliki dimensi dynes per sentimeter persegi, hubungan antara nilai-nilai tekanan aktual dan nomor-nomor yang dihasilkan oleh konversi analog-ke-digital ditentukan baik oleh karakteristik respon mikrofon dan oleh preamplifier di analog-ke -digital converter. Kita jarang mengetahui sifat yang tepat baik mikrofon atau konverter analog-ke-digital. Selanjutnya, kita biasanya menyesuaikan konverter analog-ke-digital, atau preamplifier yang mendahului, untuk memilih tingkat input yang terbaik. Kami ingin menggunakan rentang dinamis terbesar mungkin, sehingga dapat mengambil keuntungan dari detail penuh sinyal, sementara pada saat yang sama memastikan bahwa kami tidak melampaui batas dari elektronik dan kliping menghindari, yang mendistorsi sinyal.Oleh karena itu, hampir tidak pernah terjadi bahwa kita tahu berapa banyak dynes per sentimeter persegi nomor mewakili. Untuk sebagian besar tujuan ini tidak masalah karena semua kita peduli tentang adalah amplitudo relatif dari sinyal. tingkat tekanan absolut yang menarik untuk beberapa pekerjaan di psychophysics pendengaran. Dalam hal ini, perlu untuk mengkalibrasi sistem dan memperbaiki parameter (seperti keuntungan preamplifier).
Tekanan udara variasi, dan oleh karena itu tegangan yang sesuai yang dihasilkan oleh mikrofon, yang terus menerus dalam dua-dimensi. Artinya, nilai-nilai bervariasi terus menerus, dan mereka ada di setiap titik waktu. Namun, sistem digital seperti komputer tidak dapat secara langsung merupakan sinyal kontinyu. Sebaliknya, ia harus mengukur sinyal pada himpunan terhingga kali diskrit. Ini dikenal sebagai sampling. Furtheremore, harus membuat penggunaan jumlah terbatas tingkat amplitudo diskrit. Ini dikenal sebagai kuantisasi. Jumlah level yang digunakan dikenal sebagai resolusi. Resolusi biasanya dinyatakan dalam bit, yaitu, sebagai logaritma-2 dasar tentang jumlah sebenarnya. Sebuah sistem dengan resolusi 8 bit memanfaatkan 2 ^ 8 = 256 level. Sebuah sistem dengan resolusi 16 bit memanfaatkan 2 ^ 16 = 65.536 level. Tingkat sampling dan resolusi menentukan kualitas representasi digital dari suara. "CD-kualitas" suara memiliki resolusi 16 bit dan tingkat sampling dari 44.100 sampel per detik.
Berikut ini adalah terus menerus gelombang:
dan di sini adalah representasi sampel dan terkuantisasi itu:
Sampling Rate
Tingkat pengambilan sampel adalah jumlah kali per detik bahwa amplitudo dari sinyal diukur dan memiliki dimensi sampel per detik. Semakin tinggi sampling rate, semakin akurat sinyal sampel akan mewakili sinyal asli. Pemilihan sampling rate ditentukan oleh Teorema Sampling Nyquist. Teorema ini menyatakan bahwa jika frekuensi maksimum di mana sinyal asli mengandung energi adalah F, maka jika sampel pada tingkat yang ketat lebih besar dari 2F sampel per detik, maka akan mungkin untuk merekonstruksi sinyal asli sempurna dari sinyal sampel. Dengan kata lain, sinyal sampel akan berisi semua informasi dalam sinyal asli.
Penting untuk dicatat bahwa laju sampling harus benar-benar lebih besar dari 2F.Sampling pada tingkat tepat 2F dapat mengakibatkan kesalahan. Sebagai contoh, anggaplah bahwa sinyal asli adalah gelombang sinus frekuensi F. Jika kita sampel pada frekuensi 2F, dengan sampel pertama pada waktu 0, semua contoh kami akan memiliki nilai 0. Gelombang sinus yang asli tidak bisa direkonstruksi dari seperti sinyal sampel. Hal ini mudah dilihat dalam ilustrasi berikut. Semua menunjukkan empat 1Hz gelombang sinus. Dua di sebelah kiri memiliki fase 0. Dua di sebelah kanan memiliki fase π. Kedua atas memiliki amplitudo 1.0. Dua bawah memiliki amplitudo 2.0. Jika kita sampel di dua sampel per detik dengan offset 0, semua contoh kami akan 0 pada semua empat kasus. Sinyal sampel tidak akan berisi informasi yang diperlukan untuk memutuskan mana dari empat sinyal asli untuk merekonstruksi.
Furthermore, teorema Nyquist didasarkan pada asumsi bahwa sinyal asli panjang tak terhingga. Jika tidak, sampling di lebih dari laju Nyquist dari 2F belum tentu mengizinkan reconsruction sempurna. Jika tingkat sampling hanya sedikit lebih besar dari tingkat Nyquist, kenaikan mungkin tidak menggeser titik sampling di atas cukup jauh untuk membuat nilai terkuantisasi berbeda. Perhatikan lagi contoh kita dari gelombang sinus. Mari kita anggap bahwa frekuensi adalah 1000 Hz. Jika kita sampel pada tingkat 2000 sampel per detik kita mungkin berakhir dengan setiap sampel sama dengan 0. Misalkan kita sampel pada tingkat tahun 2001 sampel per detik, yang secara teknis satsifies kriteria Nyquist. Jika sinyal cukup panjang, bahkan jika sampel pertama berada pada nol, beberapa sampel akan menjadi jarak yang signifikan dari nol dan akan ada informasi yang cukup untuk merekonstruksi sinyal.Tetapi jika sinyal cukup pendek, akan diambil sampel pada titik-titik dimana nilai yang begitu dekat dengan nol yang mungkin tidak dibedakan dari nol ketika terkuantisasi. Akibatnya, untuk sinyal pendek perlu menggunakan tingkat sampling secara signifikan lebih tinggi daripada frekuensi Nyquist.
Intuitif mungkin tampak bahwa jika suatu sinyal diambil pada tingkat terlalu rendah akibat akan menjadi bahwa komponen frekuensi yang lebih tinggi akan hilang, tetapi bahwa komponen frekuensi yang lebih rendah akan terpengaruh. Sayangnya, hal ini tidak terjadi. Sebaliknya, apa yang terjadi adalah bahwa energi dari frekuensi yang lebih tinggi diperlakukan seolah-olah berada di frekuensi yang lebih rendah; energi ditambahkan ke energi benar-benar hadir pada frekuensi yang lebih rendah. distorsi ini dikenal sebagai aliasing.
Dalam rangka untuk mendigitalkan sinyal tanpa bahaya aliasing, adalah kebiasaan untuk lulus melalui sebuah low-pass filter pertama dalam rangka untuk menghilangkan energi apapun di atas frekuensi Nyquist. Sebagai contoh, jika kita tertarik pada energi hingga 8Khz, kita dapat sampel pada frekuensi sedikit lebih dari 16.000 sampel per detik, setelah menyaring energi di atas 8Khz. Namun, realisasi fisik low-pass filter tidak cukup dengan memberikan 100% dari energi yang di bawah frekuensi cutoff dan menghilangkan semua energi di atasnya. Penurunan energi di atas frekuensi cutoff nominal bertahap. Jika kita menggunakan filter dengan cutoff nominal 8Khz, kita mungkin masih memiliki energi yang signifikan di daerah sedikit di atas 8Khz. Oleh karena itu, agar aman, jika kita tahu bahwa kita tertarik energi hingga F frekuensi, kami menggunakan low-pass filter dengan cutoff nominal F dan kita memilih tingkat sampling secara signifikan atas 2F. Dengan begitu, laju sampling kami akan cukup tinggi bahwa setiap energi di wilayah tepat di atas frekuensi cutoff nominal tidak akan alias. Praktek yang umum adalah dengan menggunakan tingkat sampling 2.5F. Konverter analog-ke-digital lama yang memungkinkan pilihan tarif sampling harus memiliki filter analog variabel sebelum digitizer. Saat ini, pengolahan sinyal hardware sangat cepat dan murah bahwa pendekatan yang biasa adalah dengan menggunakan low-pass filter dengan frekuensi cutoff tetap, maka sampel pada tingkat tinggi. Sinyal sampel ini kemudian downsampled (dikonversi ke tingkat sampling yang lebih rendah) setelah digital low-pass filter.
Tingkat sampling yang paling umum saat ini adalah 44.100 sampel per detik. Ini adalah tingkat pengambilan sampel yang digunakan untuk CD musik. Karena pasar musik jauh lebih besar dari yang lain (seperti pasar untuk penelitian fonetik akustik), off-the-rak perangkat keras dan perangkat lunak dirancang untuk spesifikasinya.Tingkat sampling memungkinkan untuk konten frekuensi sampai sedikit di atas 20kHz, yang mencakup seluruh rentang bahwa manusia bisa mendengar. Memang, kebanyakan orang dewasa tidak dapat mendengar frekuensi hampir yang tinggi.
Ketika bahan digitalisasi untuk penelitian linguistik, Anda dapat menghemat ruang dengan menggunakan tingkat sampling yang lebih rendah, mengatakan 22.050 sampel per detik. Semua informasi linguistik dalam pidato di bawah 8KHz, sehingga tingkat ini lebih dari cukup.
Sampling rate lain yang kadang-kadang terlihat adalah 8.000 sampel per detik.Angka ini sesuai (menggunakan pengali sebesar 2,5 daripada 2,0 dibahas di atas) untuk frekuensi maksimum 3.2KHz, yang merupakan batas atas dari band telepon.Tingkat ini adalah karena itu cocok untuk aplikasi yang melibatkan pembicaraan telepon. Hal ini terlalu rendah untuk pidato berkualitas baik atau musik, dan tidak diterima untuk penelitian fonetik kebanyakan.
Resolusi
Kesalahan yang dihasilkan oleh mengkuantisasi sinyal dikenal sebagai kebisingan kuantisasi. Kualitas sinyal terkuantisasi dapat diukur dengan menghitung rasio signal-to-noise (SNR), di mana kebisingan yang dimaksud adalah noise kuantisasi. Setiap bit resolusi menambahkan sekitar 6 desibel untuk sinyal-to-noise rasio. Sebuah resolusi 8 bit sehingga menghasilkan suatu SNR sekitar 48dB. Sebuah resolusi 16 bit, mampu memberikan SNR sekitar 96dB. Beberapa digitizers tua, seperti yang digunakan pada PC dan Macintoshen pada 1980-an dan awal 1990-an, hanya menghasilkan resolusi 8 bit, sehingga terkadang menemukan file lama suara 8-bit.Resolusi 16 bit ini dipertimbangkan diidamkan untuk tujuan seperti penelitian fonetik akustik dan musik berkualitas profesional. Hampir semua digitizers yang digunakan saat ini memberikan resolusi 16 bit atau lebih tinggi.
Pengaruh kuantisasi dapat dipahami secara intuitif dengan membandingkan sinyal terkuantisasi dengan sinyal kontinyu asli. Berikut ini adalah sinyal kontinyu dilapis dengan kuantisasi 2-bit:
Ketika digitalisasi sinyal analog, penting untuk mengatur tingkat input digitizer dengan benar. Ini berarti bahwa nilai-nilai ekstrim dari sinyal input harus hanya dalam kisaran digitizer. Jika mereka melebihi jangkauan digitizer, hasilnya akan menjadi bentuk distorsi yang dikenal sebagai kliping. overloading signifikan juga dapat merusak digitizer. Di sisi lain, jika tingkat input dipasang terlalu rendah, hasilnya akan efektif resolusi daripada yang lebih kecil optimal. Jika digitizer telah tersedia 65.536 tingkat tetapi sinyal hanya berkisar lebih dari setengah rentang masukan, hanya setengah dari tingkat yang digunakan. Akibatnya sinyal digital dengan resolusi 15 bit bukan 16 yang tersedia.
Saluran
Sebuah aliran tunggal suara, seperti yang dari rekaman mono biasa, merupakan satu saluran. Stereo membutuhkan dua saluran. musik Quadriphonic memerlukan empat saluran. Rekaman dilakukan di studio musik profesional mungkin memiliki banyak saluran sebelum pencampuran, satu untuk masing-masing instrumen dan penyanyi.Dalam prakteknya, nilai-nilai umum adalah satu dan dua.
Kecelakaan Representasi
Signedness
Bilangan bulat yang digunakan untuk merepresentasikan nilai amplitudo dapat ditandatangani atau unsigned. Sejumlah ditandatangani adalah salah satu yang mungkin baik positif atau negatif. Sejumlah unsigned mungkin tidak akan pernah negatif. Apakah nomor yang digunakan adalah unsigned ditandatangani atau tidak berpengaruh pada resolusi. Jumlah tingkat amplitudo yang berbeda tetap sama.Sebagai contoh, di tingkat representasi mesin biasa bilangan bulat (dikenal sebagai representasi 2's-melengkapi), 16 bit masuk bilangan bulat berkisar antara -32768 dan 32767. 16 bit unsigned integer rentang nilai dari 0 sampai 65.535. Dalam kedua kasus jumlah tingkat amplitudo adalah 65.536. Oleh karena itu, tidak terlalu penting apakah representasi terdaftar atau unsigned digunakan, tetapi untuk beroperasi pada nilai-nilai benar perlu untuk mengetahui representasi dimaksudkan. Misalnya, pola bit 1111111111111111 merupakan nilai 65.535, nilai maksimum, sebagai unsigned integer tetapi -1, di tengah rentang amplitudo, sebagai pelengkap 2's-integer ditandatangani.
Endianness
Ingat dari penjelasan kami sebelumnya endianness yang menafsirkan rangkaian komputer yang berbeda multibyte dengan cara yang berbeda. Sejak 16 bit integer mengambil dua byte, mereka dipengaruhi oleh endianness. Software Audio umumnya akan mengkonversi data urutan byte yang salah yang diperlukan. Anda hanya akan perlu berurusan dengan endian-ness jika Anda menulis perangkat lunak pemrosesan level rendah audio atau jika Anda mengalami data audio mentah sehingga perangkat lunak Anda tidak dapat menentukan urutan byte data dari header. Jika Anda menemukan sebuah file mentah dengan urutan byte yang salah, harus mudah untuk mendeteksi karena akan terdengar seperti kebisingan.
Kompresi
Audio data memakan banyak ruang, setidaknya dibandingkan dengan teks. Sebuah single kedua audio compact disc memakan sekitar ruang sebanyak 15.000 kata dari teks ASCII, yaitu, 60 halaman dari sebuah buku khas. Berikut adalah grafik yang menunjukkan jumlah ruang yang ditempati oleh jangka waktu yang berbeda suara mono pada tingkat sampling yang berbeda. Sebuah disk 10GB, misalnya, akan mengadakan hanya sekitar 31 jam audio pada tingkat-CD.
1 second 1 minute 1 hour
44,100 samples/second 16 bit l88.2KB 5.3MB 317.5MB
22,050 samples/second 16 bit 44.1KB 2.6MB 158.8MB
16,000 samples/second 16 bit 32.0KB 1.9MB 115.2MB
Perhatikan bahwa dalam tabel ini KB singkatan dari 1.000 byte dan untuk MB 1.000.000 byte. Ini adalah definisi yang digunakan oleh International Electrotechnical Commission, badan internasional yang menetapkan standar di bidang elektronik dan listrik. Disk produsen menggunakan unit untuk menggambarkan ukuran produk mereka. Sebaliknya, programer komputer umumnya menggunakan KB berarti 1.024 byte dan MB berarti 1024 * 1024 = 1.048.576 byte.
Karena data audio menempati banyak ruang, ada telah lama motivasi untuk kompres itu. Memang, kompresi audio mendahului penggunaan komputer digital dan digital transmisi data. Bell Laboratories melakukan penelitian perintis pada lokasi informasi dalam pidato dalam domain frekuensi sehingga AT & T bisa pak karena banyak percakapan telepon ke satu baris mungkin. Penelitian ini menunjukkan bahwa sebagian besar informasi dalam pidato terletak di antara 300 dan 3.000 Hz. Itu sebabnya, bahkan hari ini, sirkuit telepon menyaring energi semua di luar band ini.
teknik kompresi terdiri dari dua jenis dasar: lossless dan lossy. Sebuah teknik kompresi lossless adalah salah satu yang menghasilkan sinyal dikompresi dari mana sinyal asli dapat direkonstruksi dengan sempurna. Tidak ada informasi yang hilang sebagai akibat dari kompresi. Sebuah teknik kompresi lossy adalah salah satu yang membuang informasi. Sinyal asli tidak dapat direkonstruksi sempurna dari sinyal dikompresi dengan metode lossy.
Sebuah program atau perangkat keras yang kompres dan dekompresi data dikenal sebagai codec, kependekan dari "kompresor - decompressor".
Sebagai kecepatan prosesor, tingkat transmisi data, dan kapasitas hard drive dan media penyimpanan lainnya telah meningkat, motivasi untuk mengompresi data audio telah menurun. Untuk data penelitian, tidak ada alasan untuk menggunakan kompresi, pasti tidak kompresi lossy. Jika Anda khawatir dengan ruang yang diambil oleh rekaman Anda sendiri, berikut adalah beberapa saran untuk meminimalkan penyimpanan sementara menghindari kompresi lossy. Namun, data audio komersial, seperti musik, masih sering dikompresi dalam rangka meningkatkan jumlah yang akan muat di pemain portabel dan mengurangi waktu yang dibutuhkan untuk download.
Lossless Compression
Teknik kompresi lossless tidak banyak digunakan karena jumlah kompresi yang mereka hasilkan relatif kecil. Tingkat kompresi yang diperoleh tergantung pada isi file.Dengan pidato, kompresi lossless mengurangi ukuran file di terbaik untuk sekitar 25% dari ukuran aslinya, paling buruk sampai sekitar 50%. Tenang musik klasik hampir kompres serta pidato, sedangkan "berisik" musik modern, cenderung untuk kompres buruk, sering menjadi sekitar 75% dari ukuran aslinya. Saat ini, pengguna utama kompresi lossless tampaknya penggemar rekaman konser live. Dua format, FLAC dan SHN (Mempersingkat), sangat populer.
Di daerah seperti penelitian fonetik, penggunaan kompresi lossless yang diinginkan.Mereka menghasilkan data audio harus mempertimbangkan untuk menggunakan salah satu teknik lossless jika mereka akan memampatkan sama sekali. Informasi lebih lanjut tentang kompresi lossless dapat ditemukan di sini.
Kompresi lossy
Ada banyak teknik kompresi lossy, sebagian besar yang sekarang jarang ditemui.Dua teknik kompresi lossy adalah beberapa kepentingan: minidisc dan mp3. Minidisc kompresi ini penting karena recorder minidisc telah digunakan untuk pengumpulan data linguistik. kompresi MP3 adalah penting karena banyak audio didistribusikan dalam bentuk ini.
Minidisc Kompresi
Minidiscs kecil (7cm x 7cm) media penyimpan diperkenalkan oleh Sony pada tahun 1991. Mereka menyediakan penyimpanan data digital pada perangkat jauh lebih murah daripada digital audio tape recorder.
Data audio pada minidiscs dikompresi menggunakan Adaptive Transform Acoustic Coding, biasanya dikenal sebagai ATRAC. Algoritma ATRAC dijelaskan di sini.ATRAC coding kompres data ke sekitar 20% dari ukuran aslinya dengan kehilangan minimal informasi. Audio Minidisc umumnya dianggap "kualitas CD dekat". Karena kompleksitas dari algoritma kompresi, sulit untuk menentukan dengan tepat bagaimana mendistorsi sinyal. Namun, tampak bahwa minidisc kompresi tidak berpengaruh pada pengukuran yang paling fonetik. Jenis-satunya pekerjaan yang kompresi minidisc mungkin bermasalah adalah pengukuran tingkat rendah, komponen frekuensi tinggi dari spektrum, misalnya di frikatif lemah atau semburan berhenti.Perbandingan hati-hati pengukuran forman vokal yang diperoleh dari pidato pidato minidisc terkompresi dan dikompresi oleh Maciej Baranowski mengungkapkan tidak ada perbedaan.
Kompresi MP3
kompresi MP3 secara luas digunakan untuk musik serta untuk pidato streaming melalui internet. MP3 adalah suatu bentuk kompresi MPEG, sebuah standar yang dirancang untuk multimedia, termasuk video serta audio. MPEG singkatan dari Moving Picture Experts Group, sebuah kelompok kerja bersama dari International Standar Organization dan International Electrotechnical Commission. MP3 adalah singkatan untuk "MPEG, Layer 3". MPEG sebenarnya satu set algoritma kompresi, untuk berbagai jenis data dan derajat kompresi. Dari waktu ke waktu versi baru dari standar MPEG dikeluarkan, yang berisi algoritma tambahan untuk menampung data input format baru dan bitrate. Versi ini tidak boleh bingung dengan lapisan. Berbagai standar dapat dibaca di sini.
Untuk informasi lebih lanjut tentang kompresi MPEG, lihat MPEG Audio Web Page.
Kemasan
Ikhtisar
data Audio dapat datang tanpa kemasan sama sekali. File yang berisi data audio hanya dikenal sebagai file mentah. Mereka biasanya berisi terkompresi pulsa modulasi kode mono (PCM) data. Agar dapat menggunakan file-file seperti itu, perlu diketahui, atau mampu mengetahui, laju sampling, resolusi, signedness, dan endianness data.
Bentuk sederhana kemasan terdiri dari header. Ini adalah beberapa informasi di awal ("head") dari file. header biasanya akan berisi satu atau lebih byte, yang dikenal sebagai "angka ajaib", mengidentifikasi jenis file, dan informasi dasar tentang data audio, yakni laju sampling, resolusi, dan jumlah saluran. Header juga dapat mengidentifikasi kompresi yang digunakan, jika ada, dan menentukan aspek kebetulan dalam representasi, misalnya apakah data tersebut ditandatangani atau unsigned. Header juga mungkin menunjukkan jumlah data, yaitu jumlah byte atau sampel yang mengikuti header. Karena pasar yang dominan untuk data audio adalah industri musik, header mungkin berisi informasi seperti judul dan pemain. Format file yang dimaksudkan untuk penelitian mungkin berisi catatan pengolahan data telah mengalami.
Bentuk yang lebih kompleks kemasan memberikan semacam struktur pohon, di mana file terdiri dari "potongan" informasi, masing-masing yang pada gilirannya mungkin mengandung potongan lainnya. The WAVE dan format file AIFF adalah dari jenis ini. format file tersebut biasanya memungkinkan berkas mengandung beberapa bagian data audio, seperti beberapa lagu. Mereka juga dapat menyediakan untuk pencantuman informasi tambahan tentang audio, seperti daftar bermain. Beberapa format file yang dimaksudkan sebagai format file multimedia umum. Oleh karena itu mereka tidak hanya memberikan data audio tapi untuk jenis data lainnya, seperti video, gambar diam, atau animasi.
Common Jenis File
Di sini kita menggambarkan jenis file audio yang paling umum. diskusi di sini juga akan memberikan pembaca gambaran umum baik dari organisasi file audio.
Baku Sound File
File suara yang terdiri dari hanya data audio PCM disebut file suara mentah.Beberapa i perangkat audio o /, perangkat terutama ditujukan untuk penelitian yang lebih tua daripada pasar komersial, menghasilkan file-file tersebut. Mereka tidak lagi sering terlihat.
Sejak file suara baku tidak memiliki header di mana untuk menyimpan informasi, perlu untuk mengetahui tingkat sampling, resolusi, signedness, dan jumlah saluran.Beberapa parameter kadang-kadang dikodekan dalam nama file, tetapi tidak ada konvensi yang benar-benar umum. sufiks Filename kadang-kadang digunakan untuk menyampaikan resolusi dan signedness. Sebagai contoh, akhiran. Sb ini mungkin mengindikasikan bahwa sampel yang terdiri dari satu byte, yaitu, memiliki resolusi 8 bit, dan ditandatangani. Akhiran uw dalam sistem ini. Mengindikasikan bahwa setiap sampel diwakili oleh kata dua-byte, yaitu, memiliki resolusi 16 bit, dan ditandatangani.
AU / File SND
file AU adalah contoh yang baik dari tipe file sederhana yang terdiri dari sebuah header yang diikuti oleh data. Sebenarnya ada dua jenis file AU. akhiran ini. au awalnya digunakan oleh Sun untuk file audio headerless mengandung μ-hukum kompresi audio sampel di 8.000 sampel per detik. Selanjutnya, format yang ada diadopsi. Format SND pada komputer NeXT adalah sama dengan format AU. file AU terdiri dari sebuah header dengan format berikut diikuti dengan sepotong data audio tunggal. Nilai numerik di header harus disimpan dalam format big-endian.
Berikut adalah struktur header file format AU:
Bytes Offset Content
4 0 Magic number: .snd
4 3 Offset of the sound data from the beginning of the file = 23 + N
4 7 Number of bytes of audio data
4 11 Sound format code
4 15 Sampling rate in samples per second
4 19 Number of channels
N 23 Optional text describing data
K 23+N Audio data
Perhatikan bahwa penggunaan lapangan ukuran 4 byte membatasi ukuran data audio ke 4294967295 byte, yang sesuai dengan 13 jam 32 menit audio 16 bit linear PCM mono di CD biasa laju sampling 44.100 sampel per detik.
Perhatikan bahwa penggunaan lapangan ukuran 4 byte membatasi ukuran File GELOMBANG
Apa mungkin adalah format yang paling umum digunakan saat ini adalah format WAVE, biasanya ditandai dengan akhiran. Wav. file GELOMBANG sebenarnya kasus khusus, untuk audio, dari format RIFF untuk file multimedia. Format RIFF adalah standar Microsoft. Spesifikasi lengkap yang terkandung dalam dokumen Microsoft Multimedia Standar Update, Revisi 3.0, 15 April 1994. Salinan bisa di-download di sini. Format RIFF merupakan turunan dari format Interchange Format File yang dikembangkan oleh Electronic Arts.
Ada juga sedikit varian dari format RIFF dikenal sebagai format RIFX. RIFX berbeda dari RIFF di endianess data integer. data RIFF diwajibkan untuk little-endian; RIFX data yang diperlukan untuk menjadi besar-endian. Dalam semua hal lainnya format RIFX identik dengan format RIFF kecuali kenyataan bahwa angka ajaib ini RIFX daripada RIFF. Format RIFF dikembangkan untuk digunakan dengan prosesor Intel.Format RIFX merupakan adaptasi untuk prosesor Motorola, yang memiliki endianness berlawanan.
Penjelasan indah-ilustrasi format WAVE dapat ditemukan di sini
Berikut adalah struktur dari file GELOMBANG sederhana sesuai standar: data audio ke 4294967295 byte, yang sesuai dengan 13 jam 32 menit audio 16 bit linear PCM mono di CD biasa laju sampling 44.100 sampel per detik.
Bytes Content Offset
4 Magic number: RIFF/RIFX 0
4 WAVE chunk size = file size - 8 4
4 WAVE identifier: WAVE 8
4 Format chunk identifier: fmt
4 Format chunk size: 16 16
2 Sound format code 20
2 Number of channels 22
4 Sampling rate 24
4 Average data rate in bytes per second 28
2 Bytes per sample*
32
2 Bits per sample*
34
4 Chunk identifier: data 36
4 Chunk length in bytes: N 40
N Audio data 44
Satu kadang-kadang menemukan file sederhana yang tidak sesuai dengan standar.Dalam hal ini, header file segera diikuti dengan data audio. Chunk data pengenal dan panjang potongan yang hilang. file tersebut dapat dikonversi ke dalam format standar RepairWave.
Hal ini dimungkinkan untuk standar-sesuai file GELOMBANG menjadi lebih kompleks.Mereka mungkin mengandung beberapa bagian data, dan mereka mungkin berisi potongan jenis lainnya, seperti daftar putar, daftar isyarat, padding (untuk menyebabkan data audio untuk memulai pada lokasi tertentu), dan informasi teks yang berisi tentang asal-usul file tersebut dan pengolahan telah mengalami. Hal ini dibolehkan GELOMBANG file untuk menyertakan jenis potongan non-standar. Sesuai standar software hanya akan melewatkan potongan yang tidak tahu bagaimana menangani.
File AIFF
AIFF format yang secara luas digunakan pada komputer Apple dan, sebagai hasilnya, dalam perangkat lunak pengolahan profesional audio. Seperti, RIFF / GELOMBANG, AIFF ("Audio Interchange File Format") merupakan turunan dari format Interchange Format File yang dikembangkan oleh Electronic Arts. Ia lebih sederhana dari RIFF / format WAVE di tersebut memang ditujukan hanya untuk data audio dan mendukung berbagai format yang lebih kecil data audio.
Sebuah file AIFF terdiri dari header yang diikuti oleh satu atau lebih "potongan".Sebuah file AIFF suara minimal itu terdiri dari header dan sepotong suara. Selain suara potongan, berbagai potongan lain yang mungkin, termasuk penanda posisi dalam data gelombang, perintah synthesizer MIDI, dan komentar.
Data audio dalam file AIFF selalu terkompresi PCM. Header berisi informasi tentang jumlah saluran, sampling rate, dan resolusi. Data audio, seperti semua data integer dalam format ini, disimpan dalam format big-endian.
Informasi lebih lanjut dapat ditemukan di sini.
MP3 File
File MP3 ditandai terutama oleh pemahaman mereka, seperti dijelaskan di atas.Namun, tidak seperti beberapa jenis lain data terkompresi, yang dapat dikemas dalam berbagai cara, data dikompresi MP3 biasanya dikemas dalam cara tertentu.Hal ini tentu saja mungkin untuk data menanamkan dalam format MP3, yaitu, lengkap dengan header frame, dalam satu jenis paket. Sebagai contoh, sebuah file WAVE mungkin berisi data MP3. Dalam hal ini, chunk data terdiri dari suara MP3 terkompresi ditambah header frame. Kenyataan bahwa data terdiri dari data MPEG ditunjukkan oleh nilai 80 untuk kode format data.
Sebuah file MP3 terdiri dari satu set frame data. Setiap frame data dimulai dengan sebuah header byte empat. Header bisa diikuti oleh dua byte data Cyclic Redundancy Check (untuk mendeteksi kesalahan / koreksi), ditandai dengan penetapan 16 bit header. Sisa dari frame berisi data audio. Dalam sebuah file MP3 murni, tidak ada header file secara keseluruhan, meskipun mungkin ada satu jika data MP3 yang tertanam di dalam paket yang lain.
Penjelasan, baik rinci tentang format file MP3 dapat ditemukan di sini.
OGG File
Ogg Vorbis adalah format audio baru dimaksudkan terutama untuk musik. Hal ini kira-kira sebanding dengan format MP3, tetapi non-proprietary dan open source. Ogg Vorbis terdiri dari algoritma kompresi dan format file. Algoritma kompresi adalah algoritma kompresi persepsi, seperti ATRAC dan MP3. Hal ini dilaporkan suara yang lebih baik daripada MP3 pada tingkat bit yang lebih rendah.
Format file adalah sedikit berbeda dari yang lain telah kita bahas. Sebuah file ogg atau bitstream harus dimulai dengan tiga paket header:
1. Header identifikasi;
2. Header komentar;
3. Header setup;
Setiap paket header dimulai dengan enam "vorbis" urutan byte. Header identifikasi berisi informasi tentang versi Ogg Vorbis dan sifat dasar dari audio, seperti sampling rate. Header berisi informasi rinci pengaturan untuk digunakan oleh decoder. Header komentar terdiri dari daftar string, masing-masing berisi nama field dan nilai string yang dipisahkan oleh tanda sama. Nama field harus terdiri dari karakter ASCII non-kontrol. Nilai lapangan sewenang-wenang UTF-8 string. Standar ini mendefinisikan satu set nama field standar seperti "TITLE", "DATE", dan "PENGARANG"; nama field
tambahan dapat digunakan.
Spesifikasi format ogg dapat dibaca on-line di sini atau download sebagai file PDF di sini. Informasi lebih lanjut dan perangkat lunak dapat diperoleh dari Ogg Vorbis Proyek.
RAM File
Domba jantan ekstensi atau ra umumnya digunakan untuk file Real Audio. Ini digunakan untuk streaming audio. Sebuah file RAM adalah file teks biasa setiap baris yang berisi URL dari file audio. URL tidak hanya berisi lokasi dari file audio, tetapi parameter yang akan dilewatkan ke program yang memainkan audio streaming. Tidak ada format audio RAM tertentu. File audio yang URL titik mungkin dalam format yang didukung oleh pemain, misalnya MP3. Informasi tentang Real Audio dapat ditemukan di sini.
Jika Anda perlu untuk men-download file audio yang tercantum dalam file RAM, Anda mungkin menemukan curl berguna. Dalam beberapa kasus, adalah masalah untuk men-download file audio. Dalam hal ini, Anda dapat memutar audio streaming dan menangkap menggunakan vsound.
Bekerja Dengan File Audio
Konversi Satu Format untuk lain
sox dapat mengkonversi format audio yang paling umum. (Pastikan untuk mendapatkan versi saat Sox ada setidaknya satu ketinggalan jaman, dahulu resmi Sox halaman web masih Facebook [http://www.spies.com/Sox/].. Situs web ini situs Sourceforge.) Sebuah tutorial tentang penggunaan sox dapat ditemukan di sini.
Salah satu format yang sox tidak menangani adalah MPEG. Anda dapat menggunakan pemutar mpeg mpg123 untuk mengubah MPEG ke format baku (16 bit PCM stereo linier, urutan byte asli) dengan menggunakan flag s-perintah baris untuk mengirim output ke standard output bukan kartu suara. Anda kemudian dapat menggunakan sox untuk mengkonversi data mentah ke format lain. Sebagai contoh, urutan dari perintah akan mengkonversi MP3 dengan tingkat sampling dari 22.050 ke format WAVE:
mpg123-s foo.mp3> foo.raw
sox-w-s-r 22050-c 1 foo.wav foo.raw
Format yang lain sox tidak menangani adalah format ogg. The oggdec Program, bagian dari paket vorbistools didownload dari website Ogg Vorbis Proyek, ogg mengkonversi format WAVE atau PCM mentah.
Sebuah alat serupa sndfile-mengkonversi, yang merupakan bagian dari paket libsndfile. libsndfile adalah library yang memungkinkan programmer C untuk membaca dan menulis berbagai format file audio. sndfile-mengkonversi disediakan sebagai demonstrasi penggunaan perpustakaan. Hal ini ditemukan dalam direktori contoh distribusi libsndfile. Ia tidak memiliki semua fungsi sox, seperti efek suara, namun memiliki sintaks sederhana. Hal ini juga menangani beberapa format data yang sox tidak, seperti floating point data.
Alat lain yang berguna adalah ffmpeg. Hal ini ditujukan terutama untuk mengkonversi format video, tapi karena file video biasanya berisi audio juga, itu juga dapat mengkonversi berbagai media format audio, terutama format yang digunakan untuk tujuan komersial dan tidak biasanya ditemui dalam penelitian linguistik.
Stream audio dapat diambil dari file video RealMedia (ekstensi biasanya rm.) Menggunakan RealMedia Analyzer, yang tersedia untuk GNU / Linux, OS / 2, MS Windows, dan DOS.
Solusi yang lebih umum tersedia pada sistem GNU / Linux untuk situasi di mana Anda memiliki kemampuan untuk memutar file audio, tetapi tidak memiliki program yang dapat ekstrak. Situasi ini muncul ketika sebuah codec berpemilik hanya tersedia dalam bentuk biner atau hanya sebagai bagian dari program closed-source.vsound berkaitan dengan situasi ini dengan mencegat panggilan untuk membuka / dev / dsp, file device umumnya digunakan sebagai antarmuka ke kartu suara, dan menggantikannya dengan file yang normal untuk kartu suara. Hasilnya adalah bahwa data audio decode yang telah dikirim ke kartu suara adalah bukan ditulis ke dalam file.
Memperoleh Informasi Tentang File tersebut
Sebagaimana dibahas di atas, akhiran nama file sering memberikan informasi tentang format file audio. Utilitas file mengakui banyak format file audio. (Catatan bahwa program file yang disediakan dengan beberapa versi Unix, seperti SunOs, lebih rendah daripada yang satu ini.) Program sndfile-info, disediakan sebagai demonstrasi penggunaan perpustakaan libsndfile, akan memberikan informasi rinci tentang file suara di berbagai format. InfoWave memberikan penjelasan rinci tentang isi dari file WAVE.
Sumber : http://billposer.org/Linguistics/Computation/LectureNotes/AudioData.html
Komputer Vision
Visi Komputer adalah ilmu dan teknologi mesin yang melihat, di mana lihat dalam hal ini berarti bahwa mesin mampu mengekstrak informasi dari gambar yang diperlukan untuk menyelesaikan tugas tertentu. Sebagai suatu disiplin ilmu, visi komputer berkaitan dengan teori di balik sistem buatan bahwa ekstrak informasi dari gambar. Data gambar dapat mengambil banyak bentuk, seperti urutan video, pandangan dari beberapa kamera, atau data multi-dimensi dari scanner medis.
Sebagai disiplin teknologi, visi komputer berusaha untuk menerapkan teori dan model untuk pembangunan sistem visi komputer. Contoh aplikasi dari visi komputer mencakup sistem untuk:
* Pengendalian proses (misalnya, sebuah robot industri atau kendaraan otonom).
* Mendeteksi peristiwa (misalnya, untuk pengawasan visual atau orang menghitung).
* Mengorganisir informasi (misalnya, untuk pengindeksan database foto dan gambar
urutan).
* Modeling benda atau lingkungan (misalnya, inspeksi industri, analisis citra medis
atau model topografi).
* Interaksi (misalnya, sebagai input ke perangkat untuk interaksi komputer-manusia).
Komputer visi berkaitan erat dengan kajian visi biologis. Bidang studi visi biologis dan model proses fisiologis di balik persepsi visual pada manusia dan hewan lainnya. Komputer visi, di sisi lain, studi dan menggambarkan proses diimplementasikan dalam perangkat lunak dan perangkat keras di belakang sistem visi buatan. pertukaran Interdisipliner antara visi biologi dan komputer telah terbukti bermanfaat bagi kedua bidang.
Komputer visi, dalam beberapa hal, invers grafis komputer. Sementara komputer grafis menghasilkan data gambar dari model 3D, visi komputer sering menghasilkan model 3D dari data citra. Ada juga kecenderungan kombinasi dari dua disiplin, misalnya, sebagaimana dibahas dalam realitas ditambah.
Sub-domain dari visi komputer termasuk adegan rekonstruksi, deteksi event, pelacakan video, pengenalan obyek, belajar, indexing, estimasi gerak, dan pemulihan citra.
Negara seni
Komputer visi adalah bidang beragam dan relatif baru belajar. Pada hari-hari awal komputasi, sulit untuk memproses set bahkan cukup besar data citra. Tidak sampai akhir 1970-an bahwa penelitian lebih terfokus lapangan muncul. Komputer visi mencakup berbagai topik yang sering berhubungan dengan disiplin lain, dan akibatnya tidak ada perumusan standar "masalah visi komputer". Selain itu, tidak ada rumusan standar tentang bagaimana komputer masalah penglihatan harus diselesaikan. Sebaliknya, terdapat banyak sekali metode untuk memecahkan berbagai tugas visi komputer yang terdefinisi dengan baik, dimana metode sering sangat tugas spesifik dan jarang dapat digeneralisir rentang aplikasi yang luas. Banyak metode dan aplikasi yang masih dalam keadaan penelitian dasar, tetapi metode semakin banyak menemukan cara mereka ke produk komersial, di mana mereka sering merupakan bagian dari sistem yang lebih besar yang dapat menyelesaikan tugas-tugas kompleks (misalnya, di bidang medis gambar, atau pengendalian mutu dan pengukuran dalam proses industri). Pada kebanyakan aplikasi praktis visi komputer, komputer adalah pra-diprogram untuk menyelesaikan tugas tertentu, namun metode berdasarkan pembelajaran yang sekarang menjadi semakin umum.
Bidang-bidang terkait
Hubungan antara visi komputer dan berbagai bidang lainnya
Banyak kesepakatan kecerdasan buatan dengan perencanaan otonom atau musyawarah untuk sistem robotical untuk menavigasi melalui lingkungan. Pemahaman yang rinci tentang lingkungan ini diperlukan untuk menavigasi melalui mereka. Informasi tentang lingkungan dapat diberikan oleh sistem visi komputer, bertindak sebagai sensor visi dan memberikan informasi tingkat tinggi tentang lingkungan dan robot. Kecerdasan buatan dan topik-topik berbagi komputer visi lain seperti pengenalan pola dan teknik pembelajaran. Akibatnya, visi komputer kadang-kadang dilihat sebagai bagian dari bidang kecerdasan buatan atau ilmu bidang komputer secara umum.
Fisika merupakan bidang lain yang terkait erat dengan visi komputer. sistem visi Komputer bergantung pada sensor gambar yang mendeteksi radiasi elektromagnetik yang biasanya dalam bentuk baik cahaya tampak atau infra-merah. Sensor dirancang dengan menggunakan fisika solid-state. Proses di mana cahaya merambat dan mencerminkan off permukaan dijelaskan menggunakan optik. sensor gambar canggih bahkan meminta mekanika kuantum untuk memberikan pemahaman lengkap dari proses pembentukan gambar. Selain itu, berbagai masalah pengukuran fisika dapat diatasi dengan menggunakan visi komputer, untuk gerakan misalnya dalam cairan.
Bidang ketiga yang memainkan peran penting adalah neurobiologi, khususnya studi tentang sistem visi biologis. Selama abad terakhir, telah terjadi studi ekstensif dari mata, neuron, dan struktur otak dikhususkan untuk pengolahan rangsangan visual pada manusia dan berbagai hewan. Hal ini menimbulkan gambaran kasar, namun rumit, tentang bagaimana "sebenarnya" sistem visi beroperasi dalam menyelesaikan tugas-tugas visi tertentu yang terkait. Hasil ini telah menyebabkan subfield di dalam visi komputer di mana sistem buatan yang dirancang untuk meniru pengolahan dan perilaku sistem biologi, pada berbagai tingkat kompleksitas. Juga, beberapa metode pembelajaran berbasis komputer yang dikembangkan dalam visi memiliki latar belakang mereka dalam biologi.
Namun bidang lain yang terkait dengan visi komputer pemrosesan sinyal. Banyak metode untuk pemrosesan sinyal satu-variabel, biasanya sinyal temporal, dapat diperpanjang dengan cara alami untuk pengolahan sinyal dua variabel atau sinyal multi-variabel dalam visi komputer. Namun, karena sifat spesifik gambar ada banyak metode dikembangkan dalam visi komputer yang tidak memiliki mitra dalam pengolahan sinyal satu-variabel. Sebuah karakter yang berbeda dari metode ini adalah kenyataan bahwa mereka adalah non-linear yang bersama-sama dengan dimensi-multi sinyal, mendefinisikan subfield dalam pemrosesan sinyal sebagai bagian dari visi komputer.
Selain pandangan yang disebutkan di atas pada visi komputer, banyak topik penelitian yang terkait juga dapat dipelajari dari sudut pandang matematika murni. Sebagai contoh, banyak metode dalam visi komputer didasarkan pada statistik, optimasi atau geometri. Akhirnya, bagian penting dari lapangan dikhususkan untuk aspek pelaksanaan visi komputer, bagaimana metode yang ada dapat diwujudkan dalam berbagai kombinasi perangkat lunak dan perangkat keras, atau bagaimana metode ini dapat dimodifikasi untuk mendapatkan kecepatan pemrosesan tanpa kehilangan terlalu banyak kinerja .
Bidang yang paling erat kaitannya dengan visi komputer pengolahan citra, analisis citra dan visi mesin. Ada yang signifikan tumpang tindih dalam berbagai teknik dan aplikasi yang menutupi. Ini berarti bahwa teknik-teknik dasar yang digunakan dan dikembangkan dalam bidang ini kurang lebih sama, sesuatu yang dapat diartikan sebagai hanya ada satu lapangan dengan nama yang berbeda. Di sisi lain, tampaknya perlu untuk kelompok penelitian, jurnal ilmiah, konferensi dan perusahaan untuk menyajikan atau memasarkan diri sebagai milik khusus untuk salah satu bidang dan, karenanya, berbagai penokohan yang membedakan masing-masing bidang dari yang lain telah disajikan.
Karakterisasi berikut akan muncul yang relevan tetapi tidak harus diambil sebagai universal diterima:
* Pengolahan citra dan analisis citra cenderung untuk fokus pada gambar 2D, bagaimana mengubah satu gambar yang lain, misalnya, dari operasi pixel-bijaksana seperti peningkatan kontras, daerah operasi seperti ekstraksi tepi atau penghapusan noise, atau transformasi geometri seperti memutar gambar. karakterisasi ini menunjukkan bahwa pengolahan gambar / analisis tidak memerlukan asumsi atau menghasilkan interpretasi tentang isi gambar.
* Visi Komputer cenderung untuk berfokus pada adegan 3D diproyeksikan ke satu atau beberapa gambar, misalnya, bagaimana merekonstruksi struktur atau informasi lain tentang adegan 3D dari satu atau beberapa gambar. Komputer visi sering mengandalkan pada asumsi yang lebih kompleks atau kurang tentang adegan digambarkan dalam gambar.
* Visi Mesin cenderung untuk fokus pada aplikasi, terutama di bidang manufaktur, misalnya, visi robot otonom berbasis dan sistem untuk inspeksi berbasis visi atau pengukuran. Ini berarti bahwa teknologi sensor gambar dan teori kontrol sering terintegrasi dengan pengolahan data citra untuk mengontrol robot dan bahwa pemrosesan real-time ditekankan dengan cara implementasi efisien dalam hardware dan software. Hal ini juga menyiratkan bahwa kondisi eksternal seperti pencahayaan dapat dan sering lebih terkontrol dalam visi mesin daripada di visi komputer umum, yang dapat memungkinkan penggunaan algoritma yang berbeda.
* Ada juga bidang pencitraan yang disebut yang terutama berfokus pada proses menghasilkan gambar, tapi kadang-kadang juga berkaitan dengan pengolahan dan analisis gambar. Sebagai contoh, pencitraan medis berisi banyak bekerja pada analisis data gambar dalam aplikasi medis.
* Akhirnya, pengenalan pola adalah bidang yang menggunakan berbagai metode untuk mengekstrak informasi dari sinyal pada umumnya, terutama didasarkan pada pendekatan statistik. Sebuah bagian penting dari bidang ini dikhususkan untuk menerapkan metode ini untuk data citra.
Aplikasi untuk visi computer
Salah satu bidang aplikasi yang paling menonjol adalah computer vision medis atau pengolahan citra medis. Daerah ini dicirikan oleh ekstraksi informasi dari data citra untuk tujuan membuat diagnosis medis pasien. Secara umum, data citra dalam bentuk gambar mikroskop, gambar X-ray, gambar angiografi, gambar ultrasonik, dan gambar tomografi. Contoh informasi yang dapat diekstraksi dari data gambar tersebut deteksi tumor, arteriosclerosis atau perubahan memfitnah lainnya. Hal ini juga dapat pengukuran dimensi organ, aliran darah, dll area aplikasi ini juga mendukung penelitian medis dengan memberikan informasi baru, misalnya, tentang struktur otak, atau tentang kualitas perawatan medis.
Sebuah wilayah aplikasi kedua dalam visi komputer di industri, kadang-kadang disebut visi mesin, dimana informasi ini diekstraksi untuk tujuan mendukung proses manufaktur. Salah satu contohnya adalah kendali mutu dimana rincian atau produk akhir yang secara otomatis diperiksa untuk menemukan cacat. Contoh lain adalah pengukuran posisi dan orientasi rincian yang akan dijemput oleh lengan robot. Mesin visi juga banyak digunakan dalam proses pertanian untuk menghilangkan bahan makanan yang tidak diinginkan dari bahan massal, proses yang disebut sortir optik.
Militer aplikasi mungkin salah satu daerah terbesar untuk visi komputer. Contoh jelas adalah deteksi tentara musuh atau kendaraan dan bimbingan rudal. Lebih sistem canggih untuk panduan mengirim rudal rudal ke daerah daripada target yang spesifik, dan pemilihan target yang dibuat ketika rudal mencapai daerah berdasarkan data citra diperoleh secara lokal. konsep modern militer, seperti "kesadaran medan perang", menunjukkan bahwa berbagai sensor, termasuk sensor gambar, menyediakan kaya set informasi tentang adegan tempur yang dapat digunakan untuk mendukung keputusan strategis. Dalam hal ini, pengolahan otomatis data yang digunakan untuk mengurangi kompleksitas dan informasi sekering dari sensor ganda untuk meningkatkan keandalan.
Artis Konsep Rover di Mars, sebuah contoh dari kendaraan darat tak berawak. Perhatikan kamera stereo yang terpasang di atas Rover.
Salah satu area aplikasi yang lebih baru adalah kendaraan otonom, yang meliputi submersibles, kendaraan darat (robot kecil dengan roda, mobil atau truk), kendaraan udara, dan kendaraan udara tak berawak (UAV). Tingkat berkisar otonomi dari sepenuhnya otonom (berawak) kendaraan untuk kendaraan di mana sistem visi berbasis komputer mendukung driver atau pilot dalam berbagai situasi. Sepenuhnya otonom kendaraan biasanya menggunakan visi komputer untuk navigasi, yakni untuk mengetahui mana itu, atau untuk menghasilkan peta lingkungan (SLAM) dan untuk mendeteksi rintangan. Hal ini juga dapat digunakan untuk mendeteksi peristiwa-peristiwa tugas tertentu yang spesifik, e. g., sebuah UAV mencari kebakaran hutan. Contoh sistem pendukung sistem peringatan hambatan dalam mobil, dan sistem untuk pendaratan pesawat otonom. Beberapa produsen mobil telah menunjukkan sistem otonomi mengemudi mobil, tapi teknologi ini masih belum mencapai tingkat di mana dapat diletakkan di pasar. Ada banyak contoh kendaraan otonom militer mulai dari rudal maju, untuk UAV untuk misi pengintaian atau bimbingan rudal. Ruang eksplorasi sudah dibuat dengan kendaraan otonom menggunakan visi komputer, e. g., NASA Mars Exploration Rover dan Rover ExoMars ESA.
Khas tugas visi computer
Masing-masing dari area aplikasi yang dijelaskan di atas menggunakan berbagai tugas visi komputer, lebih atau kurang baik pasti pengukuran masalah atau masalah pemrosesan, yang dapat diselesaikan dengan menggunakan berbagai metode. Beberapa contoh tugas visi komputer biasa disajikan di bawah ini.
Pengakuan
Masalah klasik dalam visi komputer, pengolahan gambar, dan visi mesin adalah menentukan apakah atau tidak data gambar berisi beberapa objek tertentu, fitur, atau kegiatan. Tugas ini biasanya dapat diselesaikan kokoh dan tanpa usaha oleh manusia, namun masih belum memuaskan dipecahkan dalam visi komputer untuk kasus umum: objek sewenang-wenang dalam situasi sewenang-wenang. Metode yang ada untuk menangani masalah ini bisa di terbaik mengatasinya hanya untuk objek tertentu, seperti objek geometris sederhana (misalnya, polyhedra), wajah manusia, dicetak atau karakter yang ditulis tangan, atau kendaraan, dan dalam situasi tertentu, biasanya dijelaskan dalam hal pencahayaan yang jelas, latar belakang, dan pose objek relatif terhadap kamera.
varietas yang berbeda dari masalah pengakuan dijelaskan dalam literatur:
* Obyek pengakuan: satu atau beberapa pra-ditentukan atau objek belajar atau kelas objek dapat dikenali, biasanya bersama dengan posisi mereka dalam gambar 2D atau 3D pose dalam adegan.
* Identifikasi: Sebuah contoh individu objek diakui. Contoh: identifikasi wajah orang tertentu atau sidik jari, atau identifikasi dari sebuah kendaraan tertentu.
* Deteksi: data gambar dipindai untuk kondisi tertentu. Contoh: mendeteksi sel abnormal mungkin atau jaringan dalam gambar medis atau deteksi dari sebuah kendaraan di jalan tol sistem otomatis. Deteksi berdasarkan perhitungan relatif sederhana dan cepat kadang-kadang digunakan untuk mencari daerah yang lebih kecil data citra yang menarik yang dapat dianalisa lebih lanjut oleh lebih menuntut komputasi teknik untuk menghasilkan sebuah interpretasi yang tepat.
Beberapa tugas khusus berdasarkan pengakuan ada, seperti:
* Content berbasis image retrieval: menemukan semua gambar dalam satu set gambar yang lebih besar yang memiliki konten yang spesifik. Konten tersebut dapat ditetapkan dengan cara yang berbeda, misalnya dalam hal relatif kesamaan gambar target (beri aku semua gambar yang mirip dengan gambar X), atau dalam hal kriteria pencarian tingkat tinggi diberikan sebagai input teks (memberi saya semua gambar yang berisi banyak rumah, yang diambil selama musim dingin, dan tidak memiliki mobil di dalamnya).
* Pose estimasi: memperkirakan posisi atau orientasi objek tertentu relatif terhadap kamera. Sebuah contoh aplikasi untuk teknik ini akan membantu lengan robot dalam mengambil objek dari sabuk konveyor dalam situasi jalur perakitan.
* Optical pengenalan karakter (OCR): mengidentifikasi karakter dalam gambar teks dicetak atau tulisan tangan, biasanya dengan tujuan untuk pengkodean teks dalam format yang lebih setuju untuk mengedit atau pengindeksan (misalnya ASCII).
Analisis gerak
Beberapa tugas yang berhubungan dengan estimasi gerakan di mana suatu urutan gambar diproses untuk menghasilkan perkiraan kecepatan baik pada setiap titik dalam gambar atau dalam adegan 3D, atau bahkan dari kamera yang menghasilkan gambar. Contoh tugas tersebut adalah:
* Egomotion: menentukan gerak kaku 3D (rotasi dan translasi) dari kamera dari urutan gambar yang dihasilkan oleh kamera.
* Pelacakan: mengikuti pergerakan dari satu set (biasanya) lebih kecil dari poin bunga atau objek (misalnya, kendaraan atau manusia) dalam urutan gambar.
* Aliran Optical: untuk menentukan, untuk setiap titik dalam gambar, bagaimana titik yang bergerak relatif terhadap bidang gambar, yaitu, gerak yang tampak jelas.Gerakan ini adalah hasil kedua bagaimana titik 3D yang terkait bergerak dalam adegan dan bagaimana kamera bergerak relatif ke TKP.
Scene rekonstruksi
Mengingat satu atau (biasanya) gambar lebih dari adegan, atau video, adegan rekonstruksi bertujuan komputasi model 3D dari TKP. Dalam kasus yang paling sederhana model bisa menjadi set 3D poin. metode yang lebih canggih menghasilkan model permukaan 3D lengkap.
Gambar restorasi
Tujuan dari restorasi citra penghapusan noise (sensor noise, blur, dll) dari gambar.Pendekatan paling sederhana untuk menghilangkan kebisingan adalah berbagai jenis filter seperti filter low-pass atau filter median. metode yang lebih canggih mengasumsikan model bagaimana struktur gambar lokal terlihat seperti, model yang membedakan mereka dari kebisingan. Dengan pertama-tama menganalisis data citra dalam hal struktur gambar lokal, seperti garis atau tepi, dan kemudian mengendalikan penyaringan berdasarkan informasi lokal dari tahap analisis, tingkat kebisingan yang lebih baik penghapusan biasanya diperoleh dibandingkan dengan pendekatan sederhana. Sebuah contoh dalam bidang ini adalah inpainting tersebut.
Komputer visi system
Organisasi sistem visi komputer sangat tergantung aplikasi. Beberapa sistem adalah aplikasi yang berdiri sendiri yang memecahkan suatu pengukuran tertentu atau masalah deteksi, sementara yang lain merupakan sub-sistem desain yang lebih besar yang, misalnya, juga mengandung sub-sistem untuk kontrol aktuator mekanik, perencanaan, database informasi, manusia antarmuka mesin, dll Pelaksanaan spesifik sistem visi komputer juga tergantung apakah fungsinya adalah pra-ditentukan atau jika beberapa bagian dari itu bisa dipelajari atau diubah selama operasi. Namun demikian, fungsi khas yang ditemukan dalam sistem computer vision banyak.
* Akuisisi Image: Sebuah gambar digital yang dihasilkan oleh satu atau beberapa sensor gambar, yang, selain berbagai jenis kamera peka cahaya, termasuk sensor jarak, perangkat tomografi, radar, kamera ultra-sonic, dll Tergantung pada jenis sensor, data gambar yang dihasilkan adalah gambar 2D biasa, volume 3D, atau urutan gambar. pixel Nilai biasanya sesuai dengan intensitas cahaya dalam satu atau beberapa spektral band (gambar abu-abu atau gambar warna), tetapi juga dapat dihubungkan dengan berbagai tindakan fisik, seperti kedalaman, penyerapan atau pantulan gelombang sonik atau elektromagnetik, atau resonansi magnetik nuklir.
* Pre-processing: Sebelum metode visi komputer dapat diterapkan pada data citra untuk mengekstrak beberapa bagian spesifik informasi, biasanya diperlukan untuk mengolah data dalam rangka untuk memastikan bahwa itu memenuhi asumsi tertentu tersirat oleh metode ini. Contohnya adalah
o-sampling dalam rangka untuk memastikan bahwa gambar sistem koordinat benar.
o Pengurangan kebisingan dalam rangka untuk memastikan bahwa kebisingan
sensor tidak memperkenalkan informasi palsu.
peningkatan Kontras o untuk memastikan bahwa informasi yang relevan dapat
dideteksi.
o Skala-ruang representasi untuk meningkatkan struktur citra pada skala yang
tepat.
* Fitur ekstraksi: Image fitur pada berbagai tingkat kompleksitas yang diekstraksi
dari data gambar. Contoh umum dari fitur tersebut
o Lines, pinggiran dan pegunungan.
o bunga poin Localized seperti sudut, gumpalan atau poin.
Lebih banyak fitur kompleks mungkin berhubungan dengan tekstur, bentuk atau gerakan.
Deteksi
• segmentasi: Pada beberapa titik dalam proses keputusan dibuat tentang gambar mana yang poin atau wilayah gambar yang relevan untuk diproses lebih lanjut. Contohnya adalah
• Pemilihan serangkaian tertentu titik bunga
• Segmentasi satu atau beberapa citra daerah yang berisi objek tertentu yang menarik.
• Tingkat tinggi pengolahan: Pada langkah ini masukan biasanya satu set kecil data, misalnya satu set poin atau wilayah gambar yang dianggap mengandung suatu objek tertentu. Pengolahan transaksi yang tersisa dengan, misalnya:
• Verifikasi bahwa data model berbasis memuaskan dan asumsi aplikasi spesifik.
• estimasi parameter aplikasi tertentu, seperti obyek menimbulkan atau objek ukuran.
• Klasifikasi benda terdeteksi ke dalam kategori yang berbeda.
Artikel ini saya ambil dari sebuah situs di Internet.
Sebagai disiplin teknologi, visi komputer berusaha untuk menerapkan teori dan model untuk pembangunan sistem visi komputer. Contoh aplikasi dari visi komputer mencakup sistem untuk:
* Pengendalian proses (misalnya, sebuah robot industri atau kendaraan otonom).
* Mendeteksi peristiwa (misalnya, untuk pengawasan visual atau orang menghitung).
* Mengorganisir informasi (misalnya, untuk pengindeksan database foto dan gambar
urutan).
* Modeling benda atau lingkungan (misalnya, inspeksi industri, analisis citra medis
atau model topografi).
* Interaksi (misalnya, sebagai input ke perangkat untuk interaksi komputer-manusia).
Komputer visi berkaitan erat dengan kajian visi biologis. Bidang studi visi biologis dan model proses fisiologis di balik persepsi visual pada manusia dan hewan lainnya. Komputer visi, di sisi lain, studi dan menggambarkan proses diimplementasikan dalam perangkat lunak dan perangkat keras di belakang sistem visi buatan. pertukaran Interdisipliner antara visi biologi dan komputer telah terbukti bermanfaat bagi kedua bidang.
Komputer visi, dalam beberapa hal, invers grafis komputer. Sementara komputer grafis menghasilkan data gambar dari model 3D, visi komputer sering menghasilkan model 3D dari data citra. Ada juga kecenderungan kombinasi dari dua disiplin, misalnya, sebagaimana dibahas dalam realitas ditambah.
Sub-domain dari visi komputer termasuk adegan rekonstruksi, deteksi event, pelacakan video, pengenalan obyek, belajar, indexing, estimasi gerak, dan pemulihan citra.
Negara seni
Komputer visi adalah bidang beragam dan relatif baru belajar. Pada hari-hari awal komputasi, sulit untuk memproses set bahkan cukup besar data citra. Tidak sampai akhir 1970-an bahwa penelitian lebih terfokus lapangan muncul. Komputer visi mencakup berbagai topik yang sering berhubungan dengan disiplin lain, dan akibatnya tidak ada perumusan standar "masalah visi komputer". Selain itu, tidak ada rumusan standar tentang bagaimana komputer masalah penglihatan harus diselesaikan. Sebaliknya, terdapat banyak sekali metode untuk memecahkan berbagai tugas visi komputer yang terdefinisi dengan baik, dimana metode sering sangat tugas spesifik dan jarang dapat digeneralisir rentang aplikasi yang luas. Banyak metode dan aplikasi yang masih dalam keadaan penelitian dasar, tetapi metode semakin banyak menemukan cara mereka ke produk komersial, di mana mereka sering merupakan bagian dari sistem yang lebih besar yang dapat menyelesaikan tugas-tugas kompleks (misalnya, di bidang medis gambar, atau pengendalian mutu dan pengukuran dalam proses industri). Pada kebanyakan aplikasi praktis visi komputer, komputer adalah pra-diprogram untuk menyelesaikan tugas tertentu, namun metode berdasarkan pembelajaran yang sekarang menjadi semakin umum.
Bidang-bidang terkait
Hubungan antara visi komputer dan berbagai bidang lainnya
Banyak kesepakatan kecerdasan buatan dengan perencanaan otonom atau musyawarah untuk sistem robotical untuk menavigasi melalui lingkungan. Pemahaman yang rinci tentang lingkungan ini diperlukan untuk menavigasi melalui mereka. Informasi tentang lingkungan dapat diberikan oleh sistem visi komputer, bertindak sebagai sensor visi dan memberikan informasi tingkat tinggi tentang lingkungan dan robot. Kecerdasan buatan dan topik-topik berbagi komputer visi lain seperti pengenalan pola dan teknik pembelajaran. Akibatnya, visi komputer kadang-kadang dilihat sebagai bagian dari bidang kecerdasan buatan atau ilmu bidang komputer secara umum.
Fisika merupakan bidang lain yang terkait erat dengan visi komputer. sistem visi Komputer bergantung pada sensor gambar yang mendeteksi radiasi elektromagnetik yang biasanya dalam bentuk baik cahaya tampak atau infra-merah. Sensor dirancang dengan menggunakan fisika solid-state. Proses di mana cahaya merambat dan mencerminkan off permukaan dijelaskan menggunakan optik. sensor gambar canggih bahkan meminta mekanika kuantum untuk memberikan pemahaman lengkap dari proses pembentukan gambar. Selain itu, berbagai masalah pengukuran fisika dapat diatasi dengan menggunakan visi komputer, untuk gerakan misalnya dalam cairan.
Bidang ketiga yang memainkan peran penting adalah neurobiologi, khususnya studi tentang sistem visi biologis. Selama abad terakhir, telah terjadi studi ekstensif dari mata, neuron, dan struktur otak dikhususkan untuk pengolahan rangsangan visual pada manusia dan berbagai hewan. Hal ini menimbulkan gambaran kasar, namun rumit, tentang bagaimana "sebenarnya" sistem visi beroperasi dalam menyelesaikan tugas-tugas visi tertentu yang terkait. Hasil ini telah menyebabkan subfield di dalam visi komputer di mana sistem buatan yang dirancang untuk meniru pengolahan dan perilaku sistem biologi, pada berbagai tingkat kompleksitas. Juga, beberapa metode pembelajaran berbasis komputer yang dikembangkan dalam visi memiliki latar belakang mereka dalam biologi.
Namun bidang lain yang terkait dengan visi komputer pemrosesan sinyal. Banyak metode untuk pemrosesan sinyal satu-variabel, biasanya sinyal temporal, dapat diperpanjang dengan cara alami untuk pengolahan sinyal dua variabel atau sinyal multi-variabel dalam visi komputer. Namun, karena sifat spesifik gambar ada banyak metode dikembangkan dalam visi komputer yang tidak memiliki mitra dalam pengolahan sinyal satu-variabel. Sebuah karakter yang berbeda dari metode ini adalah kenyataan bahwa mereka adalah non-linear yang bersama-sama dengan dimensi-multi sinyal, mendefinisikan subfield dalam pemrosesan sinyal sebagai bagian dari visi komputer.
Selain pandangan yang disebutkan di atas pada visi komputer, banyak topik penelitian yang terkait juga dapat dipelajari dari sudut pandang matematika murni. Sebagai contoh, banyak metode dalam visi komputer didasarkan pada statistik, optimasi atau geometri. Akhirnya, bagian penting dari lapangan dikhususkan untuk aspek pelaksanaan visi komputer, bagaimana metode yang ada dapat diwujudkan dalam berbagai kombinasi perangkat lunak dan perangkat keras, atau bagaimana metode ini dapat dimodifikasi untuk mendapatkan kecepatan pemrosesan tanpa kehilangan terlalu banyak kinerja .
Bidang yang paling erat kaitannya dengan visi komputer pengolahan citra, analisis citra dan visi mesin. Ada yang signifikan tumpang tindih dalam berbagai teknik dan aplikasi yang menutupi. Ini berarti bahwa teknik-teknik dasar yang digunakan dan dikembangkan dalam bidang ini kurang lebih sama, sesuatu yang dapat diartikan sebagai hanya ada satu lapangan dengan nama yang berbeda. Di sisi lain, tampaknya perlu untuk kelompok penelitian, jurnal ilmiah, konferensi dan perusahaan untuk menyajikan atau memasarkan diri sebagai milik khusus untuk salah satu bidang dan, karenanya, berbagai penokohan yang membedakan masing-masing bidang dari yang lain telah disajikan.
Karakterisasi berikut akan muncul yang relevan tetapi tidak harus diambil sebagai universal diterima:
* Pengolahan citra dan analisis citra cenderung untuk fokus pada gambar 2D, bagaimana mengubah satu gambar yang lain, misalnya, dari operasi pixel-bijaksana seperti peningkatan kontras, daerah operasi seperti ekstraksi tepi atau penghapusan noise, atau transformasi geometri seperti memutar gambar. karakterisasi ini menunjukkan bahwa pengolahan gambar / analisis tidak memerlukan asumsi atau menghasilkan interpretasi tentang isi gambar.
* Visi Komputer cenderung untuk berfokus pada adegan 3D diproyeksikan ke satu atau beberapa gambar, misalnya, bagaimana merekonstruksi struktur atau informasi lain tentang adegan 3D dari satu atau beberapa gambar. Komputer visi sering mengandalkan pada asumsi yang lebih kompleks atau kurang tentang adegan digambarkan dalam gambar.
* Visi Mesin cenderung untuk fokus pada aplikasi, terutama di bidang manufaktur, misalnya, visi robot otonom berbasis dan sistem untuk inspeksi berbasis visi atau pengukuran. Ini berarti bahwa teknologi sensor gambar dan teori kontrol sering terintegrasi dengan pengolahan data citra untuk mengontrol robot dan bahwa pemrosesan real-time ditekankan dengan cara implementasi efisien dalam hardware dan software. Hal ini juga menyiratkan bahwa kondisi eksternal seperti pencahayaan dapat dan sering lebih terkontrol dalam visi mesin daripada di visi komputer umum, yang dapat memungkinkan penggunaan algoritma yang berbeda.
* Ada juga bidang pencitraan yang disebut yang terutama berfokus pada proses menghasilkan gambar, tapi kadang-kadang juga berkaitan dengan pengolahan dan analisis gambar. Sebagai contoh, pencitraan medis berisi banyak bekerja pada analisis data gambar dalam aplikasi medis.
* Akhirnya, pengenalan pola adalah bidang yang menggunakan berbagai metode untuk mengekstrak informasi dari sinyal pada umumnya, terutama didasarkan pada pendekatan statistik. Sebuah bagian penting dari bidang ini dikhususkan untuk menerapkan metode ini untuk data citra.
Aplikasi untuk visi computer
Salah satu bidang aplikasi yang paling menonjol adalah computer vision medis atau pengolahan citra medis. Daerah ini dicirikan oleh ekstraksi informasi dari data citra untuk tujuan membuat diagnosis medis pasien. Secara umum, data citra dalam bentuk gambar mikroskop, gambar X-ray, gambar angiografi, gambar ultrasonik, dan gambar tomografi. Contoh informasi yang dapat diekstraksi dari data gambar tersebut deteksi tumor, arteriosclerosis atau perubahan memfitnah lainnya. Hal ini juga dapat pengukuran dimensi organ, aliran darah, dll area aplikasi ini juga mendukung penelitian medis dengan memberikan informasi baru, misalnya, tentang struktur otak, atau tentang kualitas perawatan medis.
Sebuah wilayah aplikasi kedua dalam visi komputer di industri, kadang-kadang disebut visi mesin, dimana informasi ini diekstraksi untuk tujuan mendukung proses manufaktur. Salah satu contohnya adalah kendali mutu dimana rincian atau produk akhir yang secara otomatis diperiksa untuk menemukan cacat. Contoh lain adalah pengukuran posisi dan orientasi rincian yang akan dijemput oleh lengan robot. Mesin visi juga banyak digunakan dalam proses pertanian untuk menghilangkan bahan makanan yang tidak diinginkan dari bahan massal, proses yang disebut sortir optik.
Militer aplikasi mungkin salah satu daerah terbesar untuk visi komputer. Contoh jelas adalah deteksi tentara musuh atau kendaraan dan bimbingan rudal. Lebih sistem canggih untuk panduan mengirim rudal rudal ke daerah daripada target yang spesifik, dan pemilihan target yang dibuat ketika rudal mencapai daerah berdasarkan data citra diperoleh secara lokal. konsep modern militer, seperti "kesadaran medan perang", menunjukkan bahwa berbagai sensor, termasuk sensor gambar, menyediakan kaya set informasi tentang adegan tempur yang dapat digunakan untuk mendukung keputusan strategis. Dalam hal ini, pengolahan otomatis data yang digunakan untuk mengurangi kompleksitas dan informasi sekering dari sensor ganda untuk meningkatkan keandalan.
Artis Konsep Rover di Mars, sebuah contoh dari kendaraan darat tak berawak. Perhatikan kamera stereo yang terpasang di atas Rover.
Salah satu area aplikasi yang lebih baru adalah kendaraan otonom, yang meliputi submersibles, kendaraan darat (robot kecil dengan roda, mobil atau truk), kendaraan udara, dan kendaraan udara tak berawak (UAV). Tingkat berkisar otonomi dari sepenuhnya otonom (berawak) kendaraan untuk kendaraan di mana sistem visi berbasis komputer mendukung driver atau pilot dalam berbagai situasi. Sepenuhnya otonom kendaraan biasanya menggunakan visi komputer untuk navigasi, yakni untuk mengetahui mana itu, atau untuk menghasilkan peta lingkungan (SLAM) dan untuk mendeteksi rintangan. Hal ini juga dapat digunakan untuk mendeteksi peristiwa-peristiwa tugas tertentu yang spesifik, e. g., sebuah UAV mencari kebakaran hutan. Contoh sistem pendukung sistem peringatan hambatan dalam mobil, dan sistem untuk pendaratan pesawat otonom. Beberapa produsen mobil telah menunjukkan sistem otonomi mengemudi mobil, tapi teknologi ini masih belum mencapai tingkat di mana dapat diletakkan di pasar. Ada banyak contoh kendaraan otonom militer mulai dari rudal maju, untuk UAV untuk misi pengintaian atau bimbingan rudal. Ruang eksplorasi sudah dibuat dengan kendaraan otonom menggunakan visi komputer, e. g., NASA Mars Exploration Rover dan Rover ExoMars ESA.
Khas tugas visi computer
Masing-masing dari area aplikasi yang dijelaskan di atas menggunakan berbagai tugas visi komputer, lebih atau kurang baik pasti pengukuran masalah atau masalah pemrosesan, yang dapat diselesaikan dengan menggunakan berbagai metode. Beberapa contoh tugas visi komputer biasa disajikan di bawah ini.
Pengakuan
Masalah klasik dalam visi komputer, pengolahan gambar, dan visi mesin adalah menentukan apakah atau tidak data gambar berisi beberapa objek tertentu, fitur, atau kegiatan. Tugas ini biasanya dapat diselesaikan kokoh dan tanpa usaha oleh manusia, namun masih belum memuaskan dipecahkan dalam visi komputer untuk kasus umum: objek sewenang-wenang dalam situasi sewenang-wenang. Metode yang ada untuk menangani masalah ini bisa di terbaik mengatasinya hanya untuk objek tertentu, seperti objek geometris sederhana (misalnya, polyhedra), wajah manusia, dicetak atau karakter yang ditulis tangan, atau kendaraan, dan dalam situasi tertentu, biasanya dijelaskan dalam hal pencahayaan yang jelas, latar belakang, dan pose objek relatif terhadap kamera.
varietas yang berbeda dari masalah pengakuan dijelaskan dalam literatur:
* Obyek pengakuan: satu atau beberapa pra-ditentukan atau objek belajar atau kelas objek dapat dikenali, biasanya bersama dengan posisi mereka dalam gambar 2D atau 3D pose dalam adegan.
* Identifikasi: Sebuah contoh individu objek diakui. Contoh: identifikasi wajah orang tertentu atau sidik jari, atau identifikasi dari sebuah kendaraan tertentu.
* Deteksi: data gambar dipindai untuk kondisi tertentu. Contoh: mendeteksi sel abnormal mungkin atau jaringan dalam gambar medis atau deteksi dari sebuah kendaraan di jalan tol sistem otomatis. Deteksi berdasarkan perhitungan relatif sederhana dan cepat kadang-kadang digunakan untuk mencari daerah yang lebih kecil data citra yang menarik yang dapat dianalisa lebih lanjut oleh lebih menuntut komputasi teknik untuk menghasilkan sebuah interpretasi yang tepat.
Beberapa tugas khusus berdasarkan pengakuan ada, seperti:
* Content berbasis image retrieval: menemukan semua gambar dalam satu set gambar yang lebih besar yang memiliki konten yang spesifik. Konten tersebut dapat ditetapkan dengan cara yang berbeda, misalnya dalam hal relatif kesamaan gambar target (beri aku semua gambar yang mirip dengan gambar X), atau dalam hal kriteria pencarian tingkat tinggi diberikan sebagai input teks (memberi saya semua gambar yang berisi banyak rumah, yang diambil selama musim dingin, dan tidak memiliki mobil di dalamnya).
* Pose estimasi: memperkirakan posisi atau orientasi objek tertentu relatif terhadap kamera. Sebuah contoh aplikasi untuk teknik ini akan membantu lengan robot dalam mengambil objek dari sabuk konveyor dalam situasi jalur perakitan.
* Optical pengenalan karakter (OCR): mengidentifikasi karakter dalam gambar teks dicetak atau tulisan tangan, biasanya dengan tujuan untuk pengkodean teks dalam format yang lebih setuju untuk mengedit atau pengindeksan (misalnya ASCII).
Analisis gerak
Beberapa tugas yang berhubungan dengan estimasi gerakan di mana suatu urutan gambar diproses untuk menghasilkan perkiraan kecepatan baik pada setiap titik dalam gambar atau dalam adegan 3D, atau bahkan dari kamera yang menghasilkan gambar. Contoh tugas tersebut adalah:
* Egomotion: menentukan gerak kaku 3D (rotasi dan translasi) dari kamera dari urutan gambar yang dihasilkan oleh kamera.
* Pelacakan: mengikuti pergerakan dari satu set (biasanya) lebih kecil dari poin bunga atau objek (misalnya, kendaraan atau manusia) dalam urutan gambar.
* Aliran Optical: untuk menentukan, untuk setiap titik dalam gambar, bagaimana titik yang bergerak relatif terhadap bidang gambar, yaitu, gerak yang tampak jelas.Gerakan ini adalah hasil kedua bagaimana titik 3D yang terkait bergerak dalam adegan dan bagaimana kamera bergerak relatif ke TKP.
Scene rekonstruksi
Mengingat satu atau (biasanya) gambar lebih dari adegan, atau video, adegan rekonstruksi bertujuan komputasi model 3D dari TKP. Dalam kasus yang paling sederhana model bisa menjadi set 3D poin. metode yang lebih canggih menghasilkan model permukaan 3D lengkap.
Gambar restorasi
Tujuan dari restorasi citra penghapusan noise (sensor noise, blur, dll) dari gambar.Pendekatan paling sederhana untuk menghilangkan kebisingan adalah berbagai jenis filter seperti filter low-pass atau filter median. metode yang lebih canggih mengasumsikan model bagaimana struktur gambar lokal terlihat seperti, model yang membedakan mereka dari kebisingan. Dengan pertama-tama menganalisis data citra dalam hal struktur gambar lokal, seperti garis atau tepi, dan kemudian mengendalikan penyaringan berdasarkan informasi lokal dari tahap analisis, tingkat kebisingan yang lebih baik penghapusan biasanya diperoleh dibandingkan dengan pendekatan sederhana. Sebuah contoh dalam bidang ini adalah inpainting tersebut.
Komputer visi system
Organisasi sistem visi komputer sangat tergantung aplikasi. Beberapa sistem adalah aplikasi yang berdiri sendiri yang memecahkan suatu pengukuran tertentu atau masalah deteksi, sementara yang lain merupakan sub-sistem desain yang lebih besar yang, misalnya, juga mengandung sub-sistem untuk kontrol aktuator mekanik, perencanaan, database informasi, manusia antarmuka mesin, dll Pelaksanaan spesifik sistem visi komputer juga tergantung apakah fungsinya adalah pra-ditentukan atau jika beberapa bagian dari itu bisa dipelajari atau diubah selama operasi. Namun demikian, fungsi khas yang ditemukan dalam sistem computer vision banyak.
* Akuisisi Image: Sebuah gambar digital yang dihasilkan oleh satu atau beberapa sensor gambar, yang, selain berbagai jenis kamera peka cahaya, termasuk sensor jarak, perangkat tomografi, radar, kamera ultra-sonic, dll Tergantung pada jenis sensor, data gambar yang dihasilkan adalah gambar 2D biasa, volume 3D, atau urutan gambar. pixel Nilai biasanya sesuai dengan intensitas cahaya dalam satu atau beberapa spektral band (gambar abu-abu atau gambar warna), tetapi juga dapat dihubungkan dengan berbagai tindakan fisik, seperti kedalaman, penyerapan atau pantulan gelombang sonik atau elektromagnetik, atau resonansi magnetik nuklir.
* Pre-processing: Sebelum metode visi komputer dapat diterapkan pada data citra untuk mengekstrak beberapa bagian spesifik informasi, biasanya diperlukan untuk mengolah data dalam rangka untuk memastikan bahwa itu memenuhi asumsi tertentu tersirat oleh metode ini. Contohnya adalah
o-sampling dalam rangka untuk memastikan bahwa gambar sistem koordinat benar.
o Pengurangan kebisingan dalam rangka untuk memastikan bahwa kebisingan
sensor tidak memperkenalkan informasi palsu.
peningkatan Kontras o untuk memastikan bahwa informasi yang relevan dapat
dideteksi.
o Skala-ruang representasi untuk meningkatkan struktur citra pada skala yang
tepat.
* Fitur ekstraksi: Image fitur pada berbagai tingkat kompleksitas yang diekstraksi
dari data gambar. Contoh umum dari fitur tersebut
o Lines, pinggiran dan pegunungan.
o bunga poin Localized seperti sudut, gumpalan atau poin.
Lebih banyak fitur kompleks mungkin berhubungan dengan tekstur, bentuk atau gerakan.
Deteksi
• segmentasi: Pada beberapa titik dalam proses keputusan dibuat tentang gambar mana yang poin atau wilayah gambar yang relevan untuk diproses lebih lanjut. Contohnya adalah
• Pemilihan serangkaian tertentu titik bunga
• Segmentasi satu atau beberapa citra daerah yang berisi objek tertentu yang menarik.
• Tingkat tinggi pengolahan: Pada langkah ini masukan biasanya satu set kecil data, misalnya satu set poin atau wilayah gambar yang dianggap mengandung suatu objek tertentu. Pengolahan transaksi yang tersisa dengan, misalnya:
• Verifikasi bahwa data model berbasis memuaskan dan asumsi aplikasi spesifik.
• estimasi parameter aplikasi tertentu, seperti obyek menimbulkan atau objek ukuran.
• Klasifikasi benda terdeteksi ke dalam kategori yang berbeda.
Artikel ini saya ambil dari sebuah situs di Internet.
Langganan:
Postingan (Atom)