TEKNOLOGI YANG
TERKAIT ANTAR MUKA TELEMATIKA
Pengertian
antar muka (interface) adalah salah satu layanan yang disediakan sistem operasi
sebagai sarana interaksi antara pengguna dengan sistem operasi. Antarmuka
(interface) adalah komponen sistem operasi yang bersentuhan langsung dengan
pengguna. Terdapat dua jenis antarmuka, yaitu Command Line Interface (CLI) dan
Graphical User Interface (GUI).
Command Line
Interface (CLI)
CLI adalah tipe antarmuka dimana pengguna berinteraksi dengan sistem operasi
melalui text-terminal. Konsepnya sama, tiap-tiap sistem operasi memiliki nama
atau istilah yang berbeda untuk CLI-nya. UNIX memberi nama CLI-nya sebagai
bash, ash, ksh, dan lain sebagainya.
Graphical User
Interface (GUI)
GUI adalah tipe antarmuka yang digunakan oleh pengguna untuk berinteraksi
dengan sistem operasi melalui gambar-gambar grafik, ikon, menu, dan menggunakan
perangkat penunjuk ( pointing device) seperti mouse atau track ball.
Elemen-elemen utama dari GUI bisa diringkas dalam konsep WIMP (window, icon,
menu, pointing device).
Terdapat 6
macam fitur Teknologi yang terkait antar
muka telematika.Fitur-fitur itu antara lain:
1. Head Up Display
2. Tangible User Interface
3. Computer Vision
4. Browsing Audio Data
5. Speech Recognation
6. Speech Synthesis
Head Up Display
Head-up
display, atau disingkat HUD, adalah setiap tampilan yang transparan menyajikan
data tanpa memerlukan pengguna untuk melihat diri dari sudut pandang atau yang
biasa.
Sejarah Head
Up Display.
HUD pertama
kali diperkenalkan pada tahun 1950-an, dengan adanya teknologi reflektif
gunsight pada perang dunia ke dua. Saat itu, suatu tembakan dihasilkan dari
sumber listrik yang diproyeksikan ke sebuah kaca. Pemasangan proyektor itu
biasanya dilakukan pada bagian atas panel instrumen di tengah daerah pandang
pilot, antara kaca depan dan pilot sendiri.
Dengan menggunakan reflektif gunshight pada pertempuran udara, pilot harus
“mengkalibrasi” pandangannya secara manual. Hal ini dilakukan dengan memasukkan
lebar sayap target pada sebuah penyetelan roda yang diikuti dengan penyesuaian
mata, sehingga target yang bergerak dapat disesuaikan dengan bingkai yang
diarahkan kepadanya. HUD terbagi menjadi 3 generasi yang mencerminkan teknologi
yang digunakan untuk menghasilkan gambar, yaitu:
Generasi
Pertama – Gunakan CRT untuk menghasilkan sebuah gambar pada layar fosfor,
memiliki kelemahan dari degradasi dari waktu ke waktu dari lapisan layar
fosfor. Mayoritas HUD beroperasi saat ini adalah dari jenis ini.
Generasi Kedua
– Gunakan sumber cahaya padat, misalnya LED, yang dimodulasi oleh sebuah layar
LCD untuk menampilkan gambar. Ini menghilangkan memudar dengan waktu dan juga
tegangan tinggi yang dibutuhkan untuk sistem generasi pertama. Sistem ini pada
pesawat komersial.
Generasi Ketiga
– menggunakan waveguides optik untuk menghasilkan gambar secara langsung dalam
Combiner daripada menggunakan sistem proyeksi. Penggunaan HUD dapat dibagi
menjadi 2 jenis. Jenis pertama adalah HUD yang terikat pada badan pesawat atau
kendaraan chasis. Sistem penentuan gambar yang ingin disajikan semata-mata
tergantung pada orientasi kendaraan. Jenis yang kedua adalah HMD, helm dipasang
yang menampilkan HUD dimana elemen akan ditampilkan tergantung pada orientasi
dari kepala pengguna.
TANGIBLE USER
INTERFACE (TUI)
Tangible User
Interface (TUI) adalah sebuah antarmuka pengguna di mana seseorang berinteraksi
dengan informasi digital melalui lingkungan fisik. Sebuah TUI adalah salah satu
teknologi dimana pengguna berinteraksi dengan sistem digital melalui manipulasi
obyek fisik terkait dan langsung mewakili kualitas sistem tersebut. Ide dari
TUI adalah untuk memiliki hubungan langsung antara sistem dan cara mengontrol
melalui manipulasi fisik dengan memiliki makna yang mendasar atau hubungan
langsung yang menghubungkan manipulasi fisik ke perilaku yang mereka picu pada
sistem.
Penerapan
Tangible User Interface
Mouse
Salah satu
penerapan TUI yang paling sederhana adalah pada mouse. Menyeret mouse melalui
permukaan datar dan gerakan pointer pada layar yang sesuai merupakan cara
berinteraksi dengan sistem digital melalui manipulasi objek fisik.
Siftables
Merupakan
perangkat kecil dari proyek awal di MT Media Lab yang memiliki bentuk
menyerupai batu bata kecil yang mempunyai interface. Shiftable memiliki jumlah
lebih dari satu dan mampu berkomunikasi serta berinteraksi satu sama lain
tergantung pada posisinya. Shiftable yang terpisah tahu kapan shiftable lain
berada di dekat mereka dan bereaksi sesuai dengan permainan user.
Reactable
Reactable
adalah alat musik yang dirancang dengan keadaan teknologi seni untuk
memungkinkan musisi (dan lainnya) untuk bereksperimen dengan suara dan
menciptakan musik yang unik. Instrumen ini didasarkan pada meja bundar tembus
dan bercahaya di mana satu set pucks dapat ditempatkan. Dengan menempatkan
mereka di permukaan (atau membawa mereka pergi), dengan memutar mereka dan
menghubungkan mereka satu sama lain, pemain dapat menggabungkan unsur-unsur
yang berbeda seperti synthesizer, efek, loop sampel atau elemen kontrol dalam
rangka menciptakan komposisi yang unik dan fleksibel.
Microsoft
Surface
Merupakan
sebuah teknologi dengan layar multi sentuh yang memungkinkan pengguna untuk
berinteraksi dengan built in system pada waktu yang sama. Yang menjadi
perhatian adalah hal tersebut bereaksi tidak hanya ketika disentuh, tetapi
teknologi ini juga dapat mengenali objek yang ditempatkan diatasnya dan dapat
mengatur sendiri perilaku yang terkait dengan benda-benda serta bagaimana kita
dapat memanipulasinya.
COMPUTER VISION
Computer Vision
adalah ilmu dan teknologi mesin yang melihat, di mana mesin mampu mengekstrak
informasi dari gambar yang diperlukan untuk menyelesaikan tugas tertentu.
Sebagai suatu disiplin ilmu, visi komputer berkaitan dengan teori di balik
sistem buatan bahwa ekstrak informasi dari gambar. Data gambar dapat mengambil
banyak bentuk,seperti urutan video, pandangan dari beberapa kamera, atau data
multi-dimensi dari scanner medis. Sedangkan sebagai disiplin teknologi,
computer vision berusaha untuk menerapkan teori dan model untuk pembangunan
sistem computer vision.
Computer Vision
didefinisikan sebagai salah satu cabang ilmu pengetahuan yang mempelajari
bagaimana komputer dapat mengenali obyek yang diamati. Cabang ilmu ini bersama
Artificial Intelligence akan mampu menghasilkan Visual Intelligence System.
Perbedaannya adalah Computer Vision lebih mempelajari bagaimana komputer dapat
mengenali obyek yang diamati. Namun komputer grafik lebih ke arah pemanipulasian
gambar (visual) secara digital. Bentuk sederhana dari grafik komputer adalah
grafik komputer 2D yang kemudian berkembang menjadi grafik komputer 3D,
pemrosesan citra, dan pengenalan pola. Grafik komputer sering dikenal dengan
istilah visualisasi data.
BROWSING AUDIO
DATA
Sebuah metode
browsing jaringan disediakan untuk browsing video / audio data yang ditembak
oleh sebuah IP kamera. Jaringan video / audio metode browsing sesuai mencakup
langkah-langkah dari:
Menjalankan
sebuah program aplikasi komputer lokal untuk mendapatkan kode identifikasi yang
disimpan dalam kamera IP,
Transmisi untuk
mendaftarkan kode identifikasi ke DDNS ( Dynamic Domain Name Server) oleh
program aplikasi,
Mendapatkan
kamera IP pribadi alamat dan alamat server pribadi sehingga pasangan IP kamera
dan kontrol kamera IP melalui kamera IP pribadi alamat dan alamat server
pribadi dan,
Kopel ke
layanan server melalui alamat server pribadi sehingga untuk mendapatkan video /
audio data yang ditembak oleh kamera IP, di mana server layanan menangkap video
/ audio data yang ditembak oleh kamera IP melalui Internet.
Pada
perkembangan sejarahnya Audio mengalami 4 fase, yaitu :
Fase pertama,
dikenal juga dengan Tehnik Audio – Mono ini umumnya dikenal sekitar periode
tahun 20’an hingga sekitar akhir tahun 50’an dengan diketemukannya Alat
Gramaphone oleh Thomas Alfa Edison dengan metode Plat Baja.
Fase kedua,
sekitar awal tahun 50’an dengan diketemukan Perekaman Analog dengan piringan
plat hitam maka orang mulai mengenal perekaman Mono stereo dengan metode
pemisahan suara ( Vokal dan Alat Musik ) menjadi L / R ( Music ;Left – output,
Voice ; Right – output )
Fase ketiga,
ditemukan tehnik Mixing Stereo menjadi L /R , ini populer sekali dan
dikembangkan terus hingga sekitar tahun 60’an akhir – awal 70’an
Fase keempat,
Proses perekaman Umumnya saat ini didalam produksi audio umumnya dilakukan dari
Analog Ke Digital begitupun sebaliknya . Data Analog mempunyai pengertian
adalah data sinyal gelombang suara yang dikeluarkan dari Sumber Aslinya hasil
perekaman, misal : Perekaman Vokal ke komputer. Data Analog sendiri mempunyai
pengertian adalah Informasi gelombang suara yang terus menerus berubah tidak
beraturan secara Alami, Data Analog mengalami perubahan keras (Amplitudo) dan
tinggi rendah suara yang berfluktuasi, namun belum mempunyai Skala & satuan
yang pasti, sedangkan Data Digital adalah hasil manipulasi Informasi gelombang
suara secara terus menerus berubah tidak beraturan secara alami menjadi satuan
skala yang pasti.
SPEECH
RECOGNITION
Speech
recognation (ASR) adalah suatu pengembangan teknik dan sistem yang memungkinkan
komputer untuk menerima masukan berupa kata yang diucapkan. Teknologi ini
memungkinkan suatu perangkat untuk mengenali dan memahami kata-kata yang
diucapkan dengan cara digitalisasi kata dan mencocokkan sinyal digital tersebut
dengan suatu pola tertentu yang tersimpan dalam suatu perangkat. Pengenalan
ucapan (speech recognation) dalam perkembangan teknologinya merupakan bagian
dari pengenalan suara (proses identifikasi seseorang berdasarkan suaranya).
Pengenalan
suara sendiri terbagi menjadi dua kategori, yaitu:
Piranti
pengenalan kata (word recognation) yang mampu merespon ucapan-ucapan secara
indovidu atau perintah-perintah yang menggunakan teknik yang dikenal sebagai
speaker verification. Pertama kali sistem akan membangkitkan suatu template
untuk mengenali suara user.
Piranti
pengenalan kalimat (speech recognation) yang mampu mengenali hubungan antar
kata terucap di dalam kalimat atau frase. Teknik – teknik statistik dipakai
dalam hal pola perekaman suara yang akan dicocokkan dengan kata-kata terucap.
Prinsip Dasar
Speech Recognation
Semua metode
dasar proses pengenalan suara terdiri dari dua fase operasi, yaitu:
Proses
training. Pada proses ini sistem belajar dari referensi pola yang berupa
perbedaan pola sinyal suara misal frase, kata, fonem yang akan mengisi
vocabulari dari sistem. Setiap referensi di pelajari dari kata yang dikatakan
yang kemudian disimpan dalam template dan telah mengalami metode untuk
meratarata dan karakteristik statistik dan parameter statistik.
Proses
recognation. Pada proses ini sistem akan diberikan inputan yang belum diketahui
dan akan di identifikasi berdasarkan pola template yang telah didapatkan pada
proses training. Pada umumnya, suatu sistem pengenalan suara terdiri dari
beberapa modul utama, yaitu:
Signal
processign frontend digunakan untuk mengkonversi sinyal suara kedalam bentuk
sequence feature vector yang akan digunakan pada saat klasifikasi.
Accoustic
modelling digunakan untuk memodelkan secara statistik hasil training yang telah
dilakukan kedalam sebuah template.
Language
modelling digunakan untuk memodelkan bentuk kata baik berupa kata, fonem,
ataupun kalimat.
SPEECH
SYNTHESIS
Speech
synthesis adalah transformasi dari teks ke arah suara (speech). Transformasi
ini mengkonversi teks ke pemadu suara (speech synthesis) yang sebisa mungkin
dibuat menyerupai suara nyata, disesuaikan dengan aturan – aturan
pengucapan bahasa.TTS (text to speech) dimaksudkan untuk membaca teks
elektronik dalam bentuk buku, dan juga untuk menyuarakan teks dengan
menggunakan pemaduan suara. Sistem ini dapat digunakan sebagai sistem
komunikasi, pada sistem informasi referral, dapat diterapkan untuk membantu orangorang
yang kehilangan kemampuan melihat dan membaca. Ada beberapa masalah yang
terdapat pada pemaduan suara, yaitu :
User sangat
sensitif terhadap variasi dan informasi suara. Oleh sebab itu, mereka tidak
dapat memberikan toleransi atas ketidak sempurnaan pemadu suara.
Output dalam
bentuk suara tidak dapat diulang atau dicari dengan mudah.
Meningkatkan
keberisikan pada lingkungan kantor atau jika menggunakan handphone, maka akan
meningkatkan biaya pengeluaran.
Speech
Synthesis atau sintesis pidato adalah kemampuan sebuah komputer untuk
menghasilkan suara yang menyerupai suara manusia. Meskipun mereka tidak bisa
meniru spektrum penuh irama manusia dan intonasi. Sebuah sistem komputer yang
digunakan untuk tujuan ini disebut synthesizer pidato, dan dapat diimplementasikan
dalam perangkat lunak atau hardware. Speech Synthesis adalah termasuk sebuah
teks-to-speech (TTS), yaitu sistem mengkonversi teks ke dalam pidato bahasa
normal.
Speech sintesis
menjadi alat bantu teknologi vital dan penerapannya di daerah ini sangat
signifikan dan luas, sekarang umum digunakan oleh orang-orang dengan disleksia
dan kesulitan membaca lainnya maupun oleh anak-anak pra-melek. Sementara itu,
aplikasi sintesis pidato dan gadget pada bahasa alat belajar. Teknik sintesis
Pidato sekarang juga digunakan dalam produksi hiburan seperti game, anime dan
yang sejenis, dan banyak digunakan dalam produk telekomunikasi juga.