Kamis, 04 April 2013

Temu Balik Informasi Model Probabilistik


Terdapat beberapa model temu kembali informasi, diantaranya yaitu model probabilistik. Model ini mengurutkan dokumen dalam urutan menurun terhadap peluang relevansi sebuah dokumen pada informasi yang dibutuhkan (Ramadhany, 2008).
Dalam model probabilistik (peluang), temu kembali informasi tergantung pada dua komponen utama yaitu sekumpulan dokumen yang diidentifikasi sebagai record yang relevan dan yang tidak relevan.
Dari beberapa model temu kembali informasi, masing-masing memiliki cara mempresentasikan dokumen atau kueri melalui cara pembobotan istilah penyusunnya. Dalam model probabilistik, bobot istilah dianggap sebagai nilai peluang. Jika istilah muncul dalam suatu dokumen maka nilai bobotnya 1 jika sebaliknya maka 0. Istilah kueri, dibobot dengan 1 untuk masing-masing istilah. Karena nilai bobotnya 1 atau 0, hal ini sering dinggap sebagai kelemahan cara pembobotan ini, karena menghilangkan faktor frekuensi istilah.
Adapun Karakteristik model probabilistik  adalah sebagai berikut:
a.       Melakukan pendugaan page relevansi dengan menggunakan probabilistik
b.      Mempunyai teoritical framework yang jelas, yaitu berdasarkan prinsip statistik, relevansi dokumen dapat diupdate, adanya feed back/timbal balik dari user.
c.       Ide dasarnya yaitu kueri dapat menghasilkan jawaban yang benar, menggunakan indeks term, menggunakan pendugaan awal, menggunakan initial hasil, dan feed back dari user dapat memperbaiki probabilitas dari relevansi.
Tujuan dari model ini adalah untuk menentukan kemungkinan dari relevansi berdasarkan kueri yang diberikan. Dalam bidang temu kembali informasi terdapat berbagai metode yang digunakan dalam pembobotan istilah, pengukuran kesesuaian, perangkingan, umpan balik relefansi  dan lain-lain.
Adapun contoh mesin pencarian yang menggunakan model probabilistik diantaranya adalah sebagai berikut:
a. bing
         b. Altavista
        c. Google