Terdapat beberapa model
temu kembali informasi, diantaranya yaitu model probabilistik. Model ini
mengurutkan dokumen dalam urutan menurun terhadap peluang relevansi sebuah
dokumen pada informasi yang dibutuhkan (Ramadhany, 2008).
Dalam model
probabilistik (peluang), temu kembali informasi tergantung pada dua komponen
utama yaitu sekumpulan dokumen yang diidentifikasi sebagai record yang relevan
dan yang tidak relevan.
Dari beberapa model
temu kembali informasi, masing-masing memiliki cara mempresentasikan dokumen
atau kueri melalui cara pembobotan istilah penyusunnya. Dalam model probabilistik,
bobot istilah dianggap sebagai nilai peluang. Jika istilah muncul dalam suatu
dokumen maka nilai bobotnya 1 jika sebaliknya maka 0. Istilah kueri, dibobot
dengan 1 untuk masing-masing istilah. Karena nilai bobotnya 1 atau 0, hal ini
sering dinggap sebagai kelemahan cara pembobotan ini, karena menghilangkan
faktor frekuensi istilah.
Adapun Karakteristik
model probabilistik adalah sebagai
berikut:
a. Melakukan
pendugaan page relevansi dengan menggunakan probabilistik
b.
Mempunyai
teoritical framework
yang jelas, yaitu berdasarkan prinsip statistik, relevansi dokumen dapat
diupdate, adanya feed back/timbal balik dari user.
c.
Ide
dasarnya yaitu kueri dapat menghasilkan jawaban yang benar, menggunakan indeks
term, menggunakan pendugaan awal, menggunakan initial hasil, dan feed back dari
user dapat memperbaiki probabilitas dari relevansi.
Tujuan dari model ini
adalah untuk menentukan kemungkinan dari relevansi berdasarkan kueri yang
diberikan. Dalam bidang temu kembali informasi terdapat berbagai metode yang
digunakan dalam pembobotan istilah, pengukuran kesesuaian, perangkingan, umpan
balik relefansi dan lain-lain.
Adapun contoh mesin
pencarian yang menggunakan model probabilistik diantaranya adalah sebagai
berikut:
a. bing
b. Altavista
c. Google