Wednesday, October 24, 2012

Mesin pencari web (part 2)


Pencarian

[sunting]Proses Pencarian

Melakukan pencarian dokumen yang dimuat pada suatu situs bisa begitu mudah dan kelihatannya mungkin sulit juga. apalagi mengignat begitu menyebarnya informasi dimana-mana, bahkan University of Calofornia menyebutkan saat ini telah terdapat lebih dari 50 milyar halaman web di internet, meskipun tidak ada ada satupun yang benar-benar tahu jumlah persisnya.
kesulitan yang mungkin terjadi adalah karena WWW tersebut tidak terdata dalam bentuk yang terstandardisasi isinya. tidak sama halnya dengan katalog yang ada di perpustakaan, yang memiliki standardisasi secara mendunia berdasarkan subjek dari judul buku, meskipun jumlahnya juga tidak sedikit.
Dalam pencarian di web, pengguna selalu memperkirakan kata apa yang di kira-kira terdapat pada halaman yang ingin anda temukan. atau kira-kira apa subjek yang dipilih oleh seseorang untuk mengelolah halaman situs yang mereka kelola, topik apa saja kira-kira yang di bahas.
Jika pengguna melakukan apa yang dikenal dengan pencarian pada halaman web, sebenarnya tidaklah melakukan pencarian. tidak mungkin melakukan pencarian di WWW secara langsung.
Pada web benar-benar terdiri dari banyak sekali halaman web yang ingin disimpan dari berbagai server diseluruh dunia. Komputerpengguna tidak langsung melakukan pencarian kepada seluruh komputer tersebut secara langsung.
Apa yang mungkin pengguna lakukan hanyalah melalui komputer untuk mengakses satu atau lebih perantara yang disebut dengan alat bantu pencarian yang ada saat ini. Melakukan pencarian pada alat bantu itu tadi ke database yang dimiliki. data base tersebut mengkoleksi situs-situs yang ditemukan dan simpan.
alat bantu pencarian ini menyediakan hasil pencarian dalam bentuk hypertext link dengan URL menuju halaman lainnya. ketika anda klik link ini, dan menuju ke alamat tersebut maka dokumen, gambar, suara dan banyak lagi bentuk lainnya yang ada pada servertersebut disediakan, sesuai dengan informasi yang terdapat di dalamnya. layanan ini bisa menjangkau ke manapun di seluruh dunia.
Tidak mungkin seseorang untuk melakukan pencarian ke seluruh komputer yang terhubung internet ini, atau bahkan alat bantu pencarian yang mengklaim bahwa melakukannya, tidak benar.

[sunting]Kategori Alat Pencari

Saat ini, tiga bentuk dari alat bantu pencarian ini. Menggunakan strategi yang berbeda untuk memanfaatkan kemampuan potensial dari masing-masing nya, yaitu

[sunting]Mesin pencari dan mesin pencari-meta

Karakteristik:
  1. Menyimpan data dalam bentuk teks penuh pada halaman yang terpilih,
  2. Pencarian berdasarkan kata kunci, mereka mencoba mencocokkan dengan tepat kata kunci tersebut dengan teks yang ada dalam dokumen,
  3. Tidak perlu dilakukan browsing, dan tidak ada subjek dari kategori,
  4. Database dijaring dan dikumpulkan oleh spidr, yaitu komputer yang memiliki program robot, dengan kemampuan seminimal mungkin dari pandangan atau sentuhan manusia,
  5. Ukuran search engine:dari skala kecil hingga mampu menyimpan sangat banyak (sekitar hingga 20 milyar halaman web).
  6. Meta-search engine dengan cepat melakukan pencarian ke dalam beberapa data base dari berbagai search engine dalam satu kali permintaan. hasilnya adalah daftar yang hasilnya dan penggabungan hasil pencarian dari beberapa mesin pencari yang mereka libatkan. Contoh : Search engine: GoogleYahoo Search, Ask.com. Meta-Search  : Dogpile, Copernic, dan lainnya.

[sunting]Subject Directories

  1. Karakteristik :
  2. Seleksi dari situs yang ada merupakan seleksi langsung yang dilakukan oleh manusia, kadang kala para ahli untuk subjek tertentu,
  3. Sering dengan hati-hati dievaluasi dan menjaga keterbaruan informasi yang mereka miliki, namun tidak selalu, kadang-kadang tidak, terutama untuk mereka yang telah memiliki data yang banyak dan bersifat general,
  4. Biasanya dikelola dalam bentuk subjek dan direktori yang tersusun secara hirarki,
  5. Sering dilengkapi dengan catatan mengenai deskripsinya ( tidak untuk Yahoo),
  6. Subjek dapat di-browse subjek dan kategorinya atau melakukan pencarian berdasarkan kata-kata tertentu,
  7. Dokumen yang tidak penuh teks. pencarian diminta lebih spesifik dibandingkan dengan pencarian melalui mesin pencari, karena kata kunci tidak bisa dibandingkan dengan isi dari halaman suatu situs, melainkan hanya pada subjek, kategori-kategori, dan deskripsi.
  8. Terdapat ribuan atau bahkan lebih subjek direktori dalam praktek dan kenyataannya apa saja yang dipikirkan di sana.

[sunting]Specialized Databade (Invisible Web)

Karakteristik :
  1. Merupakan web yang menyediakan akses melalui suatu kotak pencarian ke dalam isi database pada sebuah komputer di suatu tempat,
  2. Dapat saja berubah berbagai topik, dapat pula juga hal yang komersial, pekerjaan yang spesifik, pemerintahan, dll
  3. Juga terdiri dari banyak halaman yang menghasilkan hasil pencarian dari katalog direktori online.

[sunting]Prinsip Umum Dari mesin pencari

Sistem kinerja mesin ini ada beberapa hal yang perlu di perhatikan terutama keterkaitannya dengan masalah arsitekrut dan mekanismenya.

[sunting]Spider

Merupakan program yang men-download halaman-halaman yang mereka temukan, mirip dengan browser. Perbedannya adalah bahwa browser menapilkan secara langsung informasi yang ada (baik tekas, gambar, dll). Untuk kepentingan manusia yang menggunakannya pada saat itu, sedangkan spider tidak melakukan untuk menampulkan dalam bentuk yang terlihat seperti itu, karena kepentingannya adalah untuk mesin, bukan untuk manusia, spider pun dijalankan oleh mesin secara otomatis. Kepentingannya adalah untuk mengambil halaman-halaman yang dikunjunginya untuk disimpan kedalam database yang dimiliki oleh search engine.

[sunting]Crawler

Merupakan program yang dimiliki search engine untuk melacak dan menemukan link yang terdapat dari setiap halaman yang ditemuinya. Tugasnya adalah untuk menentukan spoder harus pergi kemana dan mengevaluasi link berdasarkan alamat yang ditentukan dari awal. Crawler mengikuti link dan mencoba menemukan dokumen yang belum dikenal oleh search engine.

[sunting]Indexer

Komponen ini melakukan aktifitas untuk menguraikan masing-masing halaman dan meneliti berbagai unsur, seperti teks, headers, struktur atau fitur dari gaya penulisan, tag HTML khusus, dll.

[sunting]Database

Merupakan tempat standar untuk menyimpan data-data dari halaman yang telah dikunjungi, di-download dan sudah dianalisis. kadang kala disebut juga dengan index dari suatu search engine.

[sunting]Result Engine

Mesin yang melakukan penggolongan dan penentuan peringkat dari hasil pencarian pada search engine. Mesin ini menentukan halaman mana yang menemui kriteria terbaik dari hasil pencarian berdasarkan permintaan penggunanya, dan bagaimana bentuk penampulan yang akan ditampilkan.
Proses ini dilaksanakan berdasarkan algoritma perangkingan yang dimiliki oleh search engine tersebut, mengikuti kaidah perangkingan hakaman yang dipergunakan oleh mereka adalah hak mereka, para peneliti mempelajari sifat-sifat yang mereka gunakan, terutama untuk meningkatkan pencarian yang dihasilkan oleh serach engine tersebut.

[sunting]Web Server

Merupakan komponen yang melayani permintaan dan memberikan respon balik dari permintaan tersebut. Web Server ini biasanya menghasilkan informasi atau dokumen dalam format HTML. Pada halaman tersebut tersedia layanan untuk mengisikan kata kunci pencarian yang diinginkan oleh usernya. Web Server ini juga bertanggung jawab dalam menyampaikan hasil pencarian yang dikirimkan kepada komputer yang meminta informasi.

[sunting]


Mesin pencariPangsa pasar Mei 2011Pangsa pasar Desember 2010[4]
Google82,80%
 
84,65%
 
Yahoo!6,42%
 
6,69%
 
Baidu4,89%
 
3,39%
 
Bing3,91%
 
3,29%
 
Yandex1,7%
 
1,3%
 
Ask0,52%
 
0,56%
 
AOL0,3%
 
0,42%
 

[sunting]Mesin pencari populer

Terdapat ratusan bahkan ribuan mesin pencari yang ada di internet, dan kapasitas mesin tersebut akan selalu tumbuh dari waktu ke waktu. Dari sebanyak itu, hanya sebagian kecil yang berpengaruh besar dalam lalulintas untuk pengantar pengunjungnya ke situs tersebut. untuk itu, harus pintar dalam memilih mereka yang tepat terutama dalam efisiensi dan efektifitas waktu yang anda miliki dalam mencapai sasaran yang diinginkan, karena situs yang tidak terlalu populer belum tentu akan berpengaruh besar terhadap pertumbuhanke situs yang dikelola. Apalagi juka pendaftaran situs-situs penyedia layanan pencarian tersebut dilakukan satu persatu, akan membuang waktu. Cara mudahnya, lebih baik menggunakan software pendaftar ke mesin pencari yang banyak beredar di internet, sehingga proses pendaftaran bisa dilakukan secara otomatis melalui software tersebut.
Berikut ini adalah beberapa mesin pencari:
  1. Google ( http://www.google.com/ )
  2. Yahoo ( http://www.yahoo.com/ )
  3. Open Directory ( http://www.dmoz.com/ )
  4. MSN ( http://www.msn.com/ )
  5. Live ( http://www.live.com )
  6. Altavista ( http://www.altavista.com )
  7. AOL ( http://www.aol.com )
  8. Altheweb ( http://www.althweb.com )
  9. Baidu ( http://www.baidu.com )
  10. Looksmart ( http://www.looksmart.com )
  11. Solusee ( http://www.solusee.com )

[sunting]

Post by : Iswwahyudi

0 komentar: