|
Interneten dagoen informazio-mordoak galaraz gaitzake gai bati
buruzko berariazko informazioaren bila ari garenean. Sarean badaude
eskuratu nahi dugun informazioa hautatzen lagunduko diguten web
lekuak. Erraztasun hauei "Bilatzaileak" edo "bilaketa-motorrak"
(search engines) esaten zaie.
Bilatzaile hauek, sartuko ditugun hitz batzuen arabera, aurkitu
dituen web orrialdeen esteka batzuk emango digute bilaketaren emaitza
gisa. Eduki ugaridun ezin konta ahala web leku dagoenez, bilaketa
zaila gertatuko zaigu, eta, beraz, interesatzen zaizkigun edukiak
aurkitzeko erabiliko ditugun hitzak egoki aukeratu beharko ditugu.
Edukiak apropos bilatzen ikasteko, garrantzi handikoa izango da
erabiliko ditugun bilaketa-motor hauek nola egituratzen diren eta
edukiak nola bilatzen dituzten jakitea, bilatzailea aldez aurretik
ezagutzeak bilaketaren emaitza hobezina bermatuko baitigu.
|
Robot bat zer den
Robot bat programa bat da, hipertestu egitura bat, esteka hori eta
berton aipatutako esteka guztiak berreskuratuz, zeharkatzen duena.
Honetaz elikatzen dira webeko bilaketa-motor handiak. Robot batek
lekuak bisitatzen ditu eta hauen barruan dauden estekak ateratzen
ditu. Izen desberdinak ematen zaizkie, bilaketa-moduaren arabera:
Zizareak (Worms), Beldarrak (Web crawlers), Inurriak (WebAnts)
|
Direktorioak zer diren
Direktorioak berebiziko datu-baseak dira. Hauek gizakiek operatzen
dituzte eta ez dituzte web orrialdeetan dauden estekak automatikoki
berreskuratzen: pertsonek eskuz haietan sartzen dutena besterik
ez dute aurkitzen. Prozesua eskuzkoa denez, web-en gaiak atalka
sailka ditzakete.
|
|
|
Bilaketa-motorra edo Search engine delakoa
Datu-base baten bitartez , Web testuinguruan, bilatzen duen programa
da; robot batek bildutako Html agirien datu-baseen bilaketetan jarduten
du eskuarki.
Robot batek zer bisitatuko duen erabakitzeko modua robotaren beraren
esku dago. Robot bakoitzak estrategia desberdinak erabiltzen ditu.
Oro har, URLen zerrenda historiko batetik lan egiten hasten dira.
Bereziki, esteka asko duten agiriekin, "what's New" (zer
berri da?) zerbitzari-zerrenda bezala, eta Webeko leku ezagunenetatik.
Askok leku bat eskuz alta egiten uzten dioten zerbitzuak indexatzen
ditu, robotak indexa ditzaten errenkan jarriko direnak. Batzuetan,
beste baliabide batzuk erabili ohi dira, besteak beste, posta-zerrendak,
eztabaida-taldeak, etab. Honek bisitatuko dituzten url-ak hautatzen
hasteko, aztertzeko eta haien datu-basean sartzeko baliabide gisa
erabiltzeko abiapuntua ematen die.
Robot batek zer indexatuko duen erabakitzeko modua robotaren berearen
esku dago, baina, oro har, HTML izenburuak (Titles) edo lehenengo
paragrafoak erabiltzen ditu, edo HTML osoa hautatzen du eta bertan
dauden hitzak indexatzen ditu, erabilera arrunta dutenak alde batera
utzirik (izenordainak, adberbioak eta "web", "orrialdea",
etab. bezalako hitzak), HTMLen taxutzeen arabera. Batzuek metaetiketak
edo ezkutuko tag mota berezi batzuk hautatzen dituzte. Ohikoa izaten
da grafikoen hautazko testuak ere indexatzea. Haiei arreta handiz
so egitea gomendatzen dizugu, indexatuz gero, bukaerako agirian
garrantzi handia izango baitute.
|
|
|
Robotik gabeko bilatzailea:
Erantsitako helbideak, zuhaitz-egitura baten barruan, ataletan jartzen
dira, alta prozesuan izango duten maila adierazi beharko delarik.
Kasu askotan, edukiak erantsitako helbidea bisitatuko duten pertsonek
aztertu eta prozesatzen dituzte, alta egiteko beharrezko baldintzak
betetzen dituen eta sartutako datuak zuzenak diren zehaztuko dutelarik.
Direktorioen datu-basearen barruan egoteko, nahitaezkoa da zure
Web lekuaren eskuzko alta egitea.
Maila on bat lortzeko, ez ohi da beharrezkoa ezkutuko hitzik erabiltzea.
Nahikoa ohi da lekuaren izenburua alfabetoan A letratik gertuen
dagoen letratik edo ASCII kodifikazioaren lehenengo karakteretako
batetik hastea.
Datu-baseen eduki txikiagoa dela eta, guztizko emaitza gutxiago
dago. Hauek hobeak zein fidagarriagoak dira eta esteka akasdun edo
eraginkortasun txikidun esteka gutxi dute.
Emaitzak alfabeto-ordenan agertzen dira gehienetan, gaika egindako
sailkapenean.
|
|
|
Robotdun bilatzailea:
Edukiak robot, armiarma edo zizare baten bitartez indexatzen dira.
Robot gehienek Webean beraien kabuz bilatzen dute, aurkitzen duten
oro indexatuz.
Emaitza osoagoak dutenak daude, baina fidagarritasun gutxiago dute
eta akastun edo eraginkortasun gutxiagoko esteka gehiago. Emaitzak
onarpen-ordenan agertzen dira, robotaren ezaugarrien arabera. Izenburuaren,
deskripzioaren edo edukiaren hitz nagusiak har ditzake. Ezin hobeak
dira bilaketa-direktorioetan gai korapilatsuak edo debekatuak aurkitzeko,
edota gai bereziak aurkitzeko.
|
Hitz nagusiak zer diren
Hitz nagusiak zer diren argi eta garbi edukitzea funtsezkoa da informazioa
bilatzean emaitza onak lortzeko.
Bilatzaileek eta zenbait bilaketa-direktoriok sartzen diren hitz
nagusiak, beraien datu-baseetan dauden estekak aurkitzeko eta hauetako
10 eta 20 bitarteko esteka dauzkaten orrialde-zerrendetan emaitza
gisa aurkezteko erabiltzen dituzte. Aurkezteko modu hau Bilatzaile
bakoitzaren araberakoa da.
|
Hitz nagusiak aukeratzeko iradokizunak
Ez erabili hitz nagusi arruntak, honela benetan interesatzen ez
zaizkigun edukidun emaitzek gaindi egitea saihestuko dugu. Interesatzen
zaigun gaiari buruzko terminologia erabili behar da.
Ez erabili bilatzaileek -eskuarki nazioartekoak- bereizi ezin duten
azentu edo hitzik.
Erabili AND, OR, NOT grafoak edo bestelako eragile boolearrak gure
bilaketa hobeto zehazteko. Halaber, testua komatxo artean ( "..."
) sartzeak eduki zehatza bilatzeko esaldia sortuko du.
|
Informazio gehiago
Honako aholku hauek Interneteko segurtasunaz jabearazteko egitasmo
baten barruan ematen dira. Europar Batasunak egitasmo honen zati baterako
dirulaguntza ematen du. Gai honi edo edozein gairi buruzko aholkuak
jasotzeko, zure arazoak edo ikuspegiak partekatzeko, edo SUSI delako
egitasmoari buruz gehiago jakiteko, jo ezazu, jo ezazu ondoko web
gunera: |
-- -- -- -- -- -- -- -- -- --
-- -- --
--
--
--
|
|