Tri glavna načina traženja informacija na internetu. Traženje informacija na internetu 3 načina traženja informacija na internetu

28.03.2023
Rijetke se snahe mogu pohvaliti da sa svekrvom imaju ujednačen i prijateljski odnos. Obično se događa upravo suprotno

Problem potrage i načina njezine organizacije

Ogromne i stalno rastuće količine informacija dostupnih na internetu, uklj. operativan, čini problem pronalaženja potrebnih informacija vrlo relevantnim i složenim. Brzina traženja potrebnih informacija u velikoj mjeri određuje profesionalnost korisnika interneta. Vrijedno je reći da su za automatizaciju ovog zadatka razvijeni različiti sustavi pretraživanja, strani i domaći, koji su web stranice posebne vrste. U isto vrijeme, unatoč dostupnosti brojnih alata za automatizaciju pretraživanja, ovaj zadatak ostaje prilično naporan, zahtijevajući od korisnika određeno iskustvo, intuiciju i poznavanje terminologije koja se koristi u njegovom predmetnom području.

Procjena objavljena u časopisu Nature 8. srpnja 1999. godine iznosila je broj javno indeksiranih web stranica na 800 milijuna. Godinu dana kasnije, autor studije (Steve Lawrence iz NEC Research Institute) vjerovao je da se taj broj gotovo udvostručio na 1,5 milijardi. Čak i najbolje tražilice ne indeksiraju više od jedne od šest stranica. Vrijedno je reći da za izvlačenje korisnih informacija s interneta morate znati gdje i kako pretraživati.

Alat za pretraživanje Internet Explorera olakšava pristup alatima za pretraživanje bez potrebe za poznavanjem adresa tražilica. U ovom slučaju, bolje je izravno kontaktirati tražilice učitavanjem relevantne stranice.

Na temelju načina organiziranja pretraživanja i mogućnosti koje pruža, svi alati za pretraživanje mogu se podijeliti u sljedeće skupine:

katalozi i specijalizirane baze podataka;

tražilice;

metapretraživači.

Katalozi i baze podataka

Katalozi na WWW-u slični su sustavnim knjižničnim katalozima. Pretraživanje imenika sastoji se od sekvencijalnog kretanja kroz hijerarhijski popis poveznica koje se nazivaju naslovi ili kategorije. Prva stranica kataloga sadrži poveznice na glavne teme, kao što su Kultura i umjetnost; Medicina i zdravlje; Društvo i politika; Posao i ekonomija; Zabava itd. Klikom miša na zadanu poveznicu (kategoriju) otvara se stranica s poveznicama s detaljima odabrane teme (kategorije).Krećući se kroz kategorije s detaljima prema dolje, možete pronaći stranicu s potrebnim informacijama. Na svakoj stranici koja se otvara prilikom kretanja kroz katalog na ovaj ili onaj način, naznačen je redoslijed pregledanih potkategorija, npr. Poslovni svijet: Financije: Analitika itd.

Sve kataloge ručno izrađuju i ažuriraju stručnjaci, slično kao što bibliografi sastavljaju i održavaju knjižnične kataloge. Primjetno je napomenuti da opis dokumenta vrše ili sastavljači kataloga ili autor. Zahvaljujući tome, sadržaj stranica u katalogu najprimjereniji je kategoriji u koju su svrstane. Ali, s obzirom na brzinu nadopunjavanja i promjene informacija na Internetu, "ručna" metoda održavanja kataloga ne dopušta nam da adekvatno odražavamo stvarno stanje internetskih resursa na ovu temu.

Tražilice

(tražilice, poslužitelji za pretraživanje, roboti za pretraživanje)

Postoje deseci velikih i tisuće malih i specijaliziranih web stranica dizajniranih za pretraživanje interneta. Alati za pretraživanje ϶ᴛᴏth skupine omogućit će korisniku da prema određenim pravilima formulira zahtjeve za informacijama koje su mu potrebne (koristeći upitni jezik za kreiranje upita). Nakon toga tražilica automatski pregledava dokumente na stranicama kontrolira (indeksira) i odabire one od njih koji "po mišljenju" poslužitelja za pretraživanje, ϲᴏᴏᴛʙᴇᴛϲᴛʙzahtjevi koje je formulirao korisnik (relevantni za zahtjev) Čvorovi za pretraživanje mogu koristiti vlastite internetske indekse, stalno ažurirane posebnim programima koji se nazivaju pauci. Program pauk ispituje web, provjerava svaku poveznicu na određenoj stranici, zatim na stranicama naslovljene poveznice itd., te obavještava svog vlasnika o informacijama o svim stranicama za naknadno indeksiranje.

Kao rezultat pretraživanja kreira se jedna ili više stranica koje sadrže poveznice na dokumente relevantne za zahtjev (web stranice).Vrijedi napomenuti da se za svaku vezu navodi datum izrade dokumenta, njegov volumen, stupanj relevantnosti zahtjevu, a obično se navode i dijelovi teksta koji karakteriziraju sadržaj dokumenta. Klikom na takav link možete učitati stranicu koja vas zanima. U slučaju vrlo velikog broja pronađenih dokumenata, možete razjasniti zahtjev i ponoviti pretragu s njim, ali samo među odabranim stranicama (takva se pretraga na različitim strojevima naziva drugačije, ali obično ϶ᴛᴏ - traži u pronađenom) U brojnim tražilicama možete upotrijebiti određenu metodu promijeniti poveznicu na stranicu čiji sadržaj najbolje odgovara vašim potrebama i ponoviti pretraživanje tražeći traženje sličnih.

Prednost automatiziranog pretraživanja je u tome što omogućuje pregled vrlo velike količine informacija dostupnih na Internetu u ovom trenutku. Istovremeno, složenost točnog opisa zahtjeva koji adekvatno odražava vaše potrebe za informacijama, kao i još veća složenost zadatka automatskog određivanja stupnja pregledanih stranica za vaš zahtjev, dovodi do činjenice da broj stranica odabranih "pri prvom posjetu" tradicionalno je vrlo malo ili pretjerano veliko . Općenito, pretraživanje pomoću tražilice je iterativni (višeprolazni) proces, uslijed kojeg se oblik zahtjeva postupno usavršava.

Metatraživači

Kao što je gore navedeno, svaka tražilica skenira određeni skup poslužitelja i odabire dokumente prema vlastitim kriterijima. Kao rezultat toga, pretraživanje s različitim sustavima koristeći iste ključne riječi daje različite rezultate. To je dovelo do ideje o stvaranju tzv. metasearch (ili multisearch) sustava, koji sami ne traže ništa, već se za pomoć obraćaju više tražilica odjednom. Imajte na umu da svaki od metapretraživača ima svoj vlastiti jezik upita. Sustav prevodi upit formuliran na njegovom jeziku u jezike upita koje koristi svaka tražilica. Zatim se rezultati pretraživanja iz svih sustava kombiniraju i prikazuju u jasnom obliku. Naravno, pretraživanje pomoću metapretraživača traje dulje u usporedbi s konvencionalnim tražilicama.

Pregled najpopularnijih tražilica

Na internetu postoji velik broj tražilica, a svaki se korisnik fokusira na onu na koju je navikao ili koju su mu savjetovali kolege. Poslužimo se kratkim opisom najpopularnijih tražilica, koji je dan na jednoj od stranica.

1. Google (www.google.com) Najbrža i najveća tražilica. Indeksirano je više od 1,3 milijarde stranica (od kojih je nešto više od 700 milijuna u potpunosti indeksirano, za ostale su poznati samo adresa i tekst veze). Pretražuje normalno koristeći resurse na ruskom jeziku (naravno, bez oblika riječi) , moguće je odabrati jezik sučelja. Možete uključiti/isključiti rezultate s određenih stranica i/ili domena. Za razliku od većine tražilica, Google procjenjuje popularnost resursa prema broju poveznica koje vode do njega s drugih stranica. Postoji tematsko orijentirano pretraživanje - Apple Macintosh, BSD UNIX, Linux, pretraživanje američke vlade i sveučilišta - pretraživanje u resursima vodećih znanstvenih i obrazovnih institucija.

2. Yandex (www.yandex.ru) Najbolja od domaćih tražilica. Indeksira uglavnom resurse na ruskom jeziku, dok njegove mogućnosti nisu niže od stranih sustava. Pretraživanje se može izvršiti točno ili u bilo kojem obliku riječi, s datumskim ograničenjem, s naznakom stranice ili njezinog poddirektorija. Možete pretraživati ​​na temelju tzv. citatnog indeksa, pretraživati ​​slike, skripte, aplete; postavite jezik dokumenta. Potrebne poveznice se tradicionalno nalaze u prvih deset rezultata. Ima "light" verziju (s minimalnim elementima dizajna) na http://www.ya.ru.

3. AltaVista (www.altavista.com) Omogućuje veliko proširenje kriterija pretraživanja: u Naprednom pretraživanju postoji izbor vremenskog razdoblja, što uključuje datum stvaranja ili izmjene izvora, podršku za 25 jezika; postoji mogućnost vraćanja jednog rezultata po mjestu (sužava pretraživanje bez žrtvovanja kvalitete) Power search ima standardni skup mogućnosti. AV je donedavno bio veliki portal, ali je zbog financijskih (i drugih) razloga značajno smanjio broj usluga.

4. Yahoo! (www.yahoo.com) Važno je napomenuti da je jedna od prvih tražilica na Internetu. Osim standardnog skupa funkcija, omogućuje vam odabir resursa po datumu (4 godine, 1, 3, 6 mjeseci, tjedan, 1, 3 dana) Podržava mogućnost navođenja znaka "*" umjesto bilo kojeg niza znakova u ključnim riječima. Na Yahoo! Sastavljen je veliki strukturirani katalog kategorija, najprije se pretražuje u njima, zatim u vlastitoj arhivi, a potom i preko Google sustava. Pretraživanje po kategorijama daje dobre rezultate - nema ih puno i jako su dobre.

5. Lycos (www.lycos.com) U zadnje vrijeme - jedan od najpopularnijih sustava. Istodobno, ne pruža nikakve posebne mogućnosti - "I" "ILI", traženje fraza, obavezna prisutnost / odsutnost riječi; u naprednim značajkama - pretraživanje u naslovu, URL-u, nazivu hosta i/ili nazivu domene; 25 jezika, uključujući ruski - jednom riječju, cijeli "općeprihvaćeni" set. Možete odrediti vrstu sadržaja resursa - automatski, knjige, ftp, preuzimanje, vijesti itd. Očito je popularnost Lycosa posljedica razmjera ovog velikog projekta.

6. Rambler (www.rambler.ru) Donedavno najpoznatija ruska tražilica. Napredno pretraživanje ne dopušta traženje fraza, a redovno pretraživanje do veljače 2010. rijetko je davalo prihvatljive rezultate. Od veljače sustav koristi poboljšani mehanizam pretraživanja, dizajn se promijenio, ali po kvaliteti Rambler još uvijek nije ravan Yandexu i Aportu (prema autoru koji analizira tražilice). Stranica sadrži katalog ocjena resursi Rambler Top 100, jedan od priznatih izvora statističkih podataka o internetskim projektima.

7. Aport (www.aport.ru) Još jedan dobar ruski poslužitelj za pretraživanje. Pretraživanje se vrši po tekstu (samo u svim oblicima riječi) i po URL-u, korištenjem logičkih operatora i operatora "..." (međutim, stop-riječi u frazi se i dalje zanemaruju), po datumu i po pojedinim poljima (naslov , opis itd.), podržani su meta znakovi * i!. Prikaz rezultata pretraživanja najbolje je osmišljen u usporedbi s drugim ruskim tražilicama. Dizajn glavne stranice, koja je očito preopterećena informacijama, izaziva neke sumnje. Postoji malo "lakša" verzija na http://aport.ru.

Kako odabrati tražilicu

Prilikom pretraživanja interneta važne su dvije komponente - cjelovitost (ništa nije izgubljeno) i točnost (ništa suvišno nije pronađeno).Obično se sve naziva jednom riječju - relevantnost, odnosno odgovor na pitanje.

1. Pokrivenost i dubina

Pod pokrivenošću podrazumijevamo obujam baze podataka tražilice koji se mjeri s tri pokazatelja - ukupnim obujmom indeksiranih informacija, brojem jedinstvenih poslužitelja i brojem jedinstvenih dokumenata. Pod dubinom podrazumijevamo postoji li ograničenje broja stranica ili dubine ugniježđenosti direktorija na jednom poslužitelju.

Kako provjeriti: Neki strojevi pišu statistiku robota na web stranici. Ali to možete sami provjeriti - morate postaviti nekoliko upita za pretraživanje koji se sastoje od jedne riječi (kako biste isključili utjecaj jezika upita, uključujući različita tumačenja razmaka), i istovremeno pogledati statistiku rezultata koje proizvodi stroj - obično na početku popisa označava koliko je dokumenata pronađeno. Osim što bi riječi trebale biti iz različitih područja, također je dobro uzeti riječi različite težine - rijetke, “srednje” i “teške” (frekvencije), te usporediti pronađenu količinu. Teške riječi posebno testiraju cijeli tekst (indeksiranje svih riječi u dokumentu) tražilice.

Teže je provjeriti dubinu indeksiranja robota - za to trebate uzeti neka mjesta, na primjer, s razgranatom arhivskom strukturom, i provjeriti jesu li dokumenti indeksirani, do čega se može doći samo, na primjer, u 6 klikova na linkovima.

2. Brzina indeksiranja i relevantnost poveznica

Brzina indeksiranja weba pokazuje koliko se brzo novododani resurs indeksira i koliko brzo se informacije u bazi podataka ažuriraju. Ne zaboravite da će važan pokazatelj kvalitete tražilice (njezinog robota) biti ne samo hvatanje novih teritorija, već i praćenje statusa onih koji su već pokriveni. Serveri nestaju i ostat će, stranice na njima se ažuriraju. Linkovi koje tražilica proizvodi u popisu onoga što je pronašao moraju, prvo, postojati, i, drugo, njihov sadržaj mora odgovarati zahtjevu.

Kako provjeriti: Objektivne informacije mogu se dobiti analizom zapisa poslužitelja - robot tražilice obično je predstavljen imenom svog stroja (ili nečim sličnim), tako da možete vidjeti koliko često posjećuje poslužitelj, koliko stranica pregledava itd. Nažalost, obično je za proučavanje dostupan samo zapis njegovog mjesta, tako da ostaje eksperimentalna metoda.

Da biste odredili brzinu indeksiranja, morate negdje stvoriti stranicu teksta, dodati je u tražilice i vidjeti koliko brzo će se početi pojavljivati. Ili promijenite postojeću stranicu. Vrijedno je reći da za utvrđivanje relevantnosti poveznica provjerite dokumente barem na prvoj stranici popisa pronađenog za nekoliko upita. Poruka Nije pronađeno označava da dokument više ne postoji.

3. Kvaliteta pretraživanja (subjektivni pokazatelj)

Vrijedno je reći da svaka tražilica ima algoritam za sortiranje rezultata pretraživanja. Što je dokument koji vam treba bliži vrhu popisa, relevantnost bolje funkcionira.

Kako provjeriti: Samo eksperimentom. Preporuča se napraviti upite različitih duljina za usporedbu. Također možete koristiti jezik upita, dok oni koji nerado čitaju opis mogu koristiti proširenu stranicu upita (“napredno pretraživanje” u Aportu i Yandexu, “detaljni upit” u Rambleru - opcije prijevoda na ruski “napredno pretraživanje”)

Osim relevantnosti, važne su karakteristike korisnika.

4. Brzina pretraživanja

Ako tražilica sporo reagira, rad s njom je neučinkovit. Vrijedno je dodati da brzina vidljiva korisniku ne ovisi samo o samoj tražilici, već io internetskim kanalima.

Kako provjeriti: Eksperimentalno - trebate tražiti upite različite duljine, različite<тяжести>riječi i u različito doba dana (opterećenost poslužitelja je znatno neravnomjerna tijekom dana, vrhunac je oko tri do četiri sata poslijepodne)

5. Mogućnosti pretraživanja (rad s jezikom dokumenta, jezik upita)

Druga točka usporedbe je što točno i kako tražilica unosi u indeks. Vrijedno je reći da tražilica cijelog teksta indeksira sve riječi teksta koje su vidljive korisniku. Prisutnost morfologije omogućuje pronalaženje traženih riječi u svim deklinacijama ili konjugacijama. Osim ovoga, u HTML jeziku postoje oznake koje također može obraditi tražilica (naslovi, poveznice, naslovi za slike itd.)

Gotovo svi strojevi imaju upitni jezik u obliku standardnih logičkih operatora (AND, OR, NOT). Neki ljudi znaju tražiti fraze ili riječi na određenoj udaljenosti - to je često važno za dobivanje razumnog rezultata. Dodatna opcija bit će pretraživanje u područjima dokumenta - naslovima, poveznicama, ključnim riječima (META KEYWORDS) itd. Dodatna značajka upitnog jezika je upit na prirodnom jeziku, koji ne zahtijeva poznavanje operatora.

Kako provjeriti: Obično se ove informacije objavljuju na poslužitelju tražilice (u Helpu). Ipak, preporuča se provjeriti na stvarnim zahtjevima, jer se ponekad ono što se želi prikazuje kao stvarnost.

6. Dodatne pogodnosti

To su dodatne značajke koje tražilica pruža korisnicima. To uključuje sve vrste opcija pretraživanja (specijalizirane stranice, traženje sličnih dokumenata, ograničavanje područja pretraživanja), i popis pronađenih poslužitelja, i pretraživanje po datumu i poslužitelju, te prikladno sučelje tražilice i mogućnost personalizacije.

Kako provjeriti: Podaci mogu biti djelomično objavljeni na poslužitelju tražilice, ali najbolje je da sami pokušate raditi s tim značajkama.

Jasno je da će ova analiza potrajati. Osim toga, tražilice, kao i cijeli Internet, ne miruju. Istodobno, s obzirom da je pretraživanje informacija jedna od važnih komponenti računalne tehnologije, treba mu posvetiti dovoljnu pozornost - barem ne manje od sposobnosti rada na lokalnoj mreži.

Anketa je provedena na Yandex.ru: zašto je Internet potreban i što mu nedostaje (http://www.yandex.ru/polling/9.html) Silaznim redoslijedom, podaci ankete raspoređeni su na sljedeći način: Internet se koristi kao referentna knjiga (23, 76%), alat za istraživanje (15,45%), zabava (14,15%), a tek na četvrtom mjestu je izvor vijesti (12,32%) Optimistično je zvučalo 10% korisnika uvijek uspjeti, a 73% često uspije pronaći informacije koje su vam potrebne. A Internetu nedostaju: informacije, dobro pretraživanje i red (uključujući: uređenost, strukturu, strukturu, strukturu, strukturu, kao i sustavnost, sistematičnost, sistematičnost, sustavnost i sistematičnost)

ODGOVORI NA PITANJA:

Navedite koje metode organiziranja pretraživanja postoje na Internetu?

Kako se informacije pretražuju u katalozima i bazama podataka?

Kako se informacije unose u kataloge i baze podataka?

Što su tražilice na internetu?

Kako se formira baza informacija u tražilicama?

Gdje počinje traženje informacija u tražilicama?

Što je zahtjev?

Kako se traže informacije u tražilicama?

Što mislite pod relevantnošću za upit?

Što učiniti u slučaju da se daljnjom pretragom nađe vrlo velik broj dokumenata?

Što su metapretraživači?

Koja je temeljna razlika između metapretraživača i uobičajenih tražilica?

Koji će od sljedećih sustava biti metapretraživači:

Koje su najpopularnije domaće tražilice?

Koje su najpopularnije strane tražilice?

Koje su dvije komponente važne pri traženju informacija na internetu?

Koje karakteristike određuju učinkovitost tražilica pri traženju informacija na internetu?

Uvjeti korištenja:
Intelektualna prava na materijal - Informacijske računalne mreže - Borisov N.A., Lukin A.A. pripadaju njegovom autoru. Ovaj priručnik/knjiga objavljena je isključivo u informativne svrhe bez uključivanja u komercijalni promet. Sve informacije (uključujući i “Temu 3. Traženje informacija na INTERNETU”) prikupljaju se iz otvorenih izvora ili dodaju korisnici besplatno.
Za potpunu upotrebu objavljenih informacija, projektna administracija stranice toplo preporučuje kupnju knjige / priručnika Informacijske računalne mreže - Borisov N.A., Lukin A.A. u bilo kojoj online trgovini.

Blok oznaka: Informacijske računalne mreže - Borisov N.A., Lukin A.A., 2015. Tema 3. Traženje informacija na INTERNETU.

(C) Web stranica pravnog repozitorija 2011.-2016

Traženje informacija na Internetu

Traženje informacija na Internetu

Za traženje informacija se obično koriste tri načina(Pogledajte sliku 1). Prvi od toga - pretraživanje po adresi. Koristi se kada korisnik zna adresu informacijskog izvora koji sadrži informacije koje su mu potrebne. Prilikom organiziranja pretraživanja informacija po adresi (oblik adrese - IP, domena ili URL - u ovom slučaju nije bitan), korisnik jednostavno treba unijeti adresu resursa u odgovarajuće polje preglednika - programa dizajniranog za omogućiti pristup mrežnim resursima.

Riža. 1. Metode traženja informacija u hipertekstualnim bazama podataka

Drugi- pretraživanje pomoću navigacije hipervezom. Kada koristite ovu vrstu slučaja pretraživanja, korisnik prvo mora dobiti pristup poslužitelju povezanom s odgovarajućom bazom podataka. Zatim možete pronaći dokument pomoću hiperveza. Očito, ova metoda je prikladna kada je adresa resursa nepoznata korisniku. Kao polazište za pretraživanje pri implementaciji ove metode namijenjeni su web portali - poslužitelji koji omogućuju izravan pristup određenom skupu poslužitelja, uključujući informacijske resurse koji su na njima instalirani, kao i web aplikacije koje implementiraju web servise koji odgovaraju svrhu portala. Poslužitelji kojima se pristupa putem portala mogu pripadati određenom sustavu (primjerice korporativnom) ili različitim sustavima te biti posebno odabrani prema vrsti, tematskim ili drugim karakteristikama dokumenata i podataka koji se nalaze na njihovim stranicama. Portali obično kombiniraju različite funkcije kako bi zadržali klijenta što je duže moguće. Dominantna usluga portala je usluga help deska: pretraga, kategorije, financijski indeksi, vremenska prognoza itd. Ako su web stranice u većini slučajeva skupovi statičnih web stranica, onda su portali skupovi softverskih alata i unaprijed nestrukturiranih informacija koje ti alati pretvaraju u strukturirane podatke na zahtjev određenih korisnika.

Treći Metoda pretraživanja uključuje korištenje internetskih poslužitelja za pretraživanje. Poslužitelji za pretraživanje namjenska su glavna računala koja ugošćuju baze podataka internetskih izvora. Korisničko sučelje takvog poslužitelja ima polje za unos ključnih riječi koje opisuju temu koja zanima korisnika (vidi sl. 2).

sl.2. Prikaz prozora poslužitelja za pretraživanje Yandex

Poslužitelj te riječi percipira kao informacijski zahtjev, u skladu s kojim pretražuje resurse i korisniku prikazuje popis pronađenih dokumenata. Očito, pri implementaciji ove metode moguće su pogreške i tipa 1 (promašaj cilja) i tipa 2 (informacijski šum). Treba napomenuti da postoje dvije skupine poslužitelja za pretraživanje: tražilice i predmetni katalozi. Njihova razlika je zbog metode stvaranja i naknadnog nadopunjavanja baze podataka internetskih izvora, koje ovaj poslužitelj koristi za traženje informacija. Tako tražilice imaju poseban program – robota za pretraživanje. Stalno nadzire mrežu, prikuplja informacije s web stranica, indeksira ih i bilježi njihovu sliku pretraživanja u svojoj bazi podataka. U predmetnim katalozima, baza podataka internetskih dokumenata "ručno" se stvara od strane specijaliziranih urednika. Kako na Internetu ne postoji jedinstvena administracija, njegovi se informacijski resursi stalno mijenjaju. U njemu se mogu pojaviti novi dokumenti, a postojeći dokumenti mogu nestati. Učestalost ažuriranja informacija u dokumentima za različite stranice je različita: za neke je to nekoliko puta u satu, za neke jednom dnevno, dan, mjesec itd. Stoga je vrlo važno razumjeti da se pri korištenju sustava za pretraživanje informacija za pronalaženje informacija na Internetu pretraživanje ne provodi na stvarnom prostoru internetskih dokumenata, već u nekom modelu, čiji se sadržaj može značajno razlikovati od stvarnog Internetski sadržaj u trenutku pretraživanja. Na temelju pokrivenosti indeksiranih izvora, tražilice se mogu podijeliti u dvije skupine: međunarodne i one na ruskom jeziku. Prvi redom indeksiraju sve dokumente objavljene na internetu. Potonji indeksiraju resurse koji se nalaze u domenskim zonama s prevlašću ruskog jezika. Popis najpopularnijih sustava dan je u tablici. 1.

Stol 1. Najpopularnije tražilice

Međunarodni govori ruski
Google Yandex (44,4% Runeta)
Yahoo! Rambler (10,6% Runeta)
Bing Mail.ru (7,3% Runeta)
MSN Nigma (0,5% Runeta)
AltaVista Gogo.ru (0,3% Runeta)
Pitajte Aport (0,2% Runeta)

Napomena: Runet je dio Interneta na ruskom jeziku koji se sastoji od domena s imenima ru i RF.

Potrebno je napomenuti da postoji posebna kategorija poslužitelja za pretraživanje - metapretraživači. Njihova temeljna razlika u odnosu na tražilice i predmetne kataloge je u tome što nemaju vlastitu indeksnu bazu podataka, pa ga po primitku zahtjeva korisnika preusmjeravaju na više poslužitelja za pretraživanje odjednom (vidi sl. 3).

Riža. 3. Shema rada sustava za metapretraživanje

Mogućnost istovremenog korištenja nekoliko tražilica za jedan upit očita je prednost metatražilica. Trenutno je sustav Metabot.ru, čije je sučelje prikazano na slici 1, pronašao široku upotrebu. 4. Ovaj sustav vam omogućuje korištenje međunarodnih i ruskih poslužitelja za traženje resursa.

Tri načina pretraživanja interneta

Internet općenito, a posebno World Wide Web pretplatniku pružaju pristup tisućama poslužitelja i milijunima web stranica koje pohranjuju nezamislivu količinu informacija. Kako se ne izgubiti u ovom "okeanu informacija"? Da biste to učinili, morate naučiti pretraživati ​​i pronaći potrebne informacije na internetu.

Kao što je već spomenuto, postoje tri glavna načina traženja informacija na internetu.

1. Određivanje adrese stranice. Ovo je najbrži način pretraživanja, ali se može koristiti samo ako je poznata točna adresa dokumenta.

2. Navigacija preko hiperveza. Ovo je najmanje prikladna metoda, jer se može koristiti za traženje dokumenata koji su samo bliski po značenju trenutnom dokumentu. Ako je trenutni dokument posvećen, na primjer, glazbi, tada korištenjem hiperveza u ovom dokumentu malo je vjerojatno da ćete moći doći do stranice posvećene sportu.

3. Kontaktiranje poslužitelja za pretraživanje (tražilica). Korištenje poslužitelja za pretraživanje najprikladniji je način za pronalaženje informacija. Trenutno su sljedeći poslužitelji za pretraživanje popularni u dijelu interneta na ruskom jeziku: Yandex; Lutalica.

Postoje i druge tražilice. Na primjer, učinkovit sustav pretraživanja implementiran je na poslužitelju usluge pošte mail.ru.

Pretraživanje poslužitelja

Najpristupačniji i najprikladniji način traženja informacija na World Wide Webu je korištenje tražilica. U ovom slučaju informacije se mogu pretraživati ​​kroz kataloge, kao i kroz skup ključnih riječi koje karakteriziraju tekstualni dokument koji se pretražuje.

Pogledajmo detaljnije korištenje poslužitelja za pretraživanje. Poslužitelj za pretraživanje sadrži velik broj poveznica na najrazličitije dokumente, a sve su te poveznice sistematizirane u tematske kataloge. Na primjer: sport, kino, automobili, igrice, znanost, itd. Štoviše, ove veze instalira poslužitelj neovisno, automatski redovitim pregledom svih web stranica koje se pojavljuju na svjetskoj mreži. Osim toga, tražilice korisniku pružaju mogućnost pretraživanja informacija pomoću ključnih riječi. Nakon unosa ključnih riječi poslužitelj za pretraživanje počinje pregledavati dokumente na drugim web poslužiteljima i prikazivati ​​poveznice na te dokumente u kojima se navedene riječi pojavljuju. Obično se rezultati pretraživanja poredaju silaznim redoslijedom prema posebnoj ocjeni dokumenta, koja pokazuje koliko u potpunosti određeni dokument ispunjava uvjete pretraživanja ili koliko se često traži na mreži.

Jezik upita tražilice

Grupa ključnih riječi formirana prema određenim pravilima - pomoću jezika upita - naziva se zahtjev poslužitelju za pretraživanje. Jezici upita za različite poslužitelje za pretraživanje vrlo su slični. Više o tome možete saznati ako posjetite odjeljak "Pomoć" željenog poslužitelja za pretraživanje. Pogledajmo pravila za formiranje upita na primjeru tražilice Yandex.

Sintaksa operatora Što operator znači? Primjer zahtjeva
razmak ili & Logičko I (unutar rečenice) Fiksne proteze
&& Logički I (unutar dokumenta) Vrste && (fiksne proteze)
| Logički ILI fotografija | fotografija | snimka | fotografska slika
+ Obavezna prisutnost riječi u pronađenom dokumentu +biti ili +ne biti
() Grupiranje riječi (tehnologija | proizvodnja) (sir | svježi sir)
~ Binarni operator I NE (unutar rečenice) banke ~ zakon
~~ ili _ Binarni operator I NE (unutar dokumenta) Pariz vodič ~~ (agencija | obilazak)
/(n m) Udaljenost u riječima (minus (-) – natrag, plus (+) – naprijed) dobavljači /2 kava glazba /(-2 4) slobodna radna mjesta za obrazovanje ~ /+1 student
« « Potražite frazu “Fiksne proteze” Ekvivalent: fiksne /+1 proteze
&&/(n m) Udaljenost u rečenicama (minus (-) – natrag, plus (+) – naprijed) medicina && /1 protetika

Opće informacije.

Trenutno Internet objedinjuje stotine milijuna poslužitelja koji ugošćuju milijarde različitih stranica i pojedinačnih datoteka koje sadrže različite vrste informacija. Ovo je ogromno skladište informacija. Postoje različite metode za pretraživanje informacija na Internetu.

Pretraživanje po poznatoj adresi. Potrebne adrese su preuzete iz imenika. Znajući adresu, samo je unesite u adresnu traku preglednika.

www.gov.ru - poslužitelj ruskih državnih tijela.

Konstruiranje adrese od strane korisnika. Poznavajući sustav za formiranje internetskih adresa, možete konstruirati adrese prilikom pretraživanja web stranica.

Ključnoj riječi (ime tvrtke, poduzeća, organizacije ili jednostavna engleska imenica) potrebno je dodati tematsku ili geografsku domenu, te povezati svoju intuiciju.

Adrese komercijalnih web stranica:

www.cnn.com (CNN Svjetske vijesti),

www.sony.com (tvrtka SONY),

www.mtv.com (MTV glazbene vijesti).

Adrese obrazovnih ustanova:

www.ntu.edu (Nacionalno sveučilište SAD-a).

Regionalne adrese poslužitelja:

www.poland.net (Poljska),

www.israil.net (Izrael).

Internetske tražilice

Za traženje informacija na internetu razvijeni su posebni sustavi za pretraživanje informacija. Tražilice imaju uobičajenu adresu i prikazuju se kao web stranica koja sadrži posebne alate za organiziranje pretraživanja (niz za pretraživanje, imenik predmeta, poveznice). Za pozivanje tražilice jednostavno unesite njenu adresu u adresnu traku preglednika.

Sustavi za pretraživanje informacija prema načinu organiziranja informacija dijele se na dvije vrste: klasifikacijske (rubrikatore) i rječničke.

Kategorije (klasifikatori) su tražilice koje koriste hijerarhijsku (stablastu) organizaciju informacija. Prilikom traženja informacija, korisnik pregledava tematske naslove, postupno sužavajući polje pretraživanja (na primjer, ako trebate pronaći značenje riječi, prvo trebate pronaći rječnik u klasifikatoru, a zatim pronaći željenu riječ u to).

Sustavi za pretraživanje rječnika moćni su automatski softverski i hardverski sustavi. Uz njihovu pomoć informacije se pregledavaju (skeniraju) na internetu. Podaci o lokaciji ove ili one informacije unose se u posebne imenike indeksa. Kao odgovor na zahtjev, vrši se pretraga prema nizu upita. Kao rezultat, korisniku se nude one adrese (URL-ovi) na kojima je pronađena tražena riječ ili skupina riječi u trenutku skeniranja. Odabirom bilo koje od predloženih adresa poveznica možete otići na pronađeni dokument. Većina modernih tražilica je mješovita.

Najpoznatije i najpopularnije tražilice:

www.aport.ru www.yahoo.com www.rambler.ru www.yandex.ru www.altavista.com www.google.com

Postoje sustavi koji su specijalizirani za traženje izvora informacija u različitim područjima.

Traženje ljudi na internetu:

www.whowhere.ru www. bigfoot.com

Pretraživanje news grupa (Usenet):

www.dejanews.com

Predmetne tražilice:

Softver za pretraživanje:

Pretraživanje arhiva datoteka:

http://ftpseach. city.ru, http://ftpsearch. licos.com

Katalozi (tematske zbirke poveznica s komentarima):

http://www.atrus.ru

Često se učinkovito pretraživanje informacija može provesti pomoću regionalnih imenika - specijaliziranih poslužitelja koji sadrže podatke o poduzećima ili web resursima grada ili regije. Na primjer, za St. Petersburg takav imenik nalazi se na http://www.spb.ru.

Popis IPS-a možete pronaći na web stranici www.monk. newmail.ru

Detaljniji popis tražilica i imenika prikazan je u tablici. 3.2.

Pravila za izvršavanje zahtjeva

Odjeljak pomoći svake tražilice pruža informacije o tome kako pretraživati ​​i kako sastaviti niz upita. Ispod su informacije o tipičnom, "prosječnom" jeziku upita.

Jednostavan zahtjev.

Unesite jednu riječ koja definira temu pretraživanja. Na primjer, u tražilicu Rambler.ru dovoljno je unijeti: automatizacija.

Pronađeni su dokumenti koji sadrže riječi navedene u zahtjevu. Prepoznaju se svi oblici ruskih riječi; u pravilu se zanemaruju velika i mala slova.

U upitu možete koristiti znak "*" ili "?". Znak "?" u ključnoj riječi zamjenjuje se jedan znak umjesto kojeg se može zamijeniti bilo koje slovo, a znak “*” je niz znakova.

Na primjer, upit automatski* omogućit će vam da pronađete dokumente koji sadrže riječi automatski, automatizacija itd.

Kompleksan zahtjev.

Često postoji potreba za kombiniranjem ključnih riječi kako bi se dobile preciznije informacije. U tom se slučaju koriste dodatne povezne riječi, funkcije, operatori, simboli, kombinacije operatora odvojene zagradama.

Na primjer, upit glazba & (beatles | beatles) znači da korisnik traži dokumente koji sadrže riječi glazba i beatles ili glazba i beatles.

Tablica 3.1 prikazuje pravila za generiranje zahtjeva usvojena u sustavu Aport (http://www.aport.ru).

Tablica 3.1

Operatori za formiranje upita

Operater Sinonimi Komentar
I I& Upit će pronaći dokumente koji sadrže obje ključne riječi. Ne morate to napisati. Na primjer, upit: informatika i udžbenik ekvivalentan je udžbeniku informatike
ILI ILI | Traže se oni dokumenti koji koriste jednu od navedenih riječi ili obje riječi u isto vrijeme.
NE NE - ~ Pretraživanje je ograničeno na dokumente koji ne sadrže riječ navedenu iza operatora
" " " " Dvostruki ili jednostruki navodnici omogućuju vam da pronađete frazu
Datum= datum:datum= Pretraživanje je ograničeno na dokumente koji spadaju unutar navedenog datumskog raspona Primjer 1. datum valute=01/02/2002-01/03/2002. Ovaj zahtjev će proizvesti dokumente koji sadrže riječ "valuta" i imaju datum od 1. veljače 2002. do 1. ožujka 2002. Primjer 2. datum = 01/03/2002 valuta Primjer 3. datum:<02/03/2002 валюта

Tablica 3.2

Popis tražilica i imenika

Adresa Opis
www.excite.com Tražilica s pregledima stranica i vodičima
www.alta-vista.com Poslužitelj za pretraživanje, dostupne mogućnosti naprednog pretraživanja
www.hotbot.com Poslužitelj za pretraživanje
www.poland.net www.israil.net Regionalni poslužitelji za pretraživanje Poljske, Izraela
www.ifoseek.com Poslužitelj za pretraživanje (jednostavan za korištenje)
www.ipl.org Internet Publik knjižnica, narodna knjižnica koja djeluje u okviru projekta Svjetsko selo
www.wisewire.com WiseWire - organizacija pretraživanja pomoću umjetne inteligencije
www.webcrawler.com WebCrawler - poslužitelj za pretraživanje, jednostavan za korištenje
www.yahoo.com CatalogWeb i sučelje za pristup pretrazi cijelog teksta na AltaVista poslužitelju
www.aport.ru Aport - poslužitelj za pretraživanje na ruskom jeziku
www.yandex.ru Yandex - poslužitelj za pretraživanje na ruskom jeziku
www.rambler.ru Rambler - poslužitelj za pretraživanje na ruskom jeziku
Internetski izvori pomoći
www.yellow.com Yellow Pages Internet
redovnik newmail.ru Tražilice raznih profila
www.top200.ru Top 200 web stranica
www.allru.net
www.ru Katalog ruskih internetskih izvora
www.allru.net/z09. htm Obrazovni resursi
www.students.ru Ruski studentski poslužitelj
www.cdo.ru/index_new. asp Centar za učenje na daljinu
www.otvoreno. ak. uk UK Open University
www.ntu.edu Nacionalno sveučilište SAD-a
www.translate.ru Elektronički prevoditelj teksta
www.pomorsu.ru/vodič. knjižnica.html Popis poveznica na mrežne knjižnice
www.elibrary.ru Znanstvena elektronička knjižnica
www.citforum.ru Digitalna knjižnica
www.infamed.com/psy Psihološki testovi
www.pokoleniye.ru Web stranica Internet Education Federation
www.metoda. narod.ru Obrazovni resursi
www.spb. osi.ru/ic/distant Učenje na daljinu na internetu
www.examen.ru Ispiti i kolokviji
www.kbsu.ru/~book/ Udžbenik informatike
Mega. km.ru Enciklopedije i rječnici

Traženje informacija na internetu: zamke

Problemi koji nisu na površini često se pokažu tek “unatrag”, nakon što je završena određena faza traženja i, možda, na temelju njegovih rezultata, već je donesena odluka. Što vas sprječava da situaciju učinite transparentnom od samog početka rada ovog ili onog sustava za pretraživanje informacija (IRS)? Odgovor je prilično jednostavan: nedostatak sveobuhvatnih informacija ove vrste od strane programera. Izravna posljedica toga je nepouzdanost primljenih podataka i njihov nekontrolirani gubitak. Rijetko se može pronaći tražilica na internetu koja nema neke "nedokumentirane" mogućnosti. Čini se da korisnik ne treba puno informacija, naime:

kako se popunjava IPS baza podataka i koliki je njen obujam;

cijeli raspon jezičnih mogućnosti pretraživanja sustava;

glavne značajke prikaza rezultata pretraživanja, prvenstveno algoritam za rangiranje zapisa s liste odgovora na upit za pretraživanje.

Nažalost, izvor takvih informacija obično nije dokument dostupan s glavne stranice poslužitelja za pretraživanje, već publikacije pojedinačnih autora razasute po Internetu, knjige i računalni časopisi. Razlozi za ovakvo stanje stvari, očito, uključuju ne samo nemar programera, već i faktor koji se zove marketinška politika. Jednostavno rečeno, pružanje tražilici najpotpunijih informacija o sebi nema uvijek pozitivan učinak na njezino rangiranje. Međutim, u nekim slučajevima korisnik je sasvim sposoban preuzeti kontrolu nad situacijom. Često je testiranjem moguće saznati karakteristike rada odabrane usluge pretraživanja. Konstruiranje posebnih testnih upita koji brzo razjašnjavaju točno onaj aspekt rada sustava koji je najvažniji za trenutni zadatak u mnogim se slučajevima pokazuje netrivijalnim. Našu ćemo raspravu posvetiti tome kako izbjeći neke probleme pri radu s IPS-om. Kao primjeri za ilustraciju izlaganja razmotrit će se poznate internetske tražilice.

Učinkovito pretraživanje informacija pomoću računala hitan je zadatak koji se nameće ne samo početnicima, već i iskusnim korisnicima interneta, jer onaj tko posjeduje podatke, posjeduje svijet, kako kaže poznata poslovica. Danas ćemo pogledati načine za brzo pronalaženje potrebnih i važnih informacija na internetu na ruskom jeziku. U ovom trenutku postoje samo tri vrste:

  1. navođenjem izravne adrese stranice na kojoj se nalaze potrebni podaci i informacije;
  2. surfanje vezama pomoću osobnog računala na internetu;
  3. pomoću tražilica (strojeva) na internetu.

Pogledajmo detaljnije sve načine pretraživanja ažuriranih informacija na Internetu pomoću računala.

Traženje informacija putem izravne poveznice na internetu

Ako već znate gdje se informacije koje su vam potrebne na Internetu nalaze, pretraživanje pomoću računala postaje mnogo lakše: samo trebate unijeti adresu stranice u traku preglednika i upoznati se s ponuđenim podacima. Ako vidite pozamašan tekst na web stranici na Internetu, a zanima vas doslovno nekoliko redaka skrivenih u “tonu” tiskanih znakova, tada možete koristiti pretraživanje unutar stranice. Da biste to učinili, pritisnite kombinaciju tipki Ctrl i F (bilo koji raspored tipkovnice računala), au predloženi stupac "Traži" unesite frazu ili riječ koja se točno nalazi u odlomku s informacijama koje tražite, a zatim pritisnite " Unesi".

Preglednik će označiti drugom bojom sve riječi spomenute na stranici koje su slične riječi koju tražite. No, nerijetko se događa da se ne sjećamo ili čak ne znamo poveznice na koje se informacije nalaze na internetu. U ovom slučaju najprikladnije je pribjeći drugim dvjema vrstama pretraživanja podataka pomoću računala.

Pretražujte surfanjem internetom

Internetsko surfanje je pretraživanje koje uključuje uzastopno praćenje poveznica s jednog tematskog mjesta na drugo dok se ne pronađe izvor potrebnih podataka. Prednost ovog načina pretraživanja internetskih podataka je njegova fascinantnost i mogućnost dosljednog i temeljitog svladavanja velike količine informacija s različitih stranica. Među nedostacima ove vrste pretrage je njezino trajanje, kao i činjenica da također morate nekako doći do izvorne stranice s koje će vaše surfanje započeti. A ako nemate adresu web mjesta s kojeg ćete početi surfati, onda ćete ovdje morati pribjeći pomoći takvoj metodi pretraživanja kao što su tražilice.

Načini traženja informacija na internetu pomoću tražilica

Danas su takve tražilice kao što su Yandex.ru, Rambler.ru, Google.ru nadaleko poznate javnosti Runeta. Ova mjesta vam omogućuju pretraživanje podataka unosom upita na svim internetskim stranicama. Prema principu rada, tražilice su dvije vrste: indeksi pretraživanja i direktoriji pretraživanja:

  • Pretraži direktorije. Ove stranice pružaju pomoć u traženju podataka o određenoj temi na internetu: informacije u takvim katalozima jasno su strukturirane u skupine i teme, što pomaže u brzom pronalaženju rezultata. U svakoj temi korisniku se nudi niz poveznica na stranice na kojima može pronaći zanimljiva znanja.
  • Indeksi pretraživanja. Riječ je o indeksnim stranicama na kojima korisnik prilikom unosa ključne riječi u traku za pretraživanje dobiva niz poveznica na stranice na internetu koje sadrže traženu riječ ili izraz. Indeksi pretraživanja provode pretraživanja pomoću posebnih programa koji se nazivaju "pauci" koji skeniraju stranice web-mjesta na Internetu tražeći njihovu temu. Nakon takvog skeniranja, tražilica ih unosi u svoju bazu podataka iz koje se informacije kasnije “izvlače” kada korisnik upiše upit u traženi pojam.

Pravila pretraživanja informacija na internetu

Sada pogledajmo osnovna, ali važna pravila za učinkovito pretraživanje ažuriranih informacija na internetu na ruskom jeziku pomoću računala.

  1. Formirajte ispravnu ključnu frazu za pristup tražilici. Ne možete koristiti samo jednu riječ za pretraživanje ako želite dobiti uistinu koristan rezultat i ne biste trebali unositi preduge izraze. Optimalna veličina upita za pretraživanje je od 2 do 4 riječi. Ako tražilica pronađe premalo rezultata u rezultatima pretraživanja, pokušajte preformulirati uneseni izraz, zamjenjujući neke riječi sinonimima, a također provjerite pravopisne pogreške u riječima. Upamtite: ne postoji informacija koja nije na internetu. Samo odaberite prave riječi, slijedite pravila i pronaći ćete ono što tražite.
  2. Koristite posebne operatore. Suvremeno učinkovito i brzo traženje svih potrebnih informacija pomoću tražilice i korištenja osobnog računala podrazumijeva poznavanje i primjenu nekih trikova, a to su kratice i posebni znakovi operatora. Operatori su ikone koje se koriste prilikom formiranja upita u tražilici i olakšavaju pronalaženje potrebnih podataka. Pogledajmo najčešće operatore i njihova značenja koja mogu biti korisna u praksi.
  3. Razmak ili znak & znači da trebate tražiti dokumente sa traženom frazom unutar iste rečenice. Primjer unosa u traku za pretraživanje: delicious recipe ili delicious & recipe.
  4. && - znači potrebu traženja stranice na kojoj će se pojedine riječi iz fraze spominjati u cijelom tekstu, a ne samo u jednoj rečenici. Primjer: ukusan && recept.
  5. | - bit će vam ponuđeni članci unutar kojih će se koristiti samo 1 od unesenih riječi. Primjer: brak | nedostatak | mana.
  6. + - označava traženje teksta uz obaveznu kombinaciju riječi unesenu između znaka “+”. Primjer: ukusno + recept.
  7. “ ” – traži niz riječi bez razbijanja na pojedinačne riječi. Primjer: "Bomboni Krasnaya Polyana".

Pridržavajući se ovih jednostavnih pravila prilikom pretraživanja podataka putem računala i interneta, olakšat ćete si zadatak i uvijek ćete moći brzo pronaći potrebne informacije u bilo kojem trenutku.

Najnoviji materijali stranice