Kolm peamist viisi Internetist teabe otsimiseks. Internetist teabe otsimine 3 võimalust Internetist teabe otsimiseks

28.03.2023
Haruldased tütretütred võivad kiidelda, et neil on ämmaga tasavägised ja sõbralikud suhted. Tavaliselt juhtub täpselt vastupidine

Otsinguprobleem ja selle korraldamise vahendid

Internetis kättesaadavad tohutud ja pidevalt suurenevad infomahud, sh. toimiv, muudab vajaliku teabe leidmise probleemi väga asjakohaseks ja keeruliseks. Vajaliku info otsimise kiirus määrab suurel määral internetikasutaja professionaalsuse. Tasub öelda, et selle ülesande automatiseerimiseks on välja töötatud erinevad nii välismaised kui ka kodumaised otsingusüsteemid, mis on spetsiaalset tüüpi veebilehed. Samal ajal on see ülesanne vaatamata arvukate otsingu automatiseerimise tööriistade olemasolule üsna töömahukas, nõudes kasutajalt teatud kogemusi, intuitsiooni ja teadmisi oma ainevaldkonnas kasutatava terminoloogia kohta.

Ajakirjas Nature 8. juulil 1999 avaldatud hinnangu kohaselt oli avalikult indekseeritud veebilehtede arv 800 miljonit. Aasta hiljem arvas uuringu autor (Steve Lawrence NEC Research Institute'ist) peaaegu kahekordistunud 1,5 miljardini. Isegi parimad otsingumootorid ei indekseeri rohkem kui ühte lehekülge kuuest. Tasub öelda, et Internetist kasuliku teabe ammutamiseks peate teadma, kust ja kuidas otsida.

Internet Exploreri otsingutööriist hõlbustab juurdepääsu otsingutööriistadele, ilma et peaksite teadma otsingumootori aadresse. Sel juhul on parem otse otsingumootoritega ühendust võtta, laadides vastava lehe.

Otsingu korraldamise meetodi ja pakutavate võimaluste põhjal saab kõik otsingutööriistad jagada järgmistesse rühmadesse:

kataloogid ja spetsiaalsed andmebaasid;

otsingumootorid;

metaotsingumootorid.

Kataloogid ja andmebaasid

WWW kataloogid on sarnased süstemaatiliste raamatukogukataloogidega. Kataloogiotsing koosneb järjestikusest liikumisest läbi hierarhilise linkide loendi, mida nimetatakse pealkirjadeks või kategooriateks. Kataloogi esimesel lehel on lingid olulisematele teemadele, nagu kultuur ja kunst; Meditsiin ja tervis; Ühiskond ja poliitika; Äri ja majandus; Meelelahutus jne. Klõpsates hiirega antud lingil (kategoorial), avaneb leht, mis sisaldab linke, mis kirjeldavad valitud teemat (kategooriat) Detailsete kategooriate vahel allapoole liikudes leiate vajaliku teabega lehe. Igal lehel, mis ühel või teisel viisil kataloogis liikudes avaneb, on märgitud vaadatud alamkategooriate järjestus, näiteks Ärimaailm: Finants: Analüütika jne.

Kõik kataloogid loovad ja ajakohastavad käsitsi spetsialistide poolt, sarnaselt sellele, kuidas bibliograafid koostavad ja hooldavad raamatukogukatalooge. On asjakohane märkida, et teaviku kirjeldamise teevad kas kataloogi koostajad või autor. Tänu sellele on kataloogis sisalduvate lehekülgede sisu kõige adekvaatsem kategooriasse, kuhu need on liigitatud. Kuid arvestades Internetis teabe täiendamise ja muutmise kiirust, ei võimalda kataloogide haldamise "käsitsi" meetod meil sellel teemal Interneti-ressursside tegelikku olukorda adekvaatselt kajastada.

Otsingumootorid

(otsingumootorid, otsinguserverid, otsingurobotid)

Internetis otsimiseks on loodud kümneid suuri ja tuhandeid väikeseid ja spetsiaalseid veebisaite. ϶ᴛᴏnda rühma otsingutööriistad võimaldavad kasutajal vastavalt teatud reeglitele sõnastada nõuded talle vajaliku teabe jaoks (kasutades päringu koostamiseks päringukeelt). Pärast seda otsib otsingumootor automaatselt saitide dokumente. see kontrollib (indekseerib) ja valib neist välja need, mis "arvamuses » otsinguserver, ϲᴏᴏᴛʙᴇᴛϲᴛʙkasutaja poolt sõnastatud nõuded (päringu suhtes asjakohased) Otsingusõlmed saavad kasutada oma Interneti-indekseid, mida ajakohastavad pidevalt spetsiaalsed programmid, mida nimetatakse ämblikeks. Ämblikprogramm. uurib veebi, kontrollides iga antud lehe linki, seejärel adresseeritud lehtede linke jne, ning teavitab selle omanikku kõigi lehtede kohta teabest, et edaspidi indekseerida.

Otsingu tulemusel luuakse üks või mitu lehekülge, mis sisaldavad linke päringuga asjakohastele dokumentidele (veebilehtedele) Tasub öelda, et iga lingi puhul on märgitud dokumendi loomise kuupäev, maht, asjakohasuse määr. päringule ning tavaliselt märgitakse ära ka dokumendi sisu iseloomustavad tekstikatked. Sellisel lingil klõpsates saate laadida teid huvitava lehe. Väga suure hulga leitud dokumentide puhul saate päringut täpsustada ja sellega otsingut korrata, kuid ainult valitud lehtede hulgast (sellist otsingut kutsutakse erinevates masinates erinevalt, kuid tavaliselt ϶ᴛᴏ - otsi leitud hulgast) Paljudes otsingumootorites saate teatud meetodi abil muuta lingi lehele, mille sisu vastab teie vajadustele kõige paremini, ja korrata otsingut, paludes otsida sarnaseid.

Automaatotsingu eeliseks on sisuliselt see, et see võimaldab vaadata väga suurt hulka hetkel Internetis saadaolevat teavet. Samal ajal viib päringu täpse kirjelduse keerukus, mis kajastab adekvaatselt teie teabevajadusi, ning veelgi keerulisem ülesanne automaatselt määrata teie päringu jaoks vaadatud lehekülgede määr selleni, et "Esimesel külastusel" valitud lehtede arv on traditsiooniliselt kas väga väike või liiga suur . Üldjuhul on otsingumootori abil otsimine iteratiivne (mitmekäiguline) protsess, mille tulemusena täpsustatakse järk-järgult päringu vormi.

Metaotsingumootorid

Nagu eespool märgitud, skannib iga otsingumootor teatud serverite komplekti ja valib dokumendid vastavalt oma kriteeriumidele. Sellest tulenevalt annab erinevate süsteemide abil samade märksõnade abil otsimine erinevaid tulemusi. Sellest tekkis idee luua nn metaotsingu (või multisearch) süsteemid, mis ise midagi ei otsi, vaid pöörduvad abi saamiseks korraga mitme otsingumootori poole. Pange tähele, et igal metaotsingumootoril on oma päringukeel. Süsteem tõlgib oma keeles koostatud päringu iga otsingumootori kasutatavatesse päringukeeltesse. Järgmisena kombineeritakse kõigi süsteemide otsingutulemused ja esitatakse need selgel kujul. Loomulikult võtab metaotsingumootorite abil otsimine tavaliste otsingumootoritega võrreldes kauem aega.

Kõige populaarsemate otsingumootorite ülevaade

Internetis on suur hulk otsingumootoreid ja iga kasutaja keskendub sellele, millega ta on harjunud või mida kolleegid tal kasutada soovitasid. Kasutame kõige populaarsemate otsingumootorite lühikirjeldust, mis on antud ühel saidil.

1. Google (www.google.com) Kiireim ja suurim otsingumootor. Indekseeritud on üle 1,3 miljardi lehekülje (millest veidi üle 700 miljoni on täielikult indekseeritud, ülejäänute kohta on teada vaid aadress ja lingi tekst) Otsib tavapäraselt venekeelseid ressursse kasutades (loomulikult ilma sõnavormideta) , on võimalik valida liidese keel. Saate kaasata/välistada tulemusi konkreetsetelt saitidelt ja/või domeenidelt. Erinevalt enamikust otsingumootoritest hindab Google ressursi populaarsust teistelt lehtedelt sinna viivate linkide arvu järgi. On olemas teemapõhine otsing - Apple Macintosh, BSD UNIX, Linux, USA valitsuse ja ülikooli otsingud - otsige juhtivate teadus- ja haridusasutuste ressurssidest.

2. Yandex (www.yandex.ru) Kodumaiste otsingumootorite parim. Indekseerib peamiselt venekeelseid ressursse, samas kui selle võimalused ei jää välismaistele süsteemidele alla. Otsingut saab teha täpselt või mis tahes sõnavormis, kuupäevapiiranguga, märkides saidi või selle alamkataloogi. Otsida saab nn tsiteerimisindeksi alusel, otsida pilte, skripte, aplette; määrake dokumendi keel. Vajalikud lingid leitakse traditsiooniliselt esimese kümne tulemuse hulgast. Sellel on "kerge" versioon (minimaalsete kujunduselementidega) aadressil http://www.ya.ru.

3. AltaVista (www.altavista.com) Pakub otsingukriteeriumide suurt laiendust: Täpsem otsing on ajaperioodi valik, mis sisaldab ressursi loomise või muutmise kuupäeva, 25 keele tugi; iga saidi kohta on võimalik tagastada üks tulemus (kitsendab otsingut kvaliteeti ohverdamata) Power searchil on standardsed võimalused. Kuni viimase ajani oli AV suur portaal, kuid rahalistel (ja muudel) põhjustel vähendas see oluliselt teenuste hulka.

4. Yahoo! (www.yahoo.com) Oluline on märkida, et üks esimesi otsingumootoreid Internetis. Lisaks standardsetele funktsioonide komplektile võimaldab see valida ressursse kuupäeva järgi (4 aastat, 1, 3, 6 kuud, nädal, 1, 3 päeva) Toetab võimalust määrata märki “*” mis tahes järjestuse asemel märksõnu märksõnades. Yahoo! Kategooriatest on koostatud mahukas struktureeritud kataloog, millest otsitakse esmalt nendes, seejärel meie enda arhiivis, seejärel Google'i süsteemi abil. Kategooriate järgi otsimine annab häid tulemusi - neid pole palju ja need on väga head.

5. Lycos (www.lycos.com) Viimasel ajal – üks populaarsemaid süsteeme. Samal ajal ei paku see mingeid erilisi võimalusi - "JA" "VÕI", fraaside otsimine, sõna kohustuslik olemasolu / puudumine; täiustatud funktsioonides – otsige pealkirja, URL-i, hostinime ja/või domeeninime järgi; 25 keelt, sealhulgas vene keel - ühesõnaga kogu "üldtunnustatud" komplekt. Saate määrata ressursi sisu tüübi – auto, raamatud, ftp, allalaadimine, uudised jne. Ilmselgelt on Lycose populaarsus selle suure projekti ulatuse tagajärg.

6. Rambler (www.rambler.ru) Kuni viimase ajani kõige kuulsam Venemaa otsingumootor. Täpsem otsing ei võimalda teil otsida fraase ja tavaline otsing kuni 2010. aasta veebruarini andis harva vastuvõetavaid tulemusi. Alates veebruarist on süsteem kasutanud täiustatud otsingumehhanismi, disain on muutunud, kuid kvaliteedi poolest ei anna Rambler endiselt Yandexi ja Aportiga võrrelda (otsingumootoreid analüüsiva autori sõnul). Sait sisaldab ressursside reitingute kataloogi Rambler Top 100, üks tunnustatumaid statistilise teabe allikaid Interneti-projektide kohta.

7. Aport (www.aport.ru) Veel üks hea vene otsinguserver. Otsing toimub teksti (ainult kõigis sõnavormides) ja URL-i järgi, kasutades loogilisi operaatoreid ja operaatorit "..." (fraasi stoppsõnu siiski eiratakse), kuupäeva ja üksikute väljade järgi (pealkiri) , kirjeldus jne), toetatakse metamärke * ja!. Otsingutulemuste esitus on teiste Venemaa otsingumootoritega võrreldes kõige paremini kujundatud. Ilmselgelt infoga ülekoormatud avalehe kujundus tekitab mõningaid kahtlusi. Aadressil http://aport.ru on pisut "lihtsam" versioon.

Kuidas valida otsingumootorit

Internetist otsides on olulised kaks komponenti - täielikkus (midagi ei läinud kaduma) ja täpsus (midagi üleliigset ei leitud) Tavaliselt nimetatakse kõike ühe sõnaga - asjakohasus, see tähendab vastus küsimusele.

1. Katvus ja sügavus

Katvuse all peame silmas otsingumootori andmebaasi mahtu, mida mõõdetakse kolme näitajaga - indekseeritud teabe kogumaht, unikaalsete serverite arv ja unikaalsete dokumentide arv. Sügavuse all peame silmas seda, kas ühes serveris on piiratud lehekülgede arv või kataloogide pesastamise sügavus.

Kuidas kontrollida: mõned masinad kirjutavad veebisaidile roboti statistikat. Kuid saate seda ise kontrollida - peate määrama mitu ühest sõnast koosnevat otsingupäringut (et välistada päringukeele mõju, sealhulgas ruumi erinevad tõlgendused) ja samal ajal vaadata tulemuste statistikat masin - tavaliselt näitab loendi alguses, mitu dokumenti leiti. Lisaks sellele, et sõnad peaksid olema erinevatest piirkondadest, on hea võtta ka erineva kaaluga sõnu - haruldased, “keskmised” ja “rasked” (sagedus) ning võrrelda leitud kogust. Rasked sõnad testivad eelkõige otsingumootori täisteksti (kõikide sõnade indekseerimist dokumendis).

Roboti roomamise sügavust on keerulisem kontrollida – selleks tuleb võtta mõned saidid, näiteks hargnenud arhiivistruktuuriga, ja kontrollida, kas dokumendid on indekseeritud, kuhu pääseb näiteks vaid 6 klõpsuga. linkidel.

2. Roomamise kiirus ja linkide asjakohasus

Veebis roomamise kiirus näitab, kui kiiresti äsja lisatud ressurssi indekseeritakse ja kui kiiresti andmebaasis olevat teavet uuendatakse. Ärge unustage, et otsingumootori (selle roboti) kvaliteedi oluline näitaja pole mitte ainult uute territooriumide hõivamine, vaid ka juba hõlmatud territooriumide seisundi jälgimine. Serverid kaovad ja jäävad, nendel olevaid lehti uuendatakse. Lingid, mille otsingumootor leitute loendis loob, peavad esiteks olemas olema ja teiseks peab nende sisu vastama päringule.

Kuidas kontrollida: Objektiivset teavet saab serveri logisid analüüsides – otsingumootori robotit tutvustatakse tavaliselt tema masina (vms) nime järgi, nii et näete, kui sageli ta serverit külastab, mitut lehekülge vaatab jne. . Kahjuks on tavaliselt uurimiseks saadaval ainult selle saidi logi, nii et katsemeetod jääb alles.

Roomamiskiiruse määramiseks peate looma kuskil tekstilehe, lisama selle otsingumootoritesse ja vaatama, kui kiiresti see ilmuma hakkab. Või muutke olemasolevat lehte. Tasub öelda, et linkide asjakohasuse kindlakstegemiseks kontrollige dokumente vähemalt mitme päringu jaoks leitud loendi esimesel lehel. Teade Not Found näitab, et dokumenti ei ole enam olemas.

3. Otsingu kvaliteet (subjektiivne indikaator)

Tasub öelda, et igal otsingumootoril on otsingutulemuste sortimiseks algoritm. Mida lähemal on vajalik dokument loendi tipule, seda paremini asjakohasus töötab.

Kuidas kontrollida: ainult katse kaudu. Võrdluseks on soovitatav teha erineva pikkusega päringuid. Võite kasutada ka päringukeelt, samas kui need, kes ei soovi kirjeldust lugeda, saavad kasutada laiendatud päringulehte (“täpsem otsing” Aportis ja Yandexis, “üksikasjalik päring” Rambleris – tõlkevalikud vene keelde “täpsem otsing”).

Lisaks asjakohasusele on olulisi kasutajaomadusi.

4. Otsingu kiirus

Kui otsingumootor reageerib aeglaselt, on sellega töötamine ebaefektiivne. Tasub lisada, et kasutajale nähtav kiirus ei sõltu ainult otsingumootorist endast, vaid ka internetikanalitest.

Kuidas kontrollida: Katse teel - peate otsima erineva pikkusega päringuid, erinevaid<тяжести>sõnadega ja erinevatel kellaaegadel (serveri koormus on päeva jooksul oluliselt ebaühtlane, tipphetk on kella kolme-nelja paiku päeval)

5. Otsinguvõimalused (töö dokumendikeelega, päringukeel)

Teine võrdlusmoment on see, mida täpselt ja kuidas otsingumootor indeksisse sisestab. Tasub öelda, et täisteksti otsingumootor indekseerib kõik kasutajale nähtavad teksti sõnad. Morfoloogia olemasolu võimaldab leida otsitavad sõnad kõigis käänetes või konjugatsioonides. Lisaks sellele on HTML-keeles sildid, mida saab ka otsingumootor töödelda (pealkirjad, lingid, piltide pealkirjad jne).

Peaaegu kõigil masinatel on päringukeel standardsete loogiliste operaatorite kujul (AND, OR, NOT). Mõned inimesed teavad, kuidas otsida fraase või sõnu teatud kauguselt – see on sageli mõistliku tulemuse saavutamiseks oluline. Täiendav võimalus on otsida dokumendialadelt – pealkirjad, lingid, märksõnad (META KEYWORDS) jne. Päringukeele lisafunktsiooniks on loomuliku keele päring, mis ei nõua operaatorite tundmist.

Kuidas kontrollida: Tavaliselt avaldatakse see teave otsingumootori serveris (Spikker) Pange tähele, et sellegipoolest on soovitatav kontrollida tegelikke päringuid, kuna mõnikord esitatakse soovitud reaalsus.

6. Lisamugavused

Need on lisafunktsioonid, mida otsingumootor kasutajatele pakub. Siia kuuluvad kõikvõimalikud otsinguvõimalused (spetsiaalsed lehed, sarnaste dokumentide otsimine, otsinguala piiramine) ja leitud serverite loend ning otsing kuupäeva ja serveri järgi ning mugav otsingumootori liides ja võimalus seda isikupärastada.

Kuidas kontrollida: teave võib olla osaliselt avaldatud otsingumootori serveris, kuid kõige parem on proovida nende funktsioonidega ise töötada.

On selge, et see analüüs võtab veidi aega. Lisaks ei seisa otsingumootorid, nagu kogu Internet, paigal. Samas, arvestades, et infootsing on arvutitehnoloogia üks olulisi komponente, tuleks sellele pöörata piisavalt tähelepanu – vähemalt mitte vähem kui kohalikus võrgus töötamise võimalusele.

Veebisaidil Yandex.ru viidi läbi küsitlus: miks on Internetti vaja ja mis selles puudu on (http://www.yandex.ru/polling/9.html) Uuringu andmed jaotati kahanevas järjekorras järgmiselt: Internetti kasutatakse teatmeteosena (23, 76%), uurimisvahendina (15,45%), meelelahutusena (14,15%) ja alles neljandal kohal on uudisteallikas (12,32%).. Optimistlikult kõlas, et 10% kasutajatest alati õnnestub ja 73% õnnestub sageli leida vajalik teave. Ja internetis puudub: info, hea otsing ja järjekord (sh: korrastatus, struktuur, struktuur, struktuur, struktuur, samuti süsteemsus, süstematiseeritus, süsteemsus, süsteemsus ja süstematiseeritus)

VASTA KÜSIMUSTELE:

Nimetage, millised meetodid otsingute korraldamiseks Internetis eksisteerivad?

Kuidas otsitakse teavet kataloogidest ja andmebaasidest?

Kuidas sisestatakse teave kataloogidesse ja andmebaasidesse?

Mis on otsingumootorid Internetis?

Kuidas moodustatakse otsingumootorites infoandmebaas?

Kust algab teabe otsimine otsingumootorites?

Mis on taotlus?

Kuidas otsimootorites teavet otsitakse?

Mida sa mõtled päringu asjakohasuse all?

Mida teha, kui edasisel otsingul leitakse väga palju dokumente?

Mis on metaotsingumootorid?

Mis on põhimõtteline erinevus metaotsingumootorite ja tavaliste otsingumootorite vahel?

Millised järgmistest süsteemidest on metaotsingumootorid:

Millised on kõige populaarsemad kodumaised otsingumootorid?

Millised on kõige populaarsemad välismaised otsingumootorid?

Millised kaks komponenti on Internetist teabe otsimisel olulised?

Millised omadused määravad otsingumootorite tõhususe Internetist teabe otsimisel?

Kasutustingimused:
Intellektuaalsed õigused materjalile - Infoarvutivõrgud - Borisov N.A., Lukin A.A. kuuluvad selle autorile. See juhend/raamat on postitatud üksnes informatiivsel eesmärgil, ilma et see oleks seotud kaubandusliku ringlusega. Kogu teave (sh “Teema 3. Info otsimine INTERNETIST”) kogutakse avatud allikatest või lisatakse kasutajate poolt tasuta.
Postitatud teabe täielikuks kasutamiseks soovitab saidi projektihaldus tungivalt osta raamatu / käsiraamatu Teabearvutivõrgud - Borisov N.A., Lukin A.A. mis tahes veebipoes.

Sildiplokk: Infoarvutivõrgud - Borisov N.A., Lukin A.A., 2015. Teema 3. Info otsimine INTERNETIST.

(C) Õigusaktide hoidla veebisait 2011–2016

Internetist info otsimine

Internetist info otsimine

Teabe otsimiseks kasutatakse tavaliselt kolmel viisil(Vt joonist 1). Esiteks millest - otsi aadressi järgi. Seda kasutatakse siis, kui kasutaja teab talle vajalikku teavet sisaldava teaberessursi aadressi. Aadressi järgi teabeotsingu korraldamisel (aadressi vorm - IP, domeen või URL - antud juhul ei oma tähtsust), peab kasutaja lihtsalt sisestama ressursi aadressi brauseri vastavale väljale - programm, mis on loodud selleks, et pakkuda juurdepääsu võrguressurssidele.

Riis. 1. Hüperteksti andmebaasidest teabe otsimise meetodid

Teiseks- otsige hüperlinkide navigeerimise abil. Seda tüüpi otsingujuhtu kasutades peab kasutaja esmalt saama juurdepääsu vastava andmebaasiga seotud serverile. Seejärel leiate dokumendi hüperlinkide abil. Ilmselgelt on see meetod mugav, kui ressursi aadress on kasutajale teadmata. Selle meetodi rakendamisel otsimise lähtepunktiks on mõeldud veebiportaalid - serverid, mis pakuvad otsest juurdepääsu teatud serverite komplektile, sealhulgas neile installitud teaberessurssidele, samuti veebirakendused, mis rakendavad veebiteenuseid, mis vastavad portaali eesmärk. Portaali kaudu juurdepääsetavad serverid võivad kuuluda konkreetsesse süsteemi (näiteks ettevõttesse) või erinevatesse süsteemidesse ning olla spetsiaalselt valitud vastavalt nende saitidel sisalduvate dokumentide ja andmete tüübile, temaatilistele või muudele omadustele. Tavaliselt ühendavad portaalid erinevaid funktsioone, et hoida klienti võimalikult kaua. Portaali domineeriv teenus on kasutajatoe teenus: otsing, kategooriad, finantsindeksid, ilmainfo jne. Kui veebisaidid on enamasti staatiliste veebilehtede kogumid, siis portaalid on tarkvaratööriistade ja eelstruktureerimata teabe kogumid, mille need tööriistad konkreetsete kasutajate nõudmisel struktureeritud andmeteks muudavad.

Kolmandaks Otsingumeetod hõlmab Interneti-otsinguserverite kasutamist. Otsinguserverid on spetsiaalsed hostarvutid, mis majutavad Interneti-ressursside andmebaase. Sellise serveri kasutajaliideses on väli kasutajat huvitavat teemat kirjeldavate märksõnade sisestamiseks (vt joonis 2).

Joonis 2. Yandexi otsinguserveri akna vaade

Server tajub neid sõnu teabepäringuna, mille kohaselt otsib ressursse ja esitab kasutajale leitud dokumentide loendi. Ilmselgelt on selle meetodi rakendamisel võimalikud nii 1. tüüpi vead (sihtmärgi puudumine) kui ka 2. tüüpi vead (infomüra). Tuleb mainida, et otsinguservereid on kahte rühma: otsingumootorid ja teemakataloogid. Nende erinevus tuleneb Interneti-ressursside andmebaasi loomise ja hilisema täiendamise meetodist, mida see server teabe otsimiseks kasutab. Seega on otsingumootoritel spetsiaalne programm – otsingurobot. See jälgib pidevalt võrku, kogub veebilehtedelt teavet, indekseerib need ja salvestab nende otsingupildi oma andmebaasi. Ainekataloogides luuakse spetsialistide toimetajate poolt “käsitsi” Interneti-dokumentide andmebaas. Kuna Internetis puudub ühtne haldus, muutuvad selle teabeallikad pidevalt. Sellesse võivad ilmuda uued dokumendid ja olemasolevad dokumendid kaduda. Teabe uuendamise sagedus erinevate saitide dokumentides on erinev: mõne jaoks on see mitu korda tunnis, mõnel kord päevas, päeval, kuus jne. Seetõttu on väga oluline mõista, et teabeotsingusüsteemide kasutamisel Internetist teabe leidmiseks ei teostata otsingut mitte Interneti-dokumentide reaalses ruumis, vaid mõnes mudelis, mille sisu võib tegelikust oluliselt erineda. Interneti-sisu otsingu ajal. Indekseeritud ressursside katvuse põhjal võib otsingumootorid jagada kahte rühma: rahvusvahelised ja venekeelsed. Esimesed indekseerivad järjest kõik Internetis avaldatud dokumendid. Viimased indekseerivad ressursse, mis asuvad vene keele ülekaaluga domeenitsoonides. Kõige populaarsemate süsteemide loend on toodud tabelis. 1.

Tabel 1. Kõige populaarsemad otsingumootorid

Rahvusvaheline vene keelt kõnelev
Google Yandex (44,4% Runetist)
Yahoo! Rambler (10,6% Runetist)
Bing Mail.ru (7,3% Runetist)
MSN Nigma (0,5% Runetist)
AltaVista Gogo.ru (0,3% Runetist)
Küsi Aport (0,2% Runetist)

Märkus: Runet on Interneti venekeelne osa, mis sisaldab nimedega domeene ru ja RF.

Tuleb mainida, et otsinguserveritel on erikategooria – metaotsingumootorid. Nende põhimõtteline erinevus otsingumootoritest ja teemakataloogidest seisneb selles, et neil ei ole oma registriandmebaasi ning seetõttu suunavad nad kasutaja päringu saamisel selle korraga mitmele otsinguserverile (vt joonis 3).

Riis. 3. Metaotsingusüsteemi tööskeem

Võimalus kasutada ühe päringu jaoks samaaegselt mitut otsingumootorit on metaotsingumootorite ilmne eelis. Praegu on laialdast kasutust leidnud süsteem Metabot.ru, mille liides on näidatud joonisel 1. 4. See süsteem võimaldab ressursside otsimiseks kasutada nii rahvusvahelisi kui ka venekeelseid otsinguservereid.

Kolm võimalust Internetist otsimiseks

Internet üldiselt ja eriti World Wide Web pakuvad abonendile juurdepääsu tuhandetele serveritele ja miljonitele veebilehtedele, mis salvestavad kujuteldamatul hulgal teavet. Kuidas mitte eksida selles “infoookeanis”? Selleks peate õppima, kuidas otsida ja leida vajalikku teavet Internetis.

Nagu juba mainitud, on Internetist teabe otsimiseks kolm peamist viisi.

1. Lehe aadressi täpsustamine. See on kiireim otsingumeetod, kuid seda saab kasutada ainult siis, kui on teada dokumendi täpne aadress.

2. Navigeerimine hüperlinkide kaudu. See on kõige vähem mugav meetod, kuna seda saab kasutada dokumentide otsimiseks, mis on ainult praegusele dokumendile lähedased. Kui käesolev dokument on pühendatud näiteks muusikale, siis on selles dokumendis hüperlinke kasutades ebatõenäoline, et pääsete spordile pühendatud saidile.

3. Otsinguserveriga (otsingumootoriga) ühenduse võtmine. Otsinguserverite kasutamine on teabe leidmiseks kõige mugavam viis. Praegu on Interneti venekeelses osas populaarsed järgmised otsinguserverid: Yandex; Rambler.

On ka teisi otsingumootoreid. Näiteks on meiliteenuse mail.ru serveris rakendatud tõhus otsingusüsteem.

Otsi serveritest

Kõige kättesaadavam ja mugavam viis veebist teabe otsimiseks on kasutada otsingumootoreid. Sel juhul saab teavet otsida nii kataloogide kui ka otsitavat tekstidokumenti iseloomustavate märksõnade komplekti kaudu.

Vaatame lähemalt otsinguserverite kasutamist. Otsi server sisaldab suurel hulgal linke väga erinevatele dokumentidele ning kõik need lingid on süstematiseeritud temaatilisteks kataloogideks. Näiteks: sport, kino, autod, mängud, teadus jne. Pealegi installib server need lingid iseseisvalt, automaatselt, vaadates regulaarselt kõiki veebis ilmuvaid veebilehti. Lisaks annavad otsingumootorid kasutajale võimaluse otsida teavet märksõnade abil. Pärast märksõnade sisestamist hakkab otsinguserver nägema dokumente teistes veebiserverites ja kuvama linke nendele dokumentidele, milles määratud sõnad esinevad. Tavaliselt sorteeritakse otsingutulemused kahanevas järjekorras spetsiaalse dokumendi reitingu järgi, mis näitab, kui täielikult antud dokument otsinguterminitele vastab või kui sageli seda veebis küsitakse.

Otsingumootori päringu keel

Teatud reeglite järgi – päringukeelt kasutades – moodustatud märksõnade rühma nimetatakse päringuks otsinguserverile. Erinevate otsinguserverite päringukeeled on väga sarnased. Selle kohta saate lisateavet, kui külastate soovitud otsinguserveri jaotist "Abi". Vaatame päringute moodustamise reegleid, kasutades näitena Yandexi otsingumootorit.

Operaatori süntaks Mida tähendab operaator? Näidistaotlus
tühik või & Loogiline JA (lause sees) Fikseeritud proteesid
&& Loogiline JA (dokumendi sees) Tüübid && (fikseeritud proteesid)
| Loogiline VÕI foto | fotograafia | hetktõmmis | fotograafiline pilt
+ Sõna kohustuslik esinemine leitud dokumendis +olla või +mitte olla
() Sõnade rühmitamine (tehnoloogia | tootmine) (juust | kodujuust)
~ Kahendoperaator AND NOT (lause sees) pangad ~ seadus
~~ või _ Binaarne JA MITTE operaator (dokumendi sees) Pariisi giid ~~ (agentuur | ekskursioon)
/(n m) Kaugus sõnades (miinus (-) – tagasi, pluss (+) – edasi) tarnijad /2 kohvimuusika /(-2 4) haridus vabad kohad ~ /+1 õpilast
« « Otsige fraasi “Fikseeritud proteesid” Samaväärne: Fikseeritud /+1 proteesidega
&&/(n m) Kaugus lausetes (miinus (-) – tagasi, pluss (+) – edasi) meditsiin && /1 proteesimine

Üldine informatsioon.

Praegu ühendab Internet sadu miljoneid servereid, mis majutavad miljardeid erinevaid saite ja üksikuid faile, mis sisaldavad erinevat tüüpi teavet. See on hiiglaslik teabehoidla. Internetist teabe otsimiseks on erinevaid meetodeid.

Otsige teadaoleva aadressi järgi. Vajalikud aadressid võetakse kataloogidest. Teades aadressi, sisestage see lihtsalt brauseri aadressiribale.

www.gov.ru - Venemaa valitsusasutuste server.

Aadressi koostamine kasutaja poolt. Teades Interneti-aadresside moodustamise süsteemi, saate veebisaite otsides luua aadresse.

Märksõnale (ettevõtte, ettevõtte, organisatsiooni nimi või lihtne ingliskeelne nimisõna) tuleb lisada temaatiline või geograafiline domeen ning ühendada oma intuitsioon.

Kaubanduslike veebilehtede aadressid:

www.cnn.com (CNN World News),

www.sony.com (SONY ettevõte),

www.mtv.com (MTV muusikauudised).

Haridusasutuste aadressid:

www.ntu.edu (USA riiklik ülikool).

Piirkondlikud serveri aadressid:

www.poland.net (Poola),

www.israil.net (Iisrael).

Interneti otsingumootorid

Internetist teabe otsimiseks on välja töötatud spetsiaalsed teabeotsingusüsteemid. Otsingumootoritel on tavaline aadress ja need kuvatakse veebilehena, mis sisaldab spetsiaalseid tööriistu otsingute korraldamiseks (otsingring, teemakataloog, lingid). Otsingumootorile helistamiseks sisestage lihtsalt selle aadress brauseri aadressiribale.

Vastavalt teabe organiseerimise meetodile jagunevad teabeotsingusüsteemid kahte tüüpi: klassifikaator (rubrikaatorid) ja sõnastik.

Kategooriad (klassifikaatorid) on otsingumootorid, mis kasutavad teabe hierarhilist (puu)korraldust. Teabe otsimisel vaatab kasutaja läbi temaatilised pealkirjad, kitsendades järk-järgult otsinguvälja (näiteks kui on vaja leida sõna tähendus, tuleb esmalt leida klassifikaatorist sõnastik ja seejärel leida soovitud sõna see).

Sõnaraamatute otsingusüsteemid on võimsad automaatsed tarkvara- ja riistvarasüsteemid. Nende abiga vaadatakse (skaneeritakse) teavet Internetis. Andmed selle või selle teabe asukoha kohta sisestatakse spetsiaalsetesse indeksikataloogidesse. Vastuseks päringule tehakse otsing päringustringi järgi. Selle tulemusena pakutakse kasutajale neid aadresse (URL-e), kust otsitav sõna või sõnarühm skaneerimise ajal leiti. Valides mis tahes pakutud lingi aadressi, saate minna leitud dokumendi juurde. Enamik kaasaegseid otsingumootoreid on segatud.

Kõige kuulsamad ja populaarsemad otsingumootorid:

www.aport.ru www.yahoo.com www.rambler.ru www.yandex.ru www.altavista.com www.google.com

On süsteeme, mis on spetsialiseerunud teaberessursside otsimisele erinevates valdkondades.

Inimeste otsimine Internetist:

www.whowhere.ru www. bigfoot.com

Otsige uudistegruppe (Usenet):

www.dejanews.com

Teema otsingumootorid:

Otsi tarkvara:

Otsige failiarhiividest:

http://ftpseach. city.ru, http://ftpsearch. licos.com

Kataloogid (temaatilised linkide kogud koos märkustega):

http://www.atrus.ru

Sageli saab tõhusa teabe otsimiseks kasutada piirkondlikke katalooge - spetsiaalseid servereid, mis sisaldavad andmeid linna või piirkonna ettevõtete või veebiressursside kohta. Näiteks Peterburi jaoks asub selline kataloog aadressil http://www.spb.ru.

IPS-i loendi leiate veebisaidilt www.monk. newmail.ru

Otsingumootorite ja kataloogide üksikasjalikum loend on esitatud tabelis. 3.2.

Taotluste täitmise reeglid

Iga otsingumootori spikker sisaldab teavet otsimise ja päringustringi koostamise kohta. Allpool on teave tüüpilise "keskmise" päringukeele kohta.

Lihtne taotlus.

Sisestage üks sõna, mis määratleb otsinguteema. Näiteks otsingumootoris Rambler.ru piisab, kui sisestada: automatiseerimine.

Leitakse dokumendid, mis sisaldavad päringus märgitud sõnu. Tunnustatakse kõiki venekeelsete sõnade vorme, reeglina eiratakse suurtähti.

Võite kasutada päringus märki "*" või "?". Märk "?" märksõnas asendatakse üks märk, mille asemel võib asendada suvalise tähe, ja märk “*” on märgijada.

Näiteks päring automaatne* võimaldab leida dokumente, mis sisaldavad sõnu automaatne, automatiseerimine jne.

Keeruline taotlus.

Täpsema teabe saamiseks on sageli vaja märksõnu kombineerida. Sel juhul kasutatakse sulgudega eraldatud täiendavaid linkimissõnu, funktsioone, operaatoreid, sümboleid, operaatorite kombinatsioone.

Näiteks päring muusika & (biitlid | biitlid) tähendab, et kasutaja otsib dokumente, mis sisaldavad sõnu muusika ja biitlid või muusika ja biitlid.

Tabelis 3.1 on näidatud Aporti süsteemis (http://www.aport.ru) vastu võetud päringute genereerimise reeglid.

Tabel 3.1

Operaatorid päringute moodustamiseks

Operaator Sünonüümid Kommentaar
JA JA& Päring leiab mõlemat märksõna sisaldavad dokumendid. Sa ei pea seda kirjutama. Näiteks päring: informaatika ja õpik on samaväärne arvutiteaduse õpikuga
VÕI VÕI | Otsitakse dokumente, mis kasutavad üht või mõlemat sõna korraga.
MITTE EI - ~ Otsing piirdub dokumentidega, mis ei sisalda operaatori järel määratud sõna
" " " " Topelt- või üksikjutumärgid võimaldavad teil fraasi leida
Kuupäev= kuupäev:kuupäev= Otsing piirdub dokumentidega, mis jäävad määratud kuupäevavahemikku Näide 1. valuuta kuupäev=01/02/2002-01/03/2002. See taotlus esitab dokumendid, mis sisaldavad sõna "valuuta" ja mille kuupäev on 1. veebruar 2002 kuni 1. märts 2002. Näide 2. kuupäev = 01/03/2002 valuuta Näide 3. kuupäev:<02/03/2002 валюта

Tabel 3.2

Otsingumootorite ja kataloogide loend

Aadress Kirjeldus
www.excite.com Otsingumootor saidiülevaadete ja juhenditega
www.alta-vista.com Otsinguserver, saadaval on täpsemad otsinguvõimalused
www.hotbot.com Otsi server
www.poland.net www.israil.net Poola, Iisraeli piirkondlikud otsinguserverid
www.ifoseek.com Otsinguserver (lihtne kasutada)
www.ipl.org Maailmaküla projekti raames tegutsev rahvaraamatukogu Internet Publik raamatukogu
www.wisewire.com WiseWire – tehisintellekti kasutav otsinguorganisatsioon
www.webcrawler.com WebCrawler – otsinguserver, lihtne kasutada
www.yahoo.com CatalogWeb ja liides täistekstiotsingule juurdepääsuks AltaVista serveris
www.aport.ru Aport – venekeelne otsinguserver
www.yandex.ru Yandex - venekeelne otsinguserver
www.rambler.ru Rambler – venekeelne otsinguserver
Interneti-abi ressursid
www.yellow.com Kollaste lehtede Internet
munk newmail.ru Erineva profiiliga otsingumootorid
www.top200.ru 200 parimat veebisaiti
www.allru.net
www.ru Venemaa Interneti-ressursside kataloog
www.allru.net/z09. htm Õppematerjalid
www.students.ru Vene üliõpilaste server
www.cdo.ru/index_new. asp Kaugõppekeskus
www.avatud. ac. uk Ühendkuningriigi avatud ülikool
www.ntu.edu USA rahvusülikool
www.translate.ru Elektrooniline tekstitõlkija
www.pomorsu.ru/guide. raamatukogu.html Võrguraamatukogude linkide loend
www.elibrary.ru Teaduslik elektrooniline raamatukogu
www.citforum.ru Digitaalne raamatukogu
www.infamed.com/psy Psühholoogilised testid
www.pokoleniye.ru Internetihariduse föderatsiooni veebisait
www.meetod. narod.ru Õppematerjalid
www.spb. osi.ru/ic/distant Kaugõpe Internetis
www.examen.ru Eksamid ja testid
www.kbsu.ru/~book/ Arvutiteaduse õpik
Mega. km.ru Entsüklopeediad ja sõnaraamatud

Internetist teabe otsimine: lõksud

Probleemid, mis ei ole pinnal, annavad end sageli tunda alles “tagantjärele”, pärast seda, kui teatud otsingutöö etapp on lõppenud ja võimalik, et selle tulemuste põhjal on otsus juba tehtud. Mis takistab teil olukorda läbipaistvaks muutmast selle või teise infootsingusüsteemi (IRS) töö algusest peale? Vastus on üsna lihtne: arendaja poolne sellise põhjaliku teabe puudumine. Selle otsene tagajärg on vastuvõetud andmete ebausaldusväärsus ja nende kontrollimatu kadu. Harva leiab Internetist otsingumootorit, millel poleks mõnda “dokumenteerimata” funktsiooni. Näib, et kasutaja ei vaja palju teavet, nimelt:

kuidas täidetakse IPS andmebaasi ja milline on selle maht;

täielik valik süsteemiotsingu keelevõimalusi;

Otsingutulemuste esitamise põhijooned, eelkõige algoritm kirjete järjestamiseks otsingupäringu vastuste loendist.

Paraku pole sellise teabe allikaks tavaliselt mitte otsinguserveri avalehelt ligipääsetav dokument, vaid üksikute autorite väljaanded, mis on laiali Internetis, raamatud ja arvutiajakirjad. Sellise olukorra põhjused ei hõlma ilmselt mitte ainult arendaja hooletust, vaid ka tegurit, mida nimetatakse turunduspoliitikaks. Lihtsamalt öeldes ei avalda otsingumootorile enda kohta kõige täielikuma teabe pakkumine alati selle paremusjärjestust positiivselt. Kuid mõnel juhul on kasutaja üsna võimeline olukorra üle kontrolli haarama. Tihti on testimise teel võimalik välja selgitada valitud otsinguteenuse tööomadused. Spetsiaalsete testpäringute koostamine, mis selgitavad kiiresti täpselt selle süsteemi töö aspekti, mis on praeguse ülesande jaoks kõige olulisem, osutub paljudel juhtudel mittetriviaalseks. Pühendame oma arutelu sellele, kuidas IPS-iga töötamisel probleeme vältida. Näidetena esitluse illustreerimiseks käsitletakse tuntud Interneti otsingumootoreid.

Tõhus teabeotsing arvuti abil on pakiline ülesanne, mis tekib mitte ainult algajatele, vaid ka kogenud Interneti-kasutajatele, sest see, kelle käes on andmed, omab maailma, nagu öeldakse. Täna vaatame viise, kuidas kiiresti leida vajalikku ja olulist teavet venekeelsest Internetist. Praegu on neid ainult kolme tüüpi:

  1. märkides selle saidi otsese aadressi, kus asuvad vajalikud andmed ja teave;
  2. Internetis personaalarvuti abil linkide surfamine;
  3. otsingumootorite (masinate) kasutamine Internetis.

Vaatame üksikasjalikumalt kõiki viise, kuidas arvuti abil Internetist värsket teavet otsida.

Teabe otsimine otselingi abil Internetis

Kui teate juba, kus Internetis vajalik teave asub, muutub arvuti abil otsimine palju lihtsamaks: peate lihtsalt brauseri ribale sisestama saidi aadressi ja tutvuma esitatud andmetega. Kui näete Internetis veebisaidi lehel mahukat teksti ja olete huvitatud sõna otseses mõttes mõnest reast, mis on peidetud "tonni" trükitud märkide sisse, saate kasutada lehesisest otsingut. Selleks vajutage klahvikombinatsiooni Ctrl ja F (mis tahes arvuti klaviatuuripaigutus) ja sisestage pakutud veergu "Otsi" fraas või sõna, mis sisaldub täpselt otsitava teabe lõigus, seejärel vajutage " Sisenema".

Brauser tõstab erineva värviga esile kõik lehel mainitud sõnad, mis on sarnased teie otsitava sõnaga. Küll aga juhtub üsna sageli, et me ei mäleta või isegi ei tea linke info asukohale internetis. Sel juhul on kõige mugavam kasutada kahte teist tüüpi andmeotsingut arvuti abil.

Otsige Internetis surfamise abil

Internetis surfamine on otsing, mis hõlmab linkide järjestikust jälgimist ühelt temaatiliselt saidilt teisele, kuni vajalike andmete allikas leitakse. Selle Interneti-andmete otsimise meetodi eeliseks on selle võlu ja võimalus hallata järjepidevalt ja põhjalikult suurt hulka teavet erinevatelt saitidelt. Seda tüüpi otsingu puuduste hulgas on selle kestus, aga ka asjaolu, et peate kuidagi jõudma algsele saidile, kust teie surfamine algab. Ja kui teil pole selle saidi aadressi, kust surfama hakkate, peate siin kasutama sellist otsingumeetodit nagu otsingumootorid.

Internetist teabe otsimise viisid otsingumootorite abil

Tänapäeval on Runeti avalikkusele laialt tuntud sellised otsingumootorid nagu Yandex.ru, Rambler.ru, Google.ru. Need saidid võimaldavad teil otsida andmeid, sisestades päringu kõigil Interneti-saitidel. Vastavalt tööpõhimõttele on otsingumootoreid kahte tüüpi: otsinguindeksid ja otsingukataloogid:

  • Otsi kataloogidest. Need saidid pakuvad abi Internetist konkreetse teema kohta andmete otsimisel: sellistes kataloogides olev teave on selgelt struktureeritud rühmadesse ja teemadesse, mis aitab kiiresti tulemusi leida. Iga teema puhul pakutakse kasutajale mitmeid linke saitidele, kust ta leiab huvipakkuvaid teadmisi.
  • Otsi indekseid. Need on registrisaidid, kus kasutaja saab märksõna otsinguribale sisestades rea linke Interneti-lehtedele, mis sisaldavad soovitud sõna või fraasi. Otsinguindeksid teostavad otsinguid spetsiaalsete programmide abil, mida nimetatakse "ämblikeks", mis skannivad Interneti veebisaitide lehtedel nende teemat. Pärast sellist skannimist sisestab otsingumootor need oma andmebaasi, kust kasutaja poolt otsingusõnasse päringu sisestamisel hiljem info “otsitakse”.

Internetist teabe otsimise reeglid

Vaatame nüüd põhilisi, kuid olulisi reegleid venekeelsest Internetist ajakohase teabe tõhusaks otsimiseks arvuti abil.

  1. Otsingumootorile juurdepääsuks moodustage õige võtmefraas. Kui soovite saada tõeliselt kasulikku tulemust, ei saa kasutada ainult ühte otsingusõna ja ärge sisestage liiga pikki fraase. Otsingupäringu optimaalne suurus on 2 kuni 4 sõna. Kui otsingumootor leiab otsingutulemustest liiga vähe tulemusi, siis tuleks proovida sisestatud fraasi ümber sõnastada, asendades mõned sõnad sünonüümidega ning kontrollida ka sõnades kirjavigu. Pidage meeles: pole teavet, mida Internetis poleks. Valige lihtsalt õiged sõnad, järgige reegleid ja te leiate, mida otsite.
  2. Kasutage spetsiaalseid operaatoreid. Kaasaegne tõhus ja kiire igasuguse vajaliku teabe otsimine otsingumootori ja personaalarvuti abil eeldab mõningate nippide tundmist ja rakendamist, milleks on lühendid ja operaatori erimärgid. Operaatorid on ikoonid, mida kasutatakse otsingumootoris päringu moodustamisel ja vajalike andmete leidmise hõlbustamiseks. Vaatame levinumaid operaatoreid ja nende tähendusi, millest võib praktikas kasu olla.
  3. Tühik või &-märk tähendab, et peate otsima dokumente, millel on samas lauses nõutav fraas. Näide otsinguribale sisestamisest: maitsev retsept või maitsev ja retsept.
  4. && - tähendab vajadust otsida lehekülge, kus fraasi üksikuid sõnu mainitakse kogu teksti ulatuses, mitte ainult ühes lauses. Näide: maitsev && retsept.
  5. | - teile pakutakse artikleid, milles kasutatakse ainult ühte sisestatud sõnadest. Näide: abielu | puuduseks | defekt.
  6. + - tähendab teksti otsimist kohustusliku sõnakombinatsiooniga, mis on sisestatud märgi “+” vahele. Näide: maitsev + retsept.
  7. “ ” – otsige sõnade ahelat ilma seda üksikuteks sõnadeks jagamata. Näide: "Krasnaja Poljana kommid".

Järgides neid lihtsaid reegleid arvuti ja Interneti abil andmete otsimisel, muudate oma ülesande lihtsamaks ja leiate alati kiiresti vajaliku teabe igal ajal.

Viimased saidi materjalid