Tre hovedmåter for å søke etter informasjon på Internett. Søke etter informasjon på Internett 3 måter å søke etter informasjon på Internett

28.03.2023
Sjeldne svigerdøtre kan skryte av at de har et jevnt og vennlig forhold til svigermor. Vanligvis skjer det stikk motsatte

Problemet med søk og midler til organisasjonen

Store og stadig økende mengder informasjon tilgjengelig på Internett, inkl. operativt, gjør problemet med å finne nødvendig informasjon svært relevant og komplekst. Hastigheten til å søke etter nødvendig informasjon bestemmer i stor grad profesjonaliteten til Internett-brukeren. Det er verdt å si at for å automatisere denne oppgaven er det utviklet forskjellige søkesystemer, både utenlandske og innenlandske, som er nettsider av en spesiell type. Samtidig, til tross for tilgjengeligheten av mange søkeautomatiseringsverktøy, forblir denne oppgaven ganske arbeidskrevende, og krever at brukeren har viss erfaring, intuisjon og kunnskap om terminologien som brukes i sitt fagområde.

Et estimat publisert i Nature 8. juli 1999, anslår antallet offentlig indekserte nettsider til 800 millioner Et år senere mente studiens forfatter (Steve Lawrence fra NEC Research Institute) at antallet var nesten doblet til 1,5 milliarder. de beste søkemotorene indekserer ikke mer enn én side av seks. Det er verdt å si at for å trekke ut nyttig informasjon fra Internett, må du vite hvor og hvordan du skal søke.

Internet Explorers søkeverktøy gjør det enklere å få tilgang til søkeverktøy uten å måtte vite søkemotoradresser. I dette tilfellet er det bedre å kontakte søkemotorer direkte ved å laste inn den aktuelle siden.

Basert på metoden for å organisere søket og mulighetene som tilbys, kan alle søkeverktøy deles inn i følgende grupper:

kataloger og spesialiserte databaser;

søkemotorer;

metasøkemotorer.

Kataloger og databaser

Kataloger på WWW ligner på systematiske bibliotekskataloger. Katalogsøk består av sekvensiell bevegelse gjennom en hierarkisk liste over lenker kalt overskrifter eller kategorier. Den første siden av katalogen inneholder lenker til viktige emner, som kultur og kunst; Medisin og helse; Samfunn og politikk; Næringsliv og økonomi; Underholdning osv. Ved å klikke med musen på en gitt lenke (kategori) åpnes en side som inneholder lenker som beskriver det valgte emnet (kategorien) Når du beveger deg ned gjennom detaljkategoriene, kan du finne en side med nødvendig informasjon. På hver side som åpnes når du beveger deg gjennom katalogen på en eller annen måte, er sekvensen av viste underkategorier angitt, for eksempel Business World: Finance: Analytics, etc.

Alle kataloger opprettes og holdes oppdatert manuelt av spesialister, på samme måte som bibliografer kompilerer og vedlikeholder bibliotekskataloger. Det er relevant å merke seg at beskrivelsen av dokumentet gjøres enten av kompilatorene av katalogen eller av forfatteren. Takket være dette er innholdet på sidene som er inkludert i katalogen mest passende for kategorien de er klassifisert til. Men gitt hastigheten på etterfylling og endring av informasjon på Internett, lar den "manuelle" metoden for å vedlikeholde kataloger oss ikke tilstrekkelig reflektere den virkelige tilstanden til Internett-ressurser om dette emnet.

Søkemotorer

(søkemotorer, søkeservere, søkeroboter)

Det er dusinvis av store og tusenvis av små og spesialiserte nettsteder designet for Internett-søk. Søkeverktøy for ϶ᴛᴏth-gruppen vil tillate brukeren, i henhold til visse regler, å formulere kravene til informasjonen han trenger (ved å bruke et spørringsspråk for å lage en spørring). Etter dette ser søkemotoren automatisk gjennom dokumenter på nettstedene den kontrollerer (indeksert) og velger de av dem som "etter den oppfatning » søkeserver, ϲᴏᴏᴛʙᴇᴛϲᴛʙkrav formulert av brukeren (relevant for forespørselen) Søkenoder kan bruke sine egne Internett-indekser, konstant oppdatert av spesielle programmer kalt edderkopper. Edderkoppprogrammet undersøker nettet, sjekker hver lenke på en gitt side, deretter på sidene adresserte lenker osv., og informerer eieren om informasjon om alle sidene for senere indeksering.

Som et resultat av søket opprettes en eller flere sider som inneholder lenker til dokumenter som er relevante for forespørselen (websider). Det er verdt å si at for hver lenke, datoen for opprettelse av dokumentet, dets volum, graden av relevans til forespørselen, og fragmenter av tekst som karakteriserer innholdet i dokumentet er vanligvis også angitt. Ved å klikke på en slik lenke kan du laste inn siden du er interessert i. Ved et veldig stort antall funnet dokumenter kan du avklare forespørselen og gjenta søket med den, men bare blant utvalgte sider (et slikt søk kalles forskjellig i forskjellige maskiner, men vanligvis ϶ᴛᴏ - søk i funnet) I en rekke søkemotorer kan du bruke en bestemt metode endre lenken til siden hvis innhold passer best for dine behov, og gjenta søket og be om å søke etter lignende.

Fordelen med automatisert søk er i hovedsak at det gir visning av svært store mengder informasjon som er tilgjengelig på Internett for øyeblikket. Samtidig fører kompleksiteten til en nøyaktig beskrivelse av forespørselen som tilstrekkelig gjenspeiler informasjonsbehovene dine, samt den enda større kompleksiteten i oppgaven med å automatisk bestemme graden av sidene som vises for forespørselen din, til at antallet av sidene som er valgt "ved første besøk" er tradisjonelt enten veldig små eller for store . Generelt er et søk ved hjelp av en søkemotor en iterativ (multi-pass) prosess, som et resultat av at formen for forespørselen gradvis foredles.

Metasøkemotorer

Som nevnt ovenfor, skanner enhver søkemotor et bestemt sett med servere og velger dokumenter i henhold til sine egne kriterier. Som et resultat gir søk med forskjellige systemer med de samme søkeordene forskjellige resultater. Dette førte til ideen om å lage såkalte metasearch (eller multisearch) systemer, som ikke søker etter noe selv, men henvender seg til flere søkemotorer for å få hjelp samtidig. Merk at hver av metasøkemotorene har sitt eget spørrespråk. Systemet oversetter en spørring formulert på sitt språk til søkespråkene som brukes av hver søkemotor. Deretter kombineres søkeresultatene fra alle systemene og presenteres i en oversiktlig form. Naturligvis tar søk med metasøkemotorer lengre tid sammenlignet med konvensjonelle søkemotorer.

Gjennomgang av de mest populære søkemotorene

Det finnes et stort antall søkemotorer på Internett, og hver bruker fokuserer på den han er vant til eller som kollegene rådet ham til å bruke. La oss bruke en kort beskrivelse av de mest populære søkemotorene, som er gitt på et av nettstedene.

1. Google (www.google.com) Den raskeste og største søkemotoren. Mer enn 1,3 milliarder sider er indeksert (hvorav litt mer enn 700 millioner er fullstendig indeksert, bare adressen og lenketeksten er kjent om resten). Den søker normalt med russiskspråklige ressurser (selvfølgelig uten ordformer) , er det mulig å velge grensesnittspråk. Du kan inkludere/ekskludere resultater fra bestemte nettsteder og/eller domener. I motsetning til de fleste søkemotorer, evaluerer Google populariteten til en ressurs etter antall lenker som fører til den fra andre sider. Det er et emneorientert søk - Apple Macintosh, BSD UNIX, Linux, amerikanske myndigheter og universitetssøk - søk i ressursene til ledende vitenskapelige og utdanningsinstitusjoner.

2. Yandex (www.yandex.ru) Det beste av innenlandske søkemotorer. Indekserer hovedsakelig russiskspråklige ressurser, mens dens evner ikke er dårligere enn utenlandske systemer. Søket kan utføres nøyaktig eller i alle ordformer, med en datobegrensning, som indikerer nettstedet eller dets underkatalog. Du kan søke basert på den såkalte sitasjonsindeksen, søke etter bilder, skript, applets; angi dokumentspråket. De nødvendige koblingene finnes tradisjonelt i de ti første resultatene. Den har en "lett" versjon (med et minimum av designelementer) på http://www.ya.ru.

3. AltaVista (www.altavista.com) Gir en stor utvidelse av søkekriterier: i avansert søk er det et valg av tidsperiode, som inkluderer datoen for opprettelse eller endring av ressursen, støtte for 25 språk; det er muligheten til å returnere ett resultat per nettsted (begrenser søket uten å ofre kvaliteten) Power-søk har et standardsett med funksjoner. Inntil nylig var AV en stor portal, men av økonomiske (og andre) årsaker reduserte den antallet tjenester betydelig.

4. Yahoo! (www.yahoo.com) Det er viktig å merke seg at en av de første søkemotorene på Internett. I tillegg til standardsettet med funksjoner, lar den deg velge ressurser etter dato (4 år, 1, 3, 6 måneder, uke, 1, 3 dager) Støtter muligheten til å spesifisere "*"-tegnet i stedet for en hvilken som helst sekvens av tegn i nøkkelord. På Yahoo! Det er satt sammen en stor strukturert katalog med kategorier, først søkes i dem, deretter i vårt eget arkiv, deretter ved hjelp av Google-systemet. Å søke i kategorier gir gode resultater – det er ikke mange av dem og de er veldig gode.

5. Lycos (www.lycos.com) Nylig - et av de mest populære systemene. Samtidig gir det ingen spesielle muligheter - "OG" "ELLER", søk etter fraser, obligatorisk tilstedeværelse/fravær av et ord; i avanserte funksjoner - søk i tittel, URL, vertsnavn og/eller domenenavn; 25 språk, inkludert russisk - i et ord, hele det "generelt aksepterte" settet. Du kan spesifisere type ressursinnhold - auto, bøker, ftp, nedlasting, nyheter, etc. Åpenbart er populariteten til Lycos en konsekvens av omfanget av dette store prosjektet.

6. Rambler (www.rambler.ru) Inntil nylig, den mest kjente russiske søkemotoren. Det avanserte søket lar deg ikke søke etter fraser, og det vanlige søket frem til februar 2010 ga sjelden akseptable resultater. Siden februar har systemet brukt en forbedret søkemekanisme, designet har endret seg, men kvalitetsmessig er Rambler fortsatt ikke lik Yandex og Aport (ifølge forfatteren som analyserer søkemotorer). Nettstedet inneholder en vurderingskatalog med ressurser Rambler Top 100, en av de anerkjente kildene til statistisk informasjon om Internett-prosjekter.

7. Aport (www.aport.ru) Nok en god russisk søkeserver. Søket utføres med tekst (bare i alle ordformer) og URL, ved bruk av logiske operatorer og "..."-operatoren (stoppord i frasen ignoreres imidlertid fortsatt), etter dato og i individuelle felt (tittel , beskrivelse osv. ), metategn * og! støttes. Presentasjonen av søkeresultater er best utformet sammenlignet med andre russiske søkemotorer. Utformingen av hovedsiden, som tydeligvis er overbelastet med informasjon, reiser noen tvil. Det er en litt "enklere" versjon på http://aport.ru.

Hvordan velge en søkemotor

Når du søker på Internett, er to komponenter viktige - fullstendighet (ingenting gikk tapt) og nøyaktighet (ingenting overflødig ble funnet). Vanligvis kalles alt i ett ord - relevans, det vil si svaret på spørsmålet.

1. Dekning og dybde

Med dekning mener vi volumet av søkemotordatabasen, som måles med tre indikatorer – det totale volumet av indeksert informasjon, antall unike servere og antall unike dokumenter. Med dybde mener vi om det er en begrensning på antall sider eller dybden på nesting av kataloger på én server.

Slik sjekker du: Noen maskiner skriver robotstatistikk på en nettside. Men du kan sjekke det selv - du må angi flere søk som består av ett ord (for å utelukke innflytelsen fra søkespråket, inkludert forskjellige tolkninger av rommet), og samtidig se på statistikken over resultatene produsert av maskinen - vanligvis i begynnelsen av listen angir hvor mange dokumenter som ble funnet. I tillegg til at ordene skal være fra forskjellige områder, er det også greit å ta ord med forskjellig vekt - sjeldne, "middels" og "tung" (frekvens), og sammenligne mengden som er funnet. Spesielt tunge ord tester fullteksten (indeksering av alle ord i et dokument) til en søkemotor.

Det er vanskeligere å sjekke dybden av robotens gjennomgang - for dette må du ta noen nettsteder, for eksempel med en forgrenet arkivstruktur, og sjekke om dokumenter er indeksert, som bare kan nås, for eksempel med 6 klikk på lenkene.

2. Gjennomgangshastighet og relevans av lenker

Hastigheten til å gjennomgå nettet viser hvor raskt en nylig lagt til ressurs indekseres og hvor raskt informasjonen i databasen oppdateres. Ikke glem at en viktig indikator på kvaliteten til en søkemotor (roboten dens) ikke bare vil være å fange nye territorier, men også overvåke statusen til de som allerede er dekket. Serverne forsvinner og forblir, sidene på dem oppdateres. Lenkene som en søkemotor produserer i listen over det den fant, må for det første eksistere, og for det andre må innholdet deres samsvare med forespørselen.

Slik sjekker du: Objektiv informasjon kan fås ved å analysere serverlogger - en søkemotorrobot introduseres vanligvis med navnet på maskinen sin (eller lignende), slik at du kan se hvor ofte den besøker serveren, hvor mange sider den ser på osv. . Dessverre er vanligvis bare loggen til nettstedet tilgjengelig for studier, så den eksperimentelle metoden gjenstår.

For å bestemme gjennomgangshastigheten, må du lage en side med tekst et sted, legge den til i søkemotorer og se hvor raskt den begynner å vises. Eller endre en eksisterende side. Det er verdt å si at for å bestemme relevansen til lenker, sjekk dokumentene i det minste på den første siden av listen for flere spørsmål. Ikke funnet-meldingen indikerer at dokumentet ikke lenger eksisterer.

3. Søkekvalitet (subjektiv indikator)

Det er verdt å si at hver søkemotor har en algoritme for sortering av søkeresultater. Jo nærmere toppen av listen dokumentet du trenger er, desto bedre fungerer relevansen.

Slik sjekker du: Kun gjennom eksperiment. Det anbefales å gjøre spørringer av forskjellig lengde for sammenligning. Du kan også bruke spørringsspråket, mens de som er motvillige til å lese beskrivelsen kan bruke den utvidede spørringssiden ("avansert søk" i Aport og Yandex, "detaljert søk" i Rambler - oversettelsesalternativer til russisk "avansert søk")

Foruten relevans er det viktige brukeregenskaper.

4. Søkehastighet

Hvis en søkemotor reagerer sakte, er det ineffektivt å jobbe med den. Det er verdt å legge til at hastigheten som er synlig for brukeren, ikke bare avhenger av selve søkemotoren, men også av Internett-kanaler.

Slik sjekker du: Ved å eksperimentere - du må se etter søk med forskjellig lengde, forskjellig<тяжести>ord og til forskjellige tider på dagen (serverbelastningen er betydelig ujevn gjennom dagen, toppen er rundt klokken tre til fire på ettermiddagen)

5. Søkefunksjoner (arbeide med dokumentspråk, spørringsspråk)

Et annet sammenligningspunkt er nøyaktig hva og hvordan søkemotoren kommer inn i indeksen. Det er verdt å si at en fulltekstsøkemotor indekserer alle ordene i teksten som er synlig for brukeren. Tilstedeværelsen av morfologi gjør det mulig å finne de søkte ordene i alle deklinasjoner eller konjugasjoner. I tillegg til dette er det i HTML-språket koder som også kan behandles av en søkemotor (overskrifter, lenker, bildetekster, etc.)

Nesten alle maskiner har et spørringsspråk i form av standard logiske operatorer (AND, OR, NOT). Noen vet hvordan man søker etter fraser eller ord på en gitt avstand – dette er ofte viktig for å få et fornuftig resultat. Et ekstra alternativ vil være å søke i dokumentområder - overskrifter, lenker, nøkkelord (META KEYWORDS), etc. En tilleggsfunksjon ved spørringsspråket er en naturlig språkspørring, som ikke krever kunnskap om operatører.

Slik sjekker du: Vanligvis publiseres denne informasjonen på søkemotorserveren (i Hjelp) Merk at det likevel anbefales å sjekke reelle forespørsler, siden noen ganger det som ønskes presenteres som virkelighet.

6. Ytterligere fasiliteter

Dette er tilleggsfunksjoner som søkemotoren gir brukerne. Dette inkluderer alle slags søkealternativer (spesialiserte sider, søk etter lignende dokumenter, begrenser søkeområdet), og en liste over funne servere, og søk etter dato og server, og et praktisk søkemotorgrensesnitt, og muligheten til å tilpasse det.

Slik sjekker du: Informasjon kan bli delvis publisert på søkemotorserveren, men det er best å prøve å jobbe med disse funksjonene selv.

Det er klart at denne analysen vil ta litt tid. I tillegg står ikke søkemotorer, som hele Internett, stille. Samtidig, gitt at informasjonssøk er en av de viktige komponentene i datateknologi, bør det gis tilstrekkelig oppmerksomhet - i hvert fall ikke mindre enn evnen til å jobbe på et lokalt nettverk.

En undersøkelse ble utført på Yandex.ru: hvorfor Internett er nødvendig og hva som mangler i det (http://www.yandex.ru/polling/9.html) I synkende rekkefølge ble undersøkelsesdataene fordelt som følger: Internett brukes som oppslagsverk (23, 76 %), forskningsverktøy (15,45 %), underholdning (14,15 %), og bare på fjerde plass er en nyhetskilde (12,32 %) Det hørtes optimistisk ut at 10 % av brukerne alltid lykkes, og 73 % lykkes ofte med å finne informasjonen du trenger. Og Internett mangler: informasjon, godt søk og orden (inkludert: orden, struktur, struktur, struktur, struktur, samt system, systematisering, systematisering, systematisering og systematisering)

SVAR PÅ SPØRSMÅLENE:

Nevn hvilke metoder for organisering av søk som finnes på Internett?

Hvordan søkes informasjon i kataloger og databaser?

Hvordan legges informasjon inn i kataloger og databaser?

Hva er søkemotorer på Internett?

Hvordan dannes en informasjonsdatabase i søkemotorer?

Hvor begynner søket etter informasjon i søkemotorer?

Hva er en forespørsel?

Hvordan søkes informasjon i søkemotorer?

Hva mener du med relevans for en spørring?

Hva kan gjøres i tilfelle et svært stort antall dokumenter blir funnet under videre søk?

Hva er metasøkemotorer?

Hva er den grunnleggende forskjellen mellom metasøkemotorer og vanlige søkemotorer?

Hvilket av følgende systemer vil være metasøkemotorer:

Hva er de mest populære innenlandske søkemotorene?

Hva er de mest populære utenlandske søkemotorene?

Hvilke to komponenter er viktige når du søker etter informasjon på Internett?

Hvilke egenskaper bestemmer effektiviteten til søkemotorer når de søker etter informasjon på Internett?

Vilkår for bruk:
Intellektuelle rettigheter til materialet - Informasjonsdatanettverk - Borisov N.A., Lukin A.A. tilhører dens forfatter. Denne håndboken/boken er publisert kun for informasjonsformål uten involvering i kommersiell sirkulasjon. All informasjon (inkludert "Tema 3. Søke etter informasjon på INTERNETT") er samlet inn fra åpne kilder eller lagt til av brukere gratis.
For full bruk av den publiserte informasjonen, anbefaler prosjektadministrasjonen av nettstedet på det sterkeste å kjøpe boken / manualen Information Computer Networks - Borisov N.A., Lukin A.A. i hvilken som helst nettbutikk.

Merkeblokk: Informasjonsdatanettverk - Borisov N.A., Lukin A.A., 2015. Emne 3. Søke etter informasjon på INTERNETT.

(C) Nettsted for juridisk arkiv 2011-2016

Søker etter informasjon på Internett

Søker etter informasjon på Internett

For å søke etter informasjon er ofte brukt tre måter(Se fig.1). Først hvorav - søk på adresse. Den brukes når brukeren kjenner adressen til en informasjonsressurs som inneholder informasjonen han trenger. Når du organiserer et søk etter informasjon etter adresse (adresseformen - IP, domene eller URL - spiller ingen rolle i dette tilfellet), trenger brukeren bare å skrive inn ressursadressen i det aktuelle feltet i nettleseren - et program designet for å gi tilgang til nettverksressurser.

Ris. 1. Metoder for å søke etter informasjon i hypertekstdatabaser

Sekund- søk med hyperkoblingsnavigasjon. Ved bruk av denne typen søketilfeller må brukeren først få tilgang til serveren som er knyttet til den tilsvarende databasen. Du kan deretter finne dokumentet ved hjelp av hyperkoblinger. Denne metoden er åpenbart praktisk når ressursadressen er ukjent for brukeren. Nettportaler er ment å brukes som et utgangspunkt for søk ved implementering av denne metoden - servere som gir direkte tilgang til et bestemt sett med servere, inkludert informasjonsressurser installert på dem, samt nettapplikasjoner som implementerer webtjenester som tilsvarer formålet med portalen. Servere som er tilgjengelige via portalen kan tilhøre et spesifikt system (for eksempel bedrifts-) eller ulike systemer og være spesielt utvalgt i henhold til typen, tematiske eller andre egenskaper ved dokumenter og data som finnes på deres nettsteder. Vanligvis kombinerer portaler en rekke funksjoner for å beholde klienten så lenge som mulig. Den dominerende tjenesten til portalen er helpdesk-tjenesten: søk, kategorier, økonomiske indekser, værinformasjon, etc. Hvis nettsteder i de fleste tilfeller er samlinger av statiske nettsider, er portaler samlinger av programvareverktøy og pre-ustrukturert informasjon, som disse verktøyene transformerer til strukturerte data på forespørsel fra spesifikke brukere.

Tredje Søkemetoden innebærer bruk av Internett-søkeservere. Søkeservere er dedikerte vertsdatamaskiner som er vert for databaser med Internett-ressurser. Brukergrensesnittet til en slik server har et felt for å legge inn nøkkelord som beskriver emnet av interesse for brukeren (se fig. 2).

Fig.2. Visning av Yandex-søkeservervinduet

Serveren oppfatter disse ordene som en informasjonsforespørsel, i samsvar med hvilken den søker etter ressurser og presenterer en liste over funnet dokumenter til brukeren. Åpenbart, når du implementerer denne metoden, er feil av både type 1 (mangler målet) og type 2 (informasjonsstøy) mulig. Det bør nevnes at det er to grupper søkeservere: søkemotorer og fagkataloger. Forskjellen deres skyldes metoden for å opprette og deretter fylle på databasen med Internett-ressurser, som denne serveren bruker til å søke etter informasjon. Dermed har søkemotorer et spesielt program - en søkerobot. Den overvåker hele tiden nettverket, samler informasjon fra nettsider, indekserer dem og registrerer søkebildet deres i databasen. I fagkataloger opprettes en database med Internett-dokumenter "manuelt" av spesialistredaktører. Siden det ikke er noen enhetlig administrasjon på Internett, er informasjonsressursene i stadig endring. Nye dokumenter kan vises i den og eksisterende dokumenter kan forsvinne. Hyppigheten av å oppdatere informasjon i dokumenter for forskjellige nettsteder er forskjellig: for noen er det flere ganger i timen, for noen er det en gang om dagen, dag, måned, etc. Derfor er det veldig viktig å forstå at når du bruker informasjonsinnhentingssystemer for å finne informasjon på Internett, utføres søket ikke på det virkelige rommet til Internett-dokumenter, men i en eller annen modell, hvis innhold kan avvike betydelig fra det faktiske. Internett-innhold på tidspunktet for søket. Basert på dekningen av indekserte ressurser, kan søkemotorer deles inn i to grupper: internasjonal og russiskspråklig. De første indekserer alle dokumenter publisert på Internett på rad. Sistnevnte indekserer ressurser som ligger i domenesoner med en overvekt av det russiske språket. Listen over de mest populære systemene er gitt i tabell. 1.

Bord 1. Mest populære søkemotorer

Internasjonal russisktalende
Google Yandex (44,4 % av Runet)
Yahoo! Rambler (10,6 % av Runet)
Bing Mail.ru (7,3 % av Runet)
MSN Nigma (0,5 % av Runet)
AltaVista Gogo.ru (0,3 % av Runet)
Spørre Aport (0,2 % av Runet)

Merk: Runet er den russiskspråklige delen av Internett, og består av domener med navnene ru og RF.

Det er nødvendig å nevne at det er en spesiell kategori søkeservere - metasøkemotorer. Deres grunnleggende forskjell fra søkemotorer og emnekataloger er at de ikke har sin egen indeksdatabase, og derfor, når de mottar en brukerforespørsel, omdirigerer de den til flere søkeservere samtidig (se fig. 3).

Ris. 3. Driftsskjema for metasøkesystemet

Muligheten til å bruke flere søkemotorer samtidig for ett søk er en åpenbar fordel med metasøkemotorer. For tiden har Metabot.ru-systemet, hvis grensesnitt er vist i fig. 1, funnet utbredt bruk. 4. Dette systemet lar deg bruke både internasjonale og russiskspråklige søkeservere for å søke etter ressurser.

Tre måter å søke på Internett på

Internett generelt og World Wide Web spesielt gir abonnenten tilgang til tusenvis av servere og millioner av websider som lagrer en ufattelig mengde informasjon. Hvordan ikke gå seg vill i dette "informasjonshavet"? For å gjøre dette, må du lære hvordan du søker og finner nødvendig informasjon på Internett.

Som allerede nevnt er det tre hovedmåter å søke etter informasjon på Internett.

1. Spesifiser sidens adresse. Dette er den raskeste søkemetoden, men kan bare brukes hvis den eksakte adressen til dokumentet er kjent.

2. Navigering via hyperlenker. Dette er den minst hensiktsmessige metoden, siden den kan brukes til å søke etter dokumenter som bare er nær i betydningen det gjeldende dokumentet. Hvis det gjeldende dokumentet for eksempel er dedikert til musikk, er det usannsynlig at du ved å bruke hyperkoblinger i dette dokumentet vil kunne komme til et nettsted dedikert til sport.

3. Kontakte en søkeserver (søkemotor). Å bruke søkeservere er den mest praktiske måten å finne informasjon på. For øyeblikket er følgende søkeservere populære i den russiskspråklige delen av Internett: Yandex; Rambler.

Det finnes andre søkemotorer. For eksempel er et effektivt søkesystem implementert på serveren til mail.ru-posttjenesten.

Søk på servere

Den mest tilgjengelige og praktiske måten å søke etter informasjon på World Wide Web er å bruke søkemotorer. I dette tilfellet kan informasjon søkes gjennom kataloger, så vel som gjennom et sett med nøkkelord som karakteriserer tekstdokumentet det søkes i.

La oss se på bruken av søkeservere mer detaljert. Søk server inneholder et stort antall lenker til en lang rekke dokumenter, og alle disse lenkene er systematisert til tematiske kataloger. For eksempel: sport, kino, biler, spill, vitenskap, etc. Dessuten installeres disse koblingene av serveren uavhengig, automatisk ved regelmessig å se alle websider som vises på World Wide Web. I tillegg gir søkemotorer brukeren muligheten til å søke etter informasjon ved hjelp av nøkkelord. Etter å ha angitt nøkkelord, begynner søkeserveren å vise dokumenter på andre webservere og vise lenker til de dokumentene der de angitte ordene vises. Vanligvis sorteres søkeresultater i synkende rekkefølge etter en spesiell dokumentvurdering, som viser hvor fullt ut et gitt dokument oppfyller søkeordene eller hvor ofte det blir forespurt på nettet.

Språk for søkemotorer

En gruppe nøkkelord dannet i henhold til visse regler - ved bruk av et spørringsspråk - kalles en forespørsel til en søkeserver. Spørringsspråkene for forskjellige søkeservere er veldig like. Du kan lære mer om dette ved å gå til «Hjelp»-delen av den ønskede søkeserveren. La oss se på reglene for å lage spørringer ved å bruke Yandex-søkemotoren som et eksempel.

Operatørsyntaks Hva betyr operatør? Eksempelforespørsel
mellomrom eller & Logisk OG (innenfor en setning) Faste proteser
&& Logisk OG (i dokumentet) Typer && (faste proteser)
| Logisk ELLER bilde | fotografering | øyeblikksbilde | fotografisk bilde
+ Obligatorisk tilstedeværelse av ordet i dokumentet som ble funnet +å være eller +ikke være
() Gruppering av ord (teknologi | produksjon) (ost | cottage cheese)
~ Binær operator OG IKKE (innen en setning) banker ~ lov
~~ eller _ Binær OG IKKE-operator (i dokumentet) Paris guide ~~ (byrå | tur)
/(n m) Avstand i ord (minus (-) – tilbake, pluss (+) – fremover) leverandører /2 kaffemusikk /(-2 4) utdanning ledige stillinger ~ /+1 elever
« « Søk etter en setning “Fixed proteser” Tilsvarer: Fixed /+1 proteser
&&/(n m) Avstand i setninger (minus (-) – tilbake, pluss (+) – fremover) medisin && /1 proteser

Generell informasjon.

For tiden forener Internett hundrevis av millioner av servere som er vert for milliarder av forskjellige nettsteder og individuelle filer som inneholder ulike typer informasjon. Dette er et gigantisk depot av informasjon. Det finnes ulike metoder for å søke informasjon på Internett.

Søk på kjent adresse. De nødvendige adressene er hentet fra kataloger. Når du kjenner adressen, skriv den bare inn i adressefeltet til nettleseren.

www.gov.ru - server for russiske myndigheter.

Konstruere en adresse av brukeren. Når du kjenner systemet for å danne Internett-adresser, kan du konstruere adresser når du søker etter nettsider.

Til nøkkelordet (navnet på et selskap, foretak, organisasjon eller et enkelt engelsk substantiv), må du legge til et tematisk eller geografisk domene, og du må koble intuisjonen din.

Kommersielle nettsideadresser:

www.cnn.com (CNN World News),

www.sony.com (SONY-selskap),

www.mtv.com (MTV musikknyheter).

Adresser til utdanningsinstitusjoner:

www.ntu.edu (US National University).

Regionale serveradresser:

www.poland.net (Polen),

www.israil.net (Israel).

Internett-søkemotorer

Det er utviklet spesielle systemer for informasjonsinnhenting for å søke etter informasjon på Internett. Søkemotorer har en vanlig adresse og vises som en webside som inneholder spesialverktøy for organisering av søk (søkestreng, emnekatalog, lenker). For å ringe en søkemotor, skriv ganske enkelt inn adressen i adressefeltet til nettleseren.

I henhold til metoden for å organisere informasjon er systemer for informasjonsinnhenting delt inn i to typer: klassifisering (rubrikatorer) og ordbok.

Kategorier (klassifiserere) er søkemotorer som bruker en hierarkisk (tre) organisering av informasjon. Når du søker etter informasjon, ser brukeren gjennom tematiske overskrifter, og begrenser søkefeltet gradvis (hvis du for eksempel trenger å finne betydningen av et ord, må du først finne en ordbok i klassifisereren, og deretter finne det ønskede ordet i den).

Ordboksøkesystemer er kraftige automatiske programvare- og maskinvaresystemer. Med deres hjelp blir informasjon sett (skannet) på Internett. Data om plasseringen av denne eller den informasjonen legges inn i spesielle indekskataloger. Som svar på en forespørsel utføres et søk i henhold til søkestrengen. Som et resultat blir brukeren tilbudt de adressene (URLene) der det søkte ordet eller gruppen av ord ble funnet på tidspunktet for skanning. Ved å velge en av de foreslåtte lenkeadressene kan du gå til dokumentet som ble funnet. De fleste moderne søkemotorer er blandet.

De mest kjente og populære søkemotorene:

www.aport.ru www.yahoo.com www.rambler.ru www.yandex.ru www.altavista.com www.google.com

Det finnes systemer som spesialiserer seg på å søke etter informasjonsressurser på ulike områder.

Søke etter personer på Internett:

www.whowhere.ru www. bigfoot.com

Søk etter nyhetsgrupper (Usenet):

www.dejanews.com

Temasøkemotorer:

Søk programvare:

Søk gjennom filarkiver:

http://ftpseach. city.ru, http://ftpsearch. licos.com

Kataloger (tematiske samlinger av lenker med merknader):

http://www.atrus.ru

Ofte kan et effektivt søk etter informasjon utføres ved hjelp av regionale kataloger - spesialiserte servere som inneholder data om bedrifter eller nettressurser i en by eller region. For eksempel, for St. Petersburg er en slik katalog plassert på http://www.spb.ru.

En liste over IPS finner du på nettsiden www.monk. newmail.ru

En mer detaljert liste over søkemotorer og kataloger er presentert i tabellen. 3.2.

Regler for utførelse av forespørsler

Hjelpedelen for hver søkemotor gir informasjon om hvordan du søker og hvordan du konstruerer en søkestreng. Nedenfor finner du informasjon om et typisk "gjennomsnittlig" søkespråk.

Enkel forespørsel.

Skriv inn ett ord som definerer søkeemnet. For eksempel, i søkemotoren Rambler.ru er det nok å skrive inn: automatisering.

Det finnes dokumenter som inneholder ordene spesifisert i forespørselen. Alle former for russiske ord gjenkjennes; som regel ignoreres bokstaver.

Du kan bruke tegnet "*" eller "?" i spørringen. Signer "?" i et nøkkelord erstattes ett tegn, i stedet for hvilken bokstav kan erstattes, og "*"-tegnet er en sekvens av tegn.

For eksempel vil søket automatisk* tillate deg å finne dokumenter som inneholder ordene automatisk, automatisering osv.

Kompleks forespørsel.

Det er ofte behov for å kombinere nøkkelord for å få mer spesifikk informasjon. I dette tilfellet brukes ytterligere koblingsord, funksjoner, operatorer, symboler, kombinasjoner av operatorer, atskilt med parentes.

For eksempel betyr søket musikk & (beatles | beatles) at brukeren ser etter dokumenter som inneholder ordene musikk og beatles eller musikk og beatles.

Tabell 3.1 viser reglene for generering av forespørsler vedtatt i Aport-systemet (http://www.aport.ru).

Tabell 3.1

Operatører for å lage spørringer

Operatør Synonymer En kommentar
OG OG& Spørringen vil finne dokumenter som inneholder begge nøkkelordene. Du trenger ikke skrive det. For eksempel, spørringen: informatikk og lærebok tilsvarer informatikk lærebok
ELLER ELLER | Det gjøres et søk etter de dokumentene som bruker ett av de angitte ordene eller begge ordene samtidig.
IKKE IKKE - ~ Søket er begrenset til dokumenter som ikke inneholder ordet spesifisert etter operatøren
" " " " Doble eller enkle anførselstegn lar deg finne en setning
Dato= dato:dato= Søket er begrenset til dokumenter som faller innenfor det angitte datointervallet Eksempel 1. valutadato=01/02/2002-01/03/2002. Denne forespørselen vil produsere dokumenter som inneholder ordet "valuta" og har en dato fra 1. februar 2002 til 1. mars 2002. Eksempel 2. dato = 01/03/2002 valuta Eksempel 3. dato:<02/03/2002 валюта

Tabell 3.2

Liste over søkemotorer og kataloger

Adresse Beskrivelse
www.excite.com Søkemotor med nettstedanmeldelser og guider
www.alta-vista.com Søkeserver, avanserte søkefunksjoner tilgjengelig
www.hotbot.com Søk server
www.poland.net www.israil.net Regionale søkeservere i Polen, Israel
www.ifoseek.com Søkeserver (enkel å bruke)
www.ipl.org Internet Publik library, et offentlig bibliotek som opererer innenfor rammen av World Village-prosjektet
www.wisewire.com WiseWire - søk organisasjon ved hjelp av kunstig intelligens
www.webcrawler.com WebCrawler - søkeserver, enkel å bruke
www.yahoo.com CatalogWeb og grensesnitt for tilgang til fulltekstsøk på AltaVista-serveren
www.aport.ru Aport - russiskspråklig søkeserver
www.yandex.ru Yandex - russiskspråklig søkeserver
www.rambler.ru Rambler - russiskspråklig søkeserver
Internett-hjelperessurser
www.yellow.com Gule sider Internett
munk newmail.ru Søkemotorer med ulike profiler
www.top200.ru Topp 200 nettsteder
www.allru.net
www.ru Katalog over russiske Internett-ressurser
www.allru.net/z09. htm Utdanningsressurser
www.students.ru Russisk studentserver
www.cdo.ru/index_new. asp Fjernundervisningssenter
www.open. ac. uk UK Open University
www.ntu.edu US National University
www.translate.ru Elektronisk tekstoversetter
www.pomorsu.ru/guide. library.html Liste over lenker til nettverksbiblioteker
www.elibrary.ru Vitenskapelig elektronisk bibliotek
www.citforum.ru Digitalt bibliotek
www.infamed.com/psy Psykologiske tester
www.pokoleniye.ru Nettstedet til Internet Education Federation
www.metode. narod.ru Utdanningsressurser
www.spb. osi.ru/ic/distant Fjernundervisning på Internett
www.examen.ru Eksamener og prøver
www.kbsu.ru/~book/ Lærebok i datavitenskap
Mega. km.ru Oppslagsverk og ordbøker

Søke etter informasjon på Internett: fallgruver

Problemer som ikke er på overflaten gjør seg ofte gjeldende bare "i ettertid", etter at et visst stadium av søkearbeidet er fullført, og muligens, basert på resultatene, en beslutning allerede er tatt. Hva hindrer deg i å gjøre situasjonen gjennomsiktig helt fra begynnelsen av driften av dette eller det informasjonsinnhentingssystemet (IRS)? Svaret er ganske enkelt: mangelen på omfattende informasjon av denne typen fra utviklerens side. Den direkte konsekvensen av dette er upåliteligheten til de mottatte dataene og dets ukontrollerte tap. Det er sjelden å finne en søkemotor på Internett som ikke har noen "udokumenterte" funksjoner. Det ser ut til at brukeren ikke trenger mye informasjon, nemlig:

hvordan IPS-databasen er fylt og hva volumet er;

hele spekteret av språkfunksjoner for systemsøk;

hovedtrekkene i presentasjonen av søkeresultater, først og fremst algoritmen for rangering av poster fra listen over svar på et søk.

Dessverre, kilden til slik informasjon er vanligvis ikke et dokument som er tilgjengelig fra hovedsiden til en søkeserver, men publikasjoner av individuelle forfattere spredt over Internett, bøker og datablader. Årsakene til denne tilstanden inkluderer tilsynelatende ikke bare uaktsomhet fra utvikleren, men også en faktor som kalles markedsføringspolitikk. Enkelt sagt, å gi en søkemotor den mest komplette informasjonen om seg selv har ikke alltid en positiv effekt på rangeringen. Men i noen tilfeller er brukeren ganske i stand til å ta kontroll over situasjonen. Det er ofte mulig å finne ut driftsfunksjonene til en valgt søketjeneste gjennom testing. Å konstruere spesielle testspørringer som raskt avklarer akkurat det aspektet ved systemets drift som er viktigst for den aktuelle oppgaven, viser seg i mange tilfeller å være ikke-trivielt. Vi vil vie diskusjonen vår til hvordan du unngår noen problemer når du arbeider med IPS. Som eksempler for å illustrere presentasjonen vil kjente søkemotorer på Internett bli vurdert.

Effektivt søk etter informasjon ved hjelp av en datamaskin er en presserende oppgave som oppstår ikke bare for nybegynnere, men også for erfarne Internett-brukere, fordi den som eier dataene eier verden, som det velkjente ordtaket sier. I dag skal vi se måter å raskt finne nødvendig og viktig informasjon på det russiskspråklige Internett. For øyeblikket er det bare tre typer av dem:

  1. ved å angi den direkte adressen til nettstedet der nødvendige data og informasjon er plassert;
  2. surfe på lenker ved hjelp av en personlig datamaskin på Internett;
  3. ved hjelp av søkemotorer (maskiner) på Internett.

La oss ta en mer detaljert titt på alle måtene å søke etter oppdatert informasjon på Internett ved hjelp av en datamaskin.

Søke etter informasjon ved å bruke en direkte lenke på Internett

Hvis du allerede vet hvor informasjonen du trenger er plassert på Internett, blir det mye enklere å søke ved hjelp av en datamaskin: du trenger bare å skrive inn nettstedsadressen i nettleserlinjen og gjøre deg kjent med dataene som er oppgitt. Hvis du ser en voluminøs tekst på en nettside på Internett, og du er interessert i bokstavelig talt noen få linjer skjult i et "tonn" med trykte tegn, kan du bruke søket på siden. For å gjøre dette, trykk på tastekombinasjonen Ctrl og F (en hvilken som helst datamaskintastaturoppsett), og i den foreslåtte "Finn"-kolonnen, skriv inn en setning eller et ord som er nøyaktig inneholdt i avsnittet med informasjonen du leter etter, og trykk deretter " Tast inn".

Nettleseren vil fremheve i en annen farge alle ordene nevnt på siden som ligner på ordet du leter etter. Imidlertid skjer det ganske ofte at vi ikke husker eller ikke en gang kjenner lenkene til plasseringen av informasjon på Internett. I dette tilfellet er det mest praktisk å ty til de to andre typene datasøk ved hjelp av en datamaskin.

Søk med Internett-surfing

Internettsurfing er et søk som involverer sekvensielt å følge lenker fra ett tematisk nettsted til et annet inntil kilden til de nødvendige dataene er funnet. Fordelen med denne metoden for datasøk på Internett er dens fascinasjon og evnen til å mestre en stor mengde informasjon fra forskjellige nettsteder konsekvent og grundig. Blant ulempene med denne typen søk er varigheten, samt det faktum at du også på en eller annen måte må komme deg til det opprinnelige nettstedet som surfingen din vil begynne fra. Og hvis du ikke har adressen til nettstedet du vil begynne å surfe fra, må du her ty til hjelp av en slik søkemetode som søkemotorer.

Måter å søke etter informasjon på Internett ved hjelp av søkemotorer

I dag er slike søkemotorer som Yandex.ru, Rambler.ru, Google.ru viden kjent for Runet-publikummet. Disse sidene lar deg søke etter data ved å skrive inn et søk på alle internettsider. I henhold til operasjonsprinsippet er søkemotorer av to typer: søkeindekser og søkekataloger:

  • Søk i kataloger. Disse sidene gir hjelp til å søke etter data om et spesifikt emne på Internett: informasjonen i slike kataloger er tydelig strukturert i grupper og emner, noe som hjelper deg raskt å finne resultater. I hvert emne tilbys brukeren en rekke lenker til nettsteder hvor han kan finne kunnskap av interesse.
  • Søk i indekser. Dette er indekssider der brukeren, når han skriver inn et nøkkelord i søkefeltet, mottar en rekke lenker til sider på Internett som inneholder det forespurte ordet eller uttrykket. Søkeindekser utfører søk ved hjelp av spesielle programmer kalt "edderkopper" som skanner sidene til nettsteder på Internett for emnet. Etter en slik skanning legger søkemotoren dem inn i sin database, hvorfra informasjon senere "hentes" når brukeren skriver inn et søk i søkeordet.

Regler for informasjonssøk på Internett

La oss nå se på de grunnleggende, men viktige reglene for effektivt å søke etter oppdatert informasjon på det russiskspråklige Internett ved hjelp av en datamaskin.

  1. Lag den riktige nøkkelfrasen for å få tilgang til søkemotoren. Du kan ikke bruke bare ett søkeord hvis du ønsker å få et virkelig nyttig resultat, og du bør ikke skrive inn for lange fraser. Den optimale søkestørrelsen er fra 2 til 4 ord. Hvis søkemotoren finner for få resultater i søkeresultatene, bør du prøve å omformulere den angitte setningen, erstatte noen ord med synonymer, og også se etter stavefeil i ordene. Husk: det er ingen informasjon som ikke er på Internett. Bare velg de riktige ordene, følg reglene så finner du det du leter etter.
  2. Bruk spesielle operatører. Moderne effektivt og raskt søk etter all nødvendig informasjon ved hjelp av en søkemotor og bruk av en personlig datamaskin innebærer kunnskap og bruk av noen triks, som er forkortelser og spesielle operatørtegn. Operatører er ikoner som brukes når du oppretter en spørring i en søkemotor og gjør det lettere å finne de nødvendige dataene. La oss se på de vanligste operatorene og deres betydninger, som kan være nyttige i praksis.
  3. Et mellomrom eller et &-tegn betyr at du må søke etter dokumenter med den nødvendige frasen i samme setning. Eksempel på å gå inn i søkefeltet: deilig oppskrift eller deilig og oppskrift.
  4. && - betyr behovet for å søke etter en side der individuelle ord fra en setning vil bli nevnt gjennom hele teksten, og ikke bare én setning. Eksempel: deilig && oppskrift.
  5. | - du vil bli tilbudt artikler der kun 1 av de angitte ordene vil bli brukt. Eksempel: ekteskap | ulempe | defekt.
  6. + - betyr å søke etter tekst med en obligatorisk kombinasjon av ord angitt mellom "+"-tegnet. Eksempel: deilig + oppskrift.
  7. “ ” – søk etter en kjede med ord uten å dele den opp i individuelle ord. Eksempel: "Krasnaya Polyana-godteri".

Ved å følge disse enkle reglene når du søker etter data ved hjelp av en datamaskin og Internett, vil du gjøre oppgaven enklere og alltid raskt kunne finne informasjonen du trenger når som helst.

Siste nettstedmateriale