Hvordan virker det? | Søgemaskine

Den første edb-program, til at søge på Internettet var Archie, der blev oprettet i 1990 af studerende fra Montreal. Hun hentede en liste over alle filer fra alle FTP-servere og bygge en database, som du kan søge efter et filnavn. Den første full-text search engine var “WebCrawler”, der blev lanceret i 1994 og indeksering ressourcer ved hjælp af robot. Det giver brugerne mulighed for at søge efter alle ord, der ligger på en web-side. I 1998 af Larry page og Sergey Brin har oprettet Google søgemaskine baseret på deres projekt BackRub. Deres nyskabelse var indførelsen af sin egen PageRank algoritme, der rangerer en web-side, der er baseret på antallet af hyperlinks til dem. Søg under hensyn til morfologi, russisk blev indført i ‘ 96 på en søgemaskine, Altavista, blev lanceret Rambler og Aport. Og i September ‘ 97 blev åbnet den søgemaskine Yandex. Hvordan søgemaskine — dette er i nyhederne i dag.

I første omgang, søg robot til at få indholdet og indekseringen, til at generere et søgbart indeks. Søg robot eller “crawler” er et program, der automatisk går gennem alle de links der findes på siden, og fremhæver dem. Baseret på en forudbestemt liste af adresser, den søger efter nye dokumenter, vides endnu ikke til søgemaskinen. Fandt en ny side er analyseret ved hjælp af systemet for yderligere indeksering. Dette omhandler en speciel modul er indekseringen, der deler siden op i mindre dele ved at anvende leksikalske og morfologiske algoritmer. Data om web-sider, der er gemt i index databasen. Indekset giver dig mulighed for at hurtigt at finde de oplysninger som svar på anmodninger fra brugere.

Søgemaskine, til gengæld arbejder den med indekseringen. Når en bruger indtaster en forespørgsel i en søgemaskine, kontrollerer sit indeks, og giver en liste over de mest egnede web-sider.

Analyse af anmodningen begynder med definitionen af sproget, som et og det samme ord på forskellige sprog, der kan betyde forskellige ting. Derfor det system, gør opmærksom på, at den alfabet og sprog i brugergrænsefladen. Så søg videre til morfologi og bestemmer, hvilke dele af talen er skrevet indlæg. Det giver mulighed for at finde dokumenter, der indeholder forskellige former af det samme ord. Også den søgemaskine identificerer forespørgsel elementer geografiske navne, navne på personer, navne på organisationer, og til at overveje alle muligheder, supplerer anmodning om en ny formulering med den samme betydning. Hertil kommer, search engine udvider automatisk eller viser de resultater, som forkert og rettes forespørgsler.

De fleste søgemaskiner bruger ranking metoder og machine learning til at udlede, i begyndelsen af listen over de “bedste” resultater.

I den avancerede søgemaskiner af det neurale netværk, der forvandler søgeord og titler af web-sider i grupper af numre og semantisk vektorer. De kan sammenlignes med hinanden og give mere præcise resultater.

Der er søgealgoritmer at sammenligne vektorer af forespørgsler og web-sider, helt — og ikke kun deres overskrifter. Dette giver systemet mulighed for at forstå betydningen af sider og ret til at tage dem, når mennesker beskriver en søgning i dine egne ord. For det neurale netværk, der konverterer tekst på siderne i den semantiske vektorer i forvejen på det tidspunkt af indeksering. Og når en person anmoder forespørgslen, den algoritme, der sammenligner forespørgslen vektor med de allerede kendte vektorer af siderne.

Hvordan virker det? | Søgemaskine
Hej-News.ru


Date:

by