Der tilføjes 5 millioner nye sider til internettet hvert sekund, og denne hastighed stiger hele tiden. I denne serie beskrives metoder til at søge i oplysningerne.
I denne lektion om principperne for en søgemaskine på internettet vil vi forstå, hvordan en søgemaskine sorterer, beskriver og evaluerer resultaterne.
Sortering af resultater
Lad os forestille os en færdig tønde, der er klar på søgeserveren. Vores…
I dagens lektion vil vi diskutere datatønder, deres struktur, StopSlovas og til sidst vil vi beskrive crawlere.
Datatønder
Dette er en særlig datatype, der ligger på flere servere samtidig i flere kopier. Det er normalt dataintensive filer på flere…
I dagens lektion vil vi se på indeksering og kanonisering af dokumenter på internettet.
Indeksering
Indekseringsprocessen udføres af en komponent, der kaldes indekseringsenheden. Dette er et specielt designet program, der gør de downloadede data (de…
Der tilføjes 5 millioner nye sider til internettet hvert sekund, og denne hastighed stiger hele tiden. For at skabe orden i dette enorme hav af informationer og finde noget i det findes der søgemaskiner. Det følgende arbejde har til formål at…