Ce este un motor de căutare

versiune de tipărit

Ajuta utilizatorul să găsească informațiile de pe Web sunt numite motoare de căutare (motoarele de căutare). În găsirea resursa dreapta utilizatorul introduce unul sau mai multe cuvinte-cheie care, în opinia sa, cel mai bine este de a capta esența întrebărilor. Motorul de căutare în câteva secunde scanează întregul propriul catalog web resurse, format din zeci sau sute de gigabytes de date. Ca urmare, utilizatorul este oferit o listă de link-uri către pagini care includ cuvintele specificate. Această schemă de căutare de bază este pus în aplicare cu o varietate de îmbunătățiri și extensii în aproape toate motoarele de căutare din lume. În special, există sisteme care să introducă o interogare în limbaj natural (de exemplu, „Ce știm despre.“) Sistemele care implementează cataloage tematice, pentru regăsirea ușoară, etc. În plus, aproape toate sistemele au încercat să conținutul paginii miniere pentru a îmbunătăți calitatea de căutare și afișează informații relevante.







Toate motoarele de căutare (servicii de căutare, motoarele de căutare) sunt împărțite în motoarele de căutare (roboți, indicatori) și directoarele de căutare. Înțelegerea diferenței dintre ele va fi foarte util atunci când aleg un instrument de căutare. Motoarele de căutare - un sistem format din 2 părți. Unul dintre ei (se execută utilizatorul) caută în directorul lor de pagini web (numit „index“). Cealaltă parte - este un program complex, care comunică în mod constant cu serverele web la nivel mondial, le încarcă cu toate documentele disponibile și analizează conținutul include documente în index. Această parte a sistemului este numit „crawler“ (pe șenile, păianjen - „slider“). Fiecare motor de căutare are propriul „păianjen“, cu propriile lor „obiceiuri“. Fiecare sistem indexează pagini modul nostru special, și prioritățile atunci când se caută indicii sunt diferite, de asemenea. Prin urmare, efectuarea unei anchete pentru anumite cuvinte cheie sau expresii, vom avea rezultate diferite pentru fiecare dintre motoarele de căutare.

Spre deosebire de motoarele de căutare, directoare de căutare de informații se adaugă numai la inițiativa utilizatorului. Page adăugat la o secțiune bine definită a catalogului, care este asociat cu subiectul, pagina de iluminat. Dintre aceste secțiuni este format Index puternic, se deplasează la care pot fi găsite pe pagina orice subiect mai mult sau mai puțin popular. Cu toate acestea, nu merg neapărat pe subiecte în orice director bun are un sistem de căutare, care poate introduce, de asemenea, cuvinte cheie, care reduce foarte mult timpul petrecut de către utilizator.







De asemenea, există unele motoare de căutare (Excite, Infoseek), care se află în posesia și catalog. În consecință, indicele de exploatare motorul de căutare „tarator“ în sine și de director actualizat moderatorii de sistem.

Uneori Internet sunt motoare de căutare full-text (motor de căutare full-text). Ei indexeze tot ce cuvinte și expresii pe pagina web și să ia în considerare ordinea lor. În schimb, motoarele de căutare abstracte pentru un anumit algoritm creează un „extract“ pagina indexată, care simplifică foarte mult sarcina de a căuta pentru utilizator.

Motoarele de căutare și directoare globale este deja destul de bine-cunoscut peste tot în lume, chiar și cei care nu prea știu nimic despre dezvoltarea calculatorului, și chiar mai mult, Internet-tehnologii. În fiecare an, serviciile lor sunt de cotitură tot mai mulți oameni, dar aici se pune întrebarea: „Ce să caute“ Răspunsul la acest lucru este destul de simplu și concis.

Cele mai frecvente de pe Internet este de a căuta cuvinte cheie, de exemplu, căuta documente care conțin textul specificat exact.

Căutare mai puțin frecvente folosind operanzii de algebra booleană, cum ar fi AND, NOT și OR. Utilizarea operanzi crește în mod semnificativ eficiența de căutare. Dacă introduceți într-o interogare de motor de căutare: (mare grosime SAU) și bogat și (NU inteligente). Vom primi link-uri către pagini care îndeplinesc următoarele criterii:

  • conțin cuvântul „bogat“;
  • conțin fie un „gros“ sau „mare“;
  • Ele nu conțin cuvântul „inteligent“.

Noutatea în domeniul căutării pe Internet - Căutare de proximitate (căutare cu distanta). Această căutare, în care utilizatorul indică la ce distanță între ele trebuie plasate cuvintele cheie în document. De exemplu, pentru motorul de căutare de limbă rusă „Yandex“ (www.yandex.ru) atunci când vi se solicită: „grăsime / bogat 4“ Trebuie să găsiți documente care conțin cuvântul „grăsime“, iar cuvântul „bogat“, iar distanța dintre ele trebuie să fie să nu mai mult de patru cuvinte.

O altă căutare - căutare avansată (de expansiune pentru interogare) - procesul de construire a unei noi interogare bazată pe cea anterioară. De exemplu, una dintre cele mai populare motoare de căutare - AltaVista (www.altavista.com) - vă permite să dezamorseze multe mii de lista de rezultate prin eliminarea din acestea a documentelor în funcție de anumite criterii.

Caută în domenii specifice (de căutare Field) vă permite să căutați nu numai pentru întregul HTML-document, dar, de asemenea, în mod selectiv pe anumite domenii. De exemplu, puteți căuta pe titlul documentului (titlu), în acest caz, ia în considerare numai cuvintele cheie găsite este titlul documentului.

Există un câmp de căutare ALT tag-uri IMG, o căutare este utilizat pentru a găsi imagini pe Internet pentru un anumit subiect.

Pentru a putea reduce (generată): capacitatea sistemului de a căuta cuvinte în document nu este numai într-o formă strict definită, dar, de asemenea, în toate formele sale morfologice. De exemplu, nu numai „du-te“, dar „este“, „mersul pe jos“, etc. Un exemplu explicit de această căutare - catalogul de „Yahoo!“.

În căutare internet lume există un astfel de lucru ca „ponderare“ (factor de ponderare). El sporește relevanța documentului, nu numai de suma pe care o conține cuvinte cheie, ci și de locația în document. O mai mare „greutate“ sunt cuvinte în titlul paginii, cuvintele etichete separate , , , cuvinte care sunt aproape de tag-uri și documentul.

Atunci când căutați un utilizator poate indica, de asemenea, importanța sistemului unui cuvânt într-o interogare. De exemplu, în „Rambler“ la cerere „-Koza ++ Ox“ în emiterea de rezultatele cele mai relevante vor primi pagini care conțin „oi“, o mai mică - „Capra“