Zoekmachines

In de context van internettechnologieën is een zoekmachine (in het Engels: zoekmachine) een automatisch systeem dat, op verzoek, een reeks gegevens (vaak zelf verzameld) analyseert en een index van de beschikbare inhoud retourneert en deze in een manier automatisch op basis van statistisch-wiskundige formules die de mate van relevantie aangeven bij een specifieke zoeksleutel. Een van de gebieden waar zoekmachines meer gebruik van maken, is het ophalen van informatie en op het web. De meest gebruikte zoekmachines in 2017 waren: Google, Bing, Baidu, Qwant, Yandex, Ecosia, DuckDuckGo.

Google zoekmachine

Beschrijving

Conceptueel is een zoekmachine een systeem dat sterk lijkt op een webtoepassing of een client-serversysteem, via internet, waarbij de client wordt vertegenwoordigd door de webbrowser van de gebruiker die op verzoek verbinding maakt met een server die op zijn beurt voert een zoekopdracht uit, met behulp van geschikte zoekalgoritmen, op databases (gedistribueerde databases). Bij de analyse van de verstrekte resultaten is een essentieel onderdeel de zogenaamde crawler of spider. Een goede zoekmachine is degene die erin slaagt om het grootste aantal inhoud te vinden in overeenstemming met het type verzoek, en ze te rangschikken op belangrijkheid en relevantie volgens de zoekspecificatie.

Operationele fasen

Het werk van zoekmachines is hoofdzakelijk verdeeld in drie fasen:

  • analyse van het werkterrein (door middel van specifieke crawlers);
  • catalogiseren van het verkregen materiaal;
  • reactie op verzoeken van gebruikers.

Catalogiseren

Na analyse van de pagina’s, volgens criteria die van motor tot motor verschillen, worden sommige ervan in de database en in de index van de zoekmachine ingevoegd.

Het tekstgedeelte dat tijdens de analysefase is opgeslagen, wordt vervolgens geanalyseerd om antwoorden te geven op zoekopdrachten van gebruikers. Veel webzoekmachines maken ook een kopie van de tekstuele gegevens van elke gearchiveerde pagina beschikbaar voor wanneer de oorspronkelijke bron onbereikbaar is: deze functie wordt caching genoemd.

Antwoord

Reageren op verzoeken van gebruikers impliceert de noodzaak om de sites in volgorde van relevantie te vermelden met betrekking tot het ontvangen verzoek.

Om de relevantie van een site vast te stellen, worden documenten met het door de gebruiker ingevoerde trefwoord [9] doorzocht in de database, waarna elke zoekmachine zijn eigen algoritmen gebruikt om de pagina’s te classificeren, bijvoorbeeld hoe vaak de trefwoorden worden herhaald, hoeveel links dat document ontvangt, op welke punten van de pagina de trefwoorden zijn geplaatst, hoeveel sites in de database links naar die pagina bevatten, of hoe vaak een gebruiker die site heeft bezocht na een zoekopdracht.

Onderzoek verfijning

De mogelijkheid om de zoekopdracht te verfijnen verschilt van engine tot engine, maar bij de meeste kunt u Booleaanse operatoren gebruiken: u kunt bijvoorbeeld zoeken naar “Ganymedes EN satelliet GEEN schenker” om informatie te zoeken over Ganymedes als een planeet en niet als een mythologische figuur.

Op Google en op de modernste zoekmachines is het mogelijk om de zoekopdracht te verfijnen op basis van de taal van het document, de woorden of zinnen die aanwezig of afwezig zijn, het bestandsformaat (Microsoft Word, PDF, PostScript, enz.), afhankelijk van de datum van de laatste update en meer. U kunt ook naar inhoud zoeken op een bepaalde site, bijvoorbeeld “Ganymede-site: nasa.gov” zal zoeken naar informatie over Ganymedes op de NASA-site.

Op Exalead is er een speciaal onderdeel om de zoekopdracht intuïtiever te verfijnen.

Indexeren

Indexering verwijst naar het invoegen van een website in de database van een zoekmachine. Met andere woorden, het indexeren van een website is de manier waarop de site wordt verkregen en geïnterpreteerd door zoekmachines en daarom wordt weergegeven op hun reactiepagina’s op zoekopdrachten van internetgebruikers.

Positionering

De term positionering betekent het verkrijgen van zichtbaarheid tussen de resultaten van zoekmachines. Meer specifiek is het de operatie waarmee de site wordt geoptimaliseerd om in de resultaten te verschijnen in een positie die zo gunstig en relevant mogelijk is.

Optimalisatie

De term zoekmachineoptimalisatie betekent, in de taal van internet, al die activiteiten die gericht zijn op het verbeteren van de vindbaarheid van een website op zoekmachines (zoals bijvoorbeeld Google, Yahoo!, etc.) om de positionering op de antwoordpagina’s op vragen van internetgebruikers. Op zijn beurt is de goede positionering van een website in de responspagina’s van zoekmachines functioneel voor de zichtbaarheid van de verkochte producten/diensten.
Gesponsorde resultaten

Zoekmachines bieden ook gesponsorde resultaten, dat wil zeggen dat ze prominenter worden weergegeven in SERP’s (Search Engine Result Pages) websites van bedrijven die betalen om tot de topresultaten te behoren bij het zoeken naar termen (sleutelwoorden genoemd) die gerelateerd zijn aan het gebied van competentie van het bedrijf zelf. Resultaten van gesponsorde zoekmachines kunnen ook verschijnen op sites die deelnemen aan hun partnerprogramma. In het bijzonder staat Google toe dat betaalde resultaten die met het AdWords-programma zijn gekocht, op zijn resultatenpagina’s worden weergegeven (duidelijk verschillend van ‘natuurlijke’ resultaten). Daarnaast biedt het ook een sponsorservice die geschikt is voor alle sites die bepaalde vereisten hebben, AdSense genaamd. Google AdSense (vaak afgekort tot Google AS) gebruikt het vermogen van de zoekmachine om het thema van de pagina waar de juiste code is geplaatst te interpreteren om thematische advertenties weer te geven. Yahoo! Search heeft de komst aangekondigd van een soortgelijk programma genaamd Panama.

Populaire zoekmachines

De zoekmachines met de grootste internationale relevantie in 2020 zijn:

  • Google wordt niet alleen direct het meest gebruikt, maar is ook degene met het grootste aantal sites die de database gebruiken, mede dankzij het sponsorprogramma ‘AdSense voor zoeken’ dat tot het grootste AdSense-programma behoort.
  • Microsoft Bing, engine gemaakt door Microsoft en gebruikt door Microsoft Network, beter bekend als MSN.
  • Baidu, een Chinese zoekmachine die een even groot als groeiend gebruikersbestand verzamelt, gezien de totale overweldigende macht over de andere zoekmachines die in China worden gebruikt.
  • Yandex, de motor met het grootste marktaandeel in Rusland.

Deze 4 zoekmachines zijn uitgerust met eigen technologie.

Andere belangrijke vermeldingen zijn:

  • Qwant, een Europese zoekmachine die de gebruiker meer privacy wil bieden.
  • DuckDuckGo, privacyvriendelijke zoekmachine.
  • Ecosia, een Duitse ecologische zoekmachine, produceert minder koolstofdioxide dan concurrerende servers; 80% van de opbrengst wordt gebruikt om bomen over de hele wereld te planten en ontbossing te verminderen, en is opgericht in samenwerking met het WWF.
  • Startpage, een van de weinige zoekmachines ter wereld die privacy garandeert, omdat het de IP’s van degenen die zoekopdrachten uitvoeren niet opslaat of registreert.
  • Yahoo!, nu volledig gebaseerd op Bing-technologie.
  • Ask.com

Van de laatste zijn de enige die gedeeltelijk zijn uitgerust met een eigen index Qwant en gedeeltelijk DuckDuckGo.

De EU en sociale media en zoekmachines

Binnen de EU gelden allerlei regels voor zoekmachines en social media sites en regelmatig worden deze overtreden. Lees hier en hier verder.