Pour enrichir ses Knowledge Cards, Google puise dans plusieurs bases sémantiques, dont le CIA FactBook, Freebase, un site participatif de connexion sémantique du web, racheté en 2010, et bien sûr Wikipedia et wikidata. Google s’appuie également sur ses propres outils (Google Images ou Google Adresses), sur l’intelligence universelle (les données récoltées sur d’autres sites web, triées et filtrées par ses algorithmes de plus en plus performants) et le RankBrain (qui utilise l’intelligence artificielle).

Du fait de cet énorme trafic potentiel, les webmestres cherchent à figurer en tête de liste, quitte à tricher. On a noté à une certaine époque l'utilisation de techniques de référencement abusif (spamdexing) destinées à flouer les robots des moteurs pour faire remonter le site dans les résultats; les moteurs ont néanmoins réagi en modifiant leurs algorithmes de classement pour pénaliser ces sites. Le but d'un moteur de recherche est de fournir la requête la plus pertinente à l'utilisateur, aussi les algorithmes de classement sont constamment améliorés pour prévenir les fraudeurs et continuer à ressortir les résultats les plus utiles aux internautes.
×