glossy

A B C D E F G H I J K L M N O P Q R S T U V W X Y Z

A

B

C

D

E

F

G

H

I

J

K

L

M

N

O

P

PageRank: è un termine ormai entrato di diritto nel lessico dei fruitori dei servizi offerti dal motore di ricerca Google.

Letteralmente traducibile come rango di una pagina web, il pagerank è facilmente riconducibile al concetto di popolarit tipico delle relazioni sociali umane, ed indica, o si ripromette di indicare, le pagine o i siti di maggiore rilevanza in relazione ai termini ricercati. Gli algoritmi che rendono possibile l’indicizzazione da parte di Google del materiale presente in rete utilizzano anche il grado di popolarit di una pagina web per definirne la posizione nei risultati di ricerca.

È bene tenere presente che il pagerank ha una valenza democratica nella quale il diritto al voto è permesso dalla semplice pubblicazione di una pagina web, e il voto viene espresso attraverso i collegamenti presenti nella suddetta pagina. Maggiore sar il grado di popolarit di un sito, maggiore risulter essere il valore dei voti (link) che quello stesso sito può esprimere.

L’interpretazione e la definizione della popolarit di un sito non sono però legate soltanto a queste votazioni democratiche, ma tengono presente anche della pertinenza del contenuto di una pagina, nonché delle pagine correlate, con i termini ed i criteri della ricerca effettuata. Questo permette, o perlomeno ha lo scopo, di attuare un controllo incrociato che garantisca la validit dei risultati di ricerca. [fonte: wikipedia]

Q

R

S

T

Il Trust Rank ha lo scopo di aiutare nella classificazione di una pagina o sito web, attraverso un processo che prevede diverse fasi:

  1. l’algoritmo seleziona un gruppo di pagine delle quali non è chiaro lo “spam status”, chiamate seed;
  2. un esperto umano esamina le pagine e comunica all’algoritmo quali possono essere definite spam (bad pages) e quali no (good pages);
  3. l’algoritmo infine identifica le altre pagine sulle basi della precedente classificazione umana. [fonte]

La determinazione certa di una pagina può provenire esclusivamente dalla soggettiva valutazione umana, l’esperto in questione viene definito Oracolo. Da questo è possibile comunque generare un semplice algoritmo che assegna una valore binario pari a 0 se la pagina contiene spam (bad page), oppure pari a 1 se la pagina è da considerarsi di buona qualit o senza spam (good page). L’intervento dell’Oracolo come detto porta via molto tempo ed è anche costoso in altri termini, non è possibile un suo intervento costante. Per diminuire gli interventi dell’Oracolo è possibile adottare una tecnica basata sull’esperienza che ogni singolo navigatore del web può avere: una pagina buona difficilmente punta a una pagina cattiva. Questo perché l’autore di una pagina con una qualit elevata difficilmente ha interesse che venga collegata con pagine con una qualit minore o nulla. Per questo motivo le tecniche di spam hanno cominciato ad adottare dei sistemi per collegare pagine che a prima vista sembrano buone, a pagine contenenti web-spam, con varie tecniche:

  • Introduzione nei siti che offrono la possibilit ai visitatori di inserire commenti, di un numero elevato di link verso le pagine cattive (questo problema viene risolto con la moderazione dei commenti o con la futura introduzione del tag link rel=”nofollow” – NDR). Tecnica valida anche per forum o web chat.
  • Creazione di pagine che offrono contenuti validi, ma che hanno un elevato numero di link nascosti verso siti equivoci. Questa tecnica viene definita Honey Pot. Per avvalorare questa tecnica chi crea queste pagine inserisce anche numerosi link verso pagine buone.
  • Creazione di directory basate sui risultati dei principali motori di ricerca, che utilizzano dei motori chiamati spam-engine, per piazzarsi nei primi posti delle ricerche.

In questi casi di esempio, adottando un algoritmo che funzioni da Oracolo, potrebbero crearsi situazioni equivoche. Se abbiamo un sito di 100 pagine, con 70 pagine buone (quindi con valore binario pari a 1) e 30 pagine cattive (con valore binario pari a 0), si avr un indice di fiducia intermedio. In questo caso solo l’occhio umano riesce a stabilire una verit certa. [fonte]

U

W

X

Y

Z