Creato da: Blog_Magazine

Blog Magazine

Il Blog Ufficiale della Community di Libero

Area personale

- Login

Cerca in questo Blog

 
trova
 

Archivio messaggi

  << Aprile 2024 >>  

Lu Ma Me Gi Ve Sa Do

 1   2   3   4   5   6   7 
 8   9   10   11   12   13   14 
 15   16   17   18   19   20   21 
 22   23   24   25   26   27   28 
 29   30           

Guarda le immagini del Mese

I miei Blog Amici

Leggi e diffondi

Scrivi anche tua.gif
 
Citazioni nei Blog Amici: 397

Ultimi commenti

Chi può scrivere sul blog

Solo i membri di questo Blog possono pubblicare messaggi e tutti gli utenti registrati possono pubblicare commenti.

RSS (Really simple syndication) Feed Atom

BlogMagazine

Top 100 Italia di BlogItalia.it e Technorati

Cunctator

Free Hit Counter Code

 

Messaggio N° 2612
Tag: Noi&Voi
02-09-2008 - 17:52

Siti Personali: Fatti trovare dal motore di ricerca



1.    Funzionamento dei motori di ricerca



Ogni motore di ricerca utilizza algoritmi proprietari e quindi non documentati. Tuttavia si possono estrapolare alcuni punti fermi che sono alla base del loro funzionamento e che vi suggeriamo per far trovare il vostro sito personale a fronte di una ricerca sugli argomenti che esponete.

Il ciclo di funzionamento è composto da tre fasi: Spidering, Indexing e Querying.

 Le prime due vengono eseguite in tempi relativamente lunghi e servono per preparare la base dati su cui poi gli utenti effettuano le ricerche. La terza è costituita dal processo di estrazione dei dati e documenti rilevanti a fronte di una ricerca

1.1 Spidering

In questa fase il componente del search engine detto 'robot' visita tutte le pagine seguendo i vari collegamenti ipertestuali e raccoglie le informazioni necessarie alla costruzione degli indici.  

Dal punto di vista del web designer il robot può essere visto come un automa che visita una pagina web, ne memorizza il contenuto, e poi fa la stessa cosa su tutti i link che trova nella pagina.

Nella fase di design di una pagina web è necessario tener presente che il ‘robot’ usa un browser puramente testuale quando visita una pagina web. Questo significa che non tutte le informazioni contenute all’interno di javascript, immagini, applet o oggetti flash, vengono viste dai motori di ricerca e quindi non vengono indicizzate.

Nella fase di design di una pagina web è quindi necessario tenere conto delle esigenze del 'robot' e progettare le pagine in modo da rendere visibile al motore di ricerca tutte le informazioni in essa contenute.

1.2 Indexing

In questa fase i dati estratti dallo spidering vengono analizzati e vengono create le strutture dati necessarie ad eseguire la ricerca.

1.3 Queryng

Questa fase comprende il processo di estrazione delle url rilevanti a fronte di una ricerca. I campi che sicuramente Google tiene in considerazione, ad esempio, sono i seguenti (in ordine di importanza decrescente):

  •  PageRank Valore numerico basato sul numero di link provenienti da altre pagine e dalla loro autorevolezza
  • Anchor-Text Testo associato ailink provenienti da altre pagine
  • HTML-title Titolo della pagina HTML 
  • Body   Testo contenuto all'interno della pagina 

2. Design di una pagina web

Il PageRank è un valore associato ad una pagina che misura la sua "autorevolezza" e dipende sostanzialmente dal numero di pagine che hanno un link verso la pagina in questione. Tuttavia questa affermazione è riduttiva in quanto un link proveniente da e una pagina che a sua volta ha un PageRank alto conta di più di un link proveniente da una a basso PageRank.

E' molto conveniente per questo motivo sottomettere il sito all "Open Directory Project" ("www.dmoz.org"). In questo modo si acquista popolarità da tutti i siti che utilizzano il database della "Open Directory".

E’ importante notare che se una pagina contiene dei link all’interno di codice javascript oppure all’interno di oggetti flash o applet java questi link sono completamente ignorati da alcuni motori di ricerca,  E’ quindi necessario limitare il più possibile questi casi e utilizzare sempre il tag standard Anchor tex

Anche questo campo dipende fortemente da come il resto del web vede la nostra pagina piuttosto che dalla composizione di essa. L' Anchor-Text è definito come la concatenazione di tutte le keyword usate da altre pagine per puntare alla nostra.

A fronte di una query utente il motore assegna una rilevanza molto alta alle pagine che vengono linkate con le keyword cercate.

Anche in questo caso valgono le considerazioni fatte al paragrafo precedente. Se dobbiamo inserire un link è sempre preferibile utilizzando il tag anchor text e limitare l’utilizzo di menù javascript o flash.

Se si vuole inserire una immagine cliccabile conviene utilizzare sempre il tag ALT all’interno dell’immagine, in modo da associare comunque un anchor text al link in questione.

In questo modo il browser testuale (che non riconosce le immagini) userà il contenuto del campo ALT al posto dell’immagine e quindi il testo verrà correttamente indicizzato.

2.1 HTML Title

I motori di ricerca assegnano un peso maggiore al testo contenuto nel tag title rispetto al testo contenuto nel body. Per questo motivo conviene usare sempre un titolo significativo contenente le keyword per cui si è interessati a comparire in alto nella ricerca. Anche in questo caso è controproducente tentare di barare assegnando un titolo lunghissimo contenente molte keyword: oltre al rischio di essere messi in black list i motori di ricerca prendono sempre accorgimenti per evitare questo genere di cose, ad esempio prendendo in considerazione solo i primi n termini (dove n è di solito dell'ordine della decina) o dando un peso al titolo inversamente proporzionale al numero di keyword presenti.

2.2 Body

Questo campo consiste nell'insieme delle parole contenute all'interno del corpo del documento ed è quello più influenzabile dal design vero e proprio della pagina.  Lo spider dei motori di ricerca è assimilabile ad un browser di vecchia generazione. Non supporta javascript, ne frames, ne cookies, non conosce oggetti flash e non riconosce nemmeno le immagini. Per questi motivi il testo catturato dallo spider a volte può essere molto diverso da quello che un essere umano riconosce visitando la o pagina. Gli accorgimenti fondamentali sono i seguenti

  1.       La pagina deve superare i test di un qualsiasi validatore. Un html non corretto (ad es. la mancata chiusura di un tag) in molti casi può confondere lo spider e far sì che questo non catturi alcun testo.
  2.      Usare sempre i tag NOFRAMES e NOSCRIPT in caso di pagine con frames e javascript (i frames sarebbe sempre meglio evitarli se non in caso di assoluta necessità). In questo modo si può inserire del testo che poi viene correttamente indicizzato
  3.      Non usare mai gif se queste contengono solo scritte e possono essere sostituite da testo puro. L'utilizzo delle gif al posto del testo fa sì che tutta l'informazione in esse contenuta non sia disponibile al motore di ricerca. Nei casi in cui sia assolutamente necessario usare la gif allora è fondamentale utilizzare l'attributo alt del tag img.

3.    Consigli per un buon posizionamento

Riassumendo ecco i nostri consigli:

1.      Cercare di avere link al proprio sito da altri siti “autorevoli”

2.      Segnalare il sito a directory come Open directory Project

3.    Creare un sito con una gerarchia chiara e link testuali (no javascript, flash). Ogni pagina deve essere raggiungibile da almeno un link testuale.

4.     Per ciascuna pagina, pensare alle keywords che l’utente userà per cercare quella pagina e assicurarsi che la pagina contenga effettivamente quelle keywords. Ricordare che se le keywords sono contenute in una immagine senza attributo ALT o in un oggetto flash queste non vengono viste dal motore di ricerca.

5.     Fare in modo che tutti i tag TITLE e ALT siano descrittivi e accurati

6.     Fare in modo che tutte le pagine passino il test di un validatore w3c (vedi http://validator.w3.org/) con il minor numero possibile di errori e che questi non siano errori gravi

7.    Fare in modo che i link presenti su una pagina siano meno di 100. (se sono di più è altamente probabile che la pagina venga considerata come spam)

8.    Usare sempre i tag NOSCRIPT e NOFRAMES in presenza di javascript e frames.

9.   Evitare in ogni modo di cercare di aumentare artificiosamente il proprio posizionamento (ad es. riempiendo la pagine di keywords irrilevanti ).  I motori di ricerca utilizzano meccanismi molto sofisticati per prevenire lo spam e se un sito finisce in blacklist è molto difficile poi venire “riabilitati”.

4.    Non hai ancora un sito personale?



Con Libero.it è facile! Prova a creare il tuo sito hai l'upload veloce dei tuoi files via web e ftp e tanti strumenti per personalizzarlo!



© Italiaonline S.p.A. 2024Direzione e coordinamento di Libero Acquisition S.á r.l.P. IVA 03970540963