|
APPROFONDIMENTI
PRODOTTI
Hardware
Software
Reti
ADSL
Normative
Sicurezza
SERVIZI
Hosting/Housing
Registrazione Domini
Web Design
Motori di Ricerca
|
 |
AREA
TECNICA - MOTORI
DI RICERCA
Tecniche
di puntamento
I motori di ricerca rimangono il
principale strumento di ricerca su Internet: la posizione raggiunta
nelle classifiche di ogni singolo motore deve quindi essere una
delle principali preoccupazioni di webmaster e proprietari di
siti.
Per comparire nei motori di ricerca in una buona posizione
(visibilità) il vero lavoro da curare, quello che permetterà di
acquisire il maggior numero di riferimenti, è prima
dell'inserimento, nella realizzazione stessa della pagina Web.
Gli
spider (o robots) dei motori vanno innanzitutto alla ricerca delle
parole chiave (keywords) e delle frasi chiave (keyword phrases)
all'interno di tutta la pagina. Esse saranno valutate da ogni motore
di ricerca in maniera differente, in base alla posizione, la densità
e la coerenza. L'autore di un sito, quindi dovrà effettuare una
scelta iniziale molto accurata di alcune parole chiave che
descrivano il sito nel miglior modo; queste parole dovranno essere
inserite, senza eccedere, in molti luoghi della pagina
differenziando i punti e i metodi con cui farle comparire. Tra i
campi in cui dovrebbero essere presenti merita ricordare:
-
la
URL (ossia il nome a dominio)
-
il
tag TITLE (il nome che comparirà nella barra del
browser)
-
i
meta tag Description e Keywords (max 50-60 parole)
-
il
contenuto della pagina (nel tag Body)
-
i
tag ALT (la descrizione testuale delle immagini)
-
gli
Headers (tag da H1 a H4)
È
bene utilizzare sia parole sia brevi frasi.
Questo
metodo tradizionale da solo, se ben progettato, porta a dei buoni
risultati. In aggiunta è possibile tentare tutta una serie di
"trucchetti" sviluppati per ingannare gli spider. Si
tratta di strategie da utilizzare con una certa attenzione dato che
i motori di ricerca cercano di evitare metodi di promozione troppo
aggressivi fino a ricorrere all'eliminazione del sito dalle loro
liste. Queste strategie sono dette tecniche di spamming.
Queste tecniche sfruttano i criteri dei motori per indicizzare i
siti e vengono utilizzate allo scopo di salire di posizione nei
risultati di una ricerca.
Una delle tecniche più diffuse era ad esempio l’uso di porzioni di testo
dello stesso colore dello sfondo della pagina, quindi non visibile ai
visitatori, sapendo che i motori davano alte valutazioni se una parola era ripetuta
molte volte nella pagina (keyword frequency).
Ormai i siti contenenti porzioni di testo non visibile vengono addirittura esclusi dall’indicizzazione.
Le principali tecniche considerate spamming sono:
-
Refresh tags
(Meta tags che indirizzano automaticamente ad un’altra pagina)
-
Testo invisibile o
in caratteri minuscoli
-
Simboli di interpunzione nel titolo
-
Keywords
ripetute
-
Pagine identiche o
quasi
-
Doorways
(o doorpages)
Doorways
Le doorways
sono pagine ottimizzate per piazzare su uno specifico motore da una a non più di tre keywords
di un sito. Non sono accessibili dal resto del sito e di solito non
sono che delle pagine bianche con del testo senza formattazione ed un link per accedere al resto del sito.
Sono uno strumento utilizzato dai webmasters soprattutto quando un
sito contiene pagine dinamiche, frames, animazioni in Flash, ed altri
elementi che possono complicarne il posizionamento. La loro reputazione è calata molto nei criteri di indicizzazione dei motori a causa dell’uso
eccessivo fatto di recente, abbinato ai refresh, al testo invisibile,
all'eccessiva ripetizione delle keywords e del testo delle altre pagine del sito.
Restano quindi uno strumento utile solo se non sono progettate con l’intenzione di
trarre in inganno il motore di ricerca.
Frames
I motori di ricerca non penalizzano per principio i siti costruiti con dei frames,
ma hanno delle effettive difficoltà nella loro indicizzazione. I frames
nascevano come tecnica per agevolare la navigazione all’interno di un
sito: mantenendo fissa una porzione di pagina (generalmente quella
con il menù di navigazione), nella restante porzione di schermo
vengono caricate tutte le sottopagine con i contenuti del sito. Tuttavia,
il contenuto del sito è difficilmente stampabile ed i browser più
vecchi (ad esempio quelli grafici di prima e seconda generazione) possono non
visualizzarli.
Le difficoltà con i motori di ricerca stanno nel fatto che quando i loro spider partono alla ricerca di testo,
normalmente in un frameset ne trovano molto poco, ottenendo quindi pochi elementi per valutare il sito.
Spesso incontrano nel tag <NOFRAME> scritte del tipo: “La pagina corrente utilizza i frame. Questa caratteristica non è supportata dal browser in uso”,
scritte che spesso finiscono nella descrizione del sito nei risultati della ricerca forniti dal
motore e scoraggiano lo spider a proseguire la navigazione.
Rimuovete tranquillamente quella frase.
In altri casi può capitare che venga indicizzata solo una pagina del frame cosicché l’utente che accede al
sito non riesce a navigarvi perchè non ne ha la visione completa.
Meglio allora aggiungere un link alla home page in ogni pagina per evitare che il visitatore capiti in una cosiddetta pagina orfana,
o un Javascript che forzi le pagine ad essere caricate esclusivamente dentro un frame.
fate uso di doorways e create una Mappa del Sito, e magari una versione parallela del sito senza frames.
Ma il consiglio più ovvio è ovviamente quello di non costruire il sito con dei frames.
Pagine dinamiche in PHP, ASP, XML, CGI
Le pagine dinamiche sono utilizzate per gestire siti con dimensioni
di portali e siti di e-commerce che, dato l'alto numero di pagine, non possono essere realizzati in HTML.
Esse vengono generate in tempo reale attingendo il loro contenuto da un database.
Solo di recente alcuni motori (in testa Altavista, Google, Inktomi e Fast) hanno iniziato ad indicizzare
questo tipo di siti, ma la gran parte dei loro concorrenti non è ancora
in grado di farlo.
Il principale pericolo per lo spider che analizza pagine generate dinamicamente
è quello di restare intrappolato in un numero quasi infinito di pagine da
indicizzare: lo spider potrebbe dover analizzare centinaia di pagine vuote, prima di arrivare
all'ultimo dato inserito.
Un altro problema per i motori sono i caratteri "?" e "&"
delle URL delle pagine dinamiche: spesso il motore non riesce a completare la lettura della URL.
Come nel caso dei frames, vi consigliamo innanzitutto di non fare uso
soltanto di pagine dinamiche, ma provate ad aggiungere anche una sezione di pagine
statiche.
Altrimenti utilizzate parti comuni di codice HTML nelle vostre
pagine dinamiche: oltre ad elementari script CGI (ad es. footer.pl, o headfoot.pl),
è possibile inserire parti di una pagina (ad esempio il menu, o il fondo pagina, o una sezione
interna) prelevando il codice HTML da file di testo esterni grazie
al comando <INCLUDE> sia in ASP che in PHP.
Altri elementi
I motori di ricerca, oltre a frames e pagine dinamiche hanno difficoltà anche in presenza di altri elementi:
-
Testo grafico
(in questo caso utilizzate il tag ALT, cioè la descrizione
testuale utilizzata al posto delle immagini nei browser non
grafici)
-
Pagine protette
da registrazione, password o cookies (in questo caso concentrate
la vostra attenzione su altre pagine)
-
Applet Java e Javascripts
(se possibile caricateli da un file .js esterno: molti robots lo
vedono come parte della pagina dandogli spesso più rilievo del
contenuto stesso)
-
Files di Acrobat
(Google attualmente è l'unico motore a leggere il formato PDF, fornendo
anche una versione HTML)
-
Files multimediali (Flash,
Shockwave, video streaming…)
Nel caso particolare di un sito interamente realizzato in Flash, il consiglio è
di creare almeno una pagina iniziale detta splash page, in
semplice codice HTML, da cui far partire il sito vero e proprio in
Flash: questa sarà l'unica pagina indicizzabile, anche se con
dei limiti.
Se possibile, affiancate al sito in Flash una versione in HTML (nello splash
sarà possibile scegliere quale versione visitare) e concentrate il puntamento su questa, rinforzando il
tutto con delle doorways. In ogni caso Macromedia offre un tool
denominato Macromedia Flash Accessibility Kit che permette di inserire in un tag <ALT> dentro un tag <NOSCRIPT>
una versione solo-testo delle informazioni del file .swf, rendendolo
così simile ad un'immagine.
|