Friends:
Amici:
Stories


103 103
Archivio:
November 2003
Sun Mon Tue Wed Thu Fri Sat
            1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30            
Oct   Dec



Il mio biglietto da visita.





Click here to send an email to the editor of this weblog.

Technorati Profile


Google
Web
val.demar.in



Creative Commons License
This work is licensed under a Creative Commons License.

Updated: 19-12-2005; 9:35:27.

 Giovedì, 27 novembre 2003

Mentre guardavo le analisi del traffico sul mio weblog ho provato a controllare chi sono i maggiori consumatori di banda. Sorpresa!

Il maggiore consumatore di banda di questo sito è Splinder!

Infatti c'è uno spider che si collega a queste pagine da un indirizzo IP riconducibile a Splinder che scarica questa mia pagina una volta ogni 10 minuti, 24 ore su 24. Non rispetta nessun flag del server che gli dice dice "Guarda che questa pagina non è cambiata negli ultimi 10 minuti", lui scarica comunque, quindi consuma effettivamente la mia banda. 5Mb di dowload nella sola giornata di ieri. Dall'inizio di novembre lo spider di Splinder mi ha ciucciato ben 143.0MB.

Ma la vera domanda è: perché? Non mi risulta ci sia alcuna utility su Splinder che si colleghi in qualche modo al mio sito e per cui ci sia bisogno di scaricare ogni 10 minuti la mia pagina. C'è un termine tecnico per definire un comportamento di questo tipo da parte del gestore di un servizio web: idiota.

PS: mi sono fatto anch'io il mio bel file robots.txt.

In questo post la redazione di Splinder sostiene che si è trattato di un errore, già corretto. In questo momento (ore 14:49), il file robots.txt di personalità confusa recita ancora:
User-agent: *
Disallow: /
Che significa: "nessuno spider legga nessuna pagina".

Non so se sia anche stata data una risposta a matteoc a proposito del blocco su >Skip Pop.

Il post dice anche:
Da parte di Splinder non c'e' nessuna volonta' di chiudere la piattaforma all'esterno.
A questo punto non posso che dirlo. Balle!

E' da un pezzo che Splinder ha scelto di chiudere la propria comunità (ad esempio, non essendo parte del loro gruppo se provo a postare un commento al loro post appena citato mi viene detto: "Scusa ma non ti è permesso lasciare commenti su questo blog").

Mi chiedo anche quanto verosimile sia la storia emersa su qualche weblog di una possibile cessione di Splinder. Anche se suona un po' "secolo scorso", non è del tutto impossibile che vi sia un piano del genere. In fondo stiamo parlando sempre di qualche migliaio di utenti attivi (a proposito dei 30.000 blog vedi paragrafo precedente).

In questo caso sembra che Splinder stia iniziando ad addestrare i propri utenti al livello di servizio di classe "TelecomWindVodafone".

Ma cosa succederebbe se adesso alcuni dei weblog più popolari di Splinder decidessero di traslocare?

Oggi ho scoperto per caso leggendo un commento su Manteblog che tutti i weblog su splinder sono configurati in modo da non essere indicizzati dai motori di ricerca. Il file robots.txt dice infatti ai motori di ricerca "Non leggere queste pagine, chiunque tu sia". Ad esempio potete vedere qua il file robots.txt di personalità confusa.

In effetti l'ultima copia del popolare weblog disponibile nella cache di google risale al 9 novembre (di solito gli spider di google aggiornano la cache quotidianamente).

In modo analogo, da qualche tempo i server di Splinder sono configurati in modo da rifiutare le connessioni provenienti da >skip pop.

Cosa significa questo? Beh, semplicemente che i "clienti" di Splinder stanno sparendo dalla rete. I siti continuano ad essere raggiungibili attraverso un browser, ma non attraverso i motori di ricerca o gli indici di popolarità.

Ma perché Splinder mette in pratica questo tipo di politica? Inutile chiedere a loro, tanto non rispondono mai. La spiegazione più plausibile è il consumo di banda che questi servizi richiedono.

Tanto per darvi un'idea, dall'inizio di questo mese il 6% della banda usata da questo weblog è stata assorbita da spider di motori di ricerca. Dev'essere tenuto in considerazione che questo è un sito relativamente popolare, nel senso che gli spider di google & c. sono solo una decina sui più di 15.000 visitatori che hanno scaricato pagine dal mio server.

Nel caso di un sito poco visitato (o magari un sito abbandonato, e credo che sui 30.000 di Splinder questi siano una maggioranza), va a finire che gli unici visitatori siano gli spider dei motori di ricerca, che scaricano ogni giorno centinaia di pagine che non cambiano mai con su scritto solo "Salve, sono qua!", arrivando così ad assorbire parti importanti della banda a disposizione.

Splinder offre un servizio gratuito, quindi immagino che chi ha un sito ospitato sui loro server abbia ben poco di cui lamentarsi. Però non credo che sia stato mandato un messaggio a tutti dicendo "hei ragazzi, vi facciamo sparire dai motori di ricerca, contenti?", né mi risulta sia stata offerta un'alternativa (ad esempio una che includesse lo scambio si una modica quantutà di denaro).

Quello che sta facendo Splinder è legittimo. Il modo in cui lo fanno è pessimo.

PS: visto che anche la mia azienda offre un sistema di blogging a pagamento, qualcuno può probabilmente considerare splinder un mio concorrente. Io non credo sia così, comunque ci sono molti altri strumenti di blogging, gratuiti e non, li trovate qua.

15 15 15
© Copyright 2005 Paolo Valdemarin.