Friends:
Amici:
Stories

103 103

Il mio biglietto da visita.




Creative Commons License
This work is licensed under a Creative Commons License.

Updated: 19-12-2005; 9:35:35.

Paolo's Weblog.

 Venerdì, 28 novembre 2003

Su gentile richiesta di X§, tento di spiegare la storia dei robots.txt "come ad un bambino di sei anni".

I motori di ricerca funzionano grazie a dei programmi specializzati che navigano in continuazione su tutta la rete saltando di link in link memorizzando tutto. Si chiamano "spider" (ragni) probabilmente perché si muovono rapidamente sul "web" (ragnatela).

Senza gli spider non ci sarebbero i motori di ricerca, però avere un programma automatico che ogni giorno legge tutto il tuo sito (che potenzialmente è composto da migliaia di pagine) può essere costoso in termini di consumo di banda e di risorse (soprattutto quando, come avviene spesso, quelle pagine non sono affatto cambiate).

Il file robots.txt è un file che i webmaster mettono sui server per evitare che i motori di ricerca leggano ed indicizzino pagine che non dovrebbero essere indicizzate (perché riservate o più semplicemente perché non ha senso farlo).

Facendo una ricerca su "personalità+confusa+papa", google propone tra i risultati il tuo sito, ma non è il primo (perché mai dovrebbe esserci prima blognews?) e comunque non si tratta dell'ultimo post (prova a premere sul link "Copia cache" e vedrai che si tratta di una vecchia pagina con una storia del papa precedente).

Fino a ieri su tutti i siti di Splinder c'era un file che diceva ai motori di ricerca che si presentavano di non indicizzare alcuna pagina. Oggi pare non ci sia più.

Adesso smetti di fare i capricci e vai a lavarti le mani.

 Giovedì, 27 novembre 2003

Mentre guardavo le analisi del traffico sul mio weblog ho provato a controllare chi sono i maggiori consumatori di banda. Sorpresa!

Il maggiore consumatore di banda di questo sito è Splinder!

Infatti c'è uno spider che si collega a queste pagine da un indirizzo IP riconducibile a Splinder che scarica questa mia pagina una volta ogni 10 minuti, 24 ore su 24. Non rispetta nessun flag del server che gli dice dice "Guarda che questa pagina non è cambiata negli ultimi 10 minuti", lui scarica comunque, quindi consuma effettivamente la mia banda. 5Mb di dowload nella sola giornata di ieri. Dall'inizio di novembre lo spider di Splinder mi ha ciucciato ben 143.0MB.

Ma la vera domanda è: perché? Non mi risulta ci sia alcuna utility su Splinder che si colleghi in qualche modo al mio sito e per cui ci sia bisogno di scaricare ogni 10 minuti la mia pagina. C'è un termine tecnico per definire un comportamento di questo tipo da parte del gestore di un servizio web: idiota.

PS: mi sono fatto anch'io il mio bel file robots.txt.

In questo post la redazione di Splinder sostiene che si è trattato di un errore, già corretto. In questo momento (ore 14:49), il file robots.txt di personalità confusa recita ancora:
User-agent: *
Disallow: /
Che significa: "nessuno spider legga nessuna pagina".

Non so se sia anche stata data una risposta a matteoc a proposito del blocco su >Skip Pop.

Il post dice anche:
Da parte di Splinder non c'e' nessuna volonta' di chiudere la piattaforma all'esterno.
A questo punto non posso che dirlo. Balle!

E' da un pezzo che Splinder ha scelto di chiudere la propria comunità (ad esempio, non essendo parte del loro gruppo se provo a postare un commento al loro post appena citato mi viene detto: "Scusa ma non ti è permesso lasciare commenti su questo blog").

Mi chiedo anche quanto verosimile sia la storia emersa su qualche weblog di una possibile cessione di Splinder. Anche se suona un po' "secolo scorso", non è del tutto impossibile che vi sia un piano del genere. In fondo stiamo parlando sempre di qualche migliaio di utenti attivi (a proposito dei 30.000 blog vedi paragrafo precedente).

In questo caso sembra che Splinder stia iniziando ad addestrare i propri utenti al livello di servizio di classe "TelecomWindVodafone".

Ma cosa succederebbe se adesso alcuni dei weblog più popolari di Splinder decidessero di traslocare?

Oggi ho scoperto per caso leggendo un commento su Manteblog che tutti i weblog su splinder sono configurati in modo da non essere indicizzati dai motori di ricerca. Il file robots.txt dice infatti ai motori di ricerca "Non leggere queste pagine, chiunque tu sia". Ad esempio potete vedere qua il file robots.txt di personalità confusa.

In effetti l'ultima copia del popolare weblog disponibile nella cache di google risale al 9 novembre (di solito gli spider di google aggiornano la cache quotidianamente).

In modo analogo, da qualche tempo i server di Splinder sono configurati in modo da rifiutare le connessioni provenienti da >skip pop.

Cosa significa questo? Beh, semplicemente che i "clienti" di Splinder stanno sparendo dalla rete. I siti continuano ad essere raggiungibili attraverso un browser, ma non attraverso i motori di ricerca o gli indici di popolarità.

Ma perché Splinder mette in pratica questo tipo di politica? Inutile chiedere a loro, tanto non rispondono mai. La spiegazione più plausibile è il consumo di banda che questi servizi richiedono.

Tanto per darvi un'idea, dall'inizio di questo mese il 6% della banda usata da questo weblog è stata assorbita da spider di motori di ricerca. Dev'essere tenuto in considerazione che questo è un sito relativamente popolare, nel senso che gli spider di google & c. sono solo una decina sui più di 15.000 visitatori che hanno scaricato pagine dal mio server.

Nel caso di un sito poco visitato (o magari un sito abbandonato, e credo che sui 30.000 di Splinder questi siano una maggioranza), va a finire che gli unici visitatori siano gli spider dei motori di ricerca, che scaricano ogni giorno centinaia di pagine che non cambiano mai con su scritto solo "Salve, sono qua!", arrivando così ad assorbire parti importanti della banda a disposizione.

Splinder offre un servizio gratuito, quindi immagino che chi ha un sito ospitato sui loro server abbia ben poco di cui lamentarsi. Però non credo che sia stato mandato un messaggio a tutti dicendo "hei ragazzi, vi facciamo sparire dai motori di ricerca, contenti?", né mi risulta sia stata offerta un'alternativa (ad esempio una che includesse lo scambio si una modica quantutà di denaro).

Quello che sta facendo Splinder è legittimo. Il modo in cui lo fanno è pessimo.

PS: visto che anche la mia azienda offre un sistema di blogging a pagamento, qualcuno può probabilmente considerare splinder un mio concorrente. Io non credo sia così, comunque ci sono molti altri strumenti di blogging, gratuiti e non, li trovate qua.

 Mercoledì, 26 novembre 2003

Abbiamo appena incrementato di 10 volte la disponibilità di banda sui nostri server in web farm. Il download di questa pagina (e di tutte quelle dei nostri clienti) dovrebbe essere significativamente più veloce. :-)

 Lunedì, 24 novembre 2003

Interessante articolo di Luciano Giustini a proposito di k-logs. Ci saranno interessanti notizie sull'argomento anche da queste parti nei prossimi giorni.

PS: L'articolo non c'è più perché verrà pubblicato su Internet News a dicembre.


Pare che anche Giuseppe Granieri si sia beccato un infezione ai commenti. Consiglio di mangiare molto aglio e bere molta acqua. Se non funziona non rimane che la crioterapia per estirpare il troll.

 Mercoledì, 19 novembre 2003

Ho la sensazione che gli americani (e gli inglesi, i tedeschi ed altri "barbari") siano "popoli guerrieri", gente che non teme lo scontro e che vede nella guerra la prima soluzione per risolvere i conflitti. Non è che non capiscano il valore della pace, ma per loro quella diplomatica è una seconda scelta.

Forse perché siamo stati guerrieri e conquistatori prima di tutti gli altri, forse perché ne abbiamo avuto abbastanza, forse perché siamo ladri e mercanti, noi italiani siamo un popolo diplomatico. Per noi la mediazione è sempre la prima scelta (forse perche' la diplomazia l'abbiamo perfezionata noi nei secoli, come racconta la storia*) forse è per questo che noi, quando mandiamo i nostri militari nel mezzo di una guerra e poi ci sparano... noi ci rimaniamo male.

* Questo post è tratto da uno scambio in ICQ con Giuseppe. La frase in corsivo l'ha inserita lui mentre scrivevo. Visto che ci stava perfettamente, l'ho lasciata.

 Sabato, 15 novembre 2003

Dopo quanto scritto da Massimo e da Beppe a proposito del pezzo di Marcello mi è rimasto ben poco da aggiungere.

Quello che voglio sottolineare è che non credo sia una questione di click.

E' vero che i weblog sono una nuova forma di comunicazione, ma sebbene si basino su un processo di pubblicazione non peno che debbano essere paragonati ai siti internet tradizionali e quindi misurati con il metro dei click.

Dire che i weblog sono poco significativi perché raggiungono solo un numero limitato di lettori è come dire che la posta elettronica è poco importante perché la gran parte della gente la usa per corrispondere con poche decine di persone.

In teoria con il mio programma di posta elettronica potrei raggiungere qualunque utente internet della terra, ma non lo posso fare non solo perché non dispongo di tutti gli indirizzi ma soprattutto perché probabilmente non saprei cosa dire a tutta 'sta gente e a questi non interessa niente conoscere le mie opinioni.

Con il mio weblog è diverso. Scrivo e quello che scrivo rimane a disposizione di tutti quelli che prima o dopo lo vorranno leggere.

Dall'analisi di Marcello manca un dato significativo: i visitatori casuali provenienti dai motori di ricerca. Stando alle mie statistiche, nella sola giornata di ieri 63 persone sono arrivate su queste pagine da Google. Questo succede ogni giorno, esattamente come sarà capitato anche a voi decine di volte di usare Google per trovare un'informazione e trovarvi a leggere quanto scritto da una persona che potrebbe abitare nella vostra città o dall'altra parte del mondo sul proprio weblog.

I weblog sono probabilmente la prima significativa nuova tecnologia del d.G. (dopo Google).

I weblog sono importanti perché funzionano attraverso dei piccoli parchi di lettori ed iscritti, ma soprattutto funzionano perché i contenuti dei weblog diventano a tutti gli effetti parte del web, e la grande colla del web oggi si chiama Google. Se quello che avete scritto potrà servire a qualcuno, questo qualcuno vi raggiungerà da Google.

La sfida non è quindi quella di ottenere visibilità, quello è un vecchio problema di cui si dovrebbero preoccupare solo quei quattro vecchietti che sono rimasti a vendere banner sui propri portali.

La sfida di oggi è contribuire con le proprie idee in uno spazio aperto e libero in cui chiunque le potrà scoprire oggi, domani o forse mai.

 Giovedì, 13 novembre 2003

Mi segnalano che il sito di CNNitalia è chiuso.

Un nuovo servizio offerto da Feedster: The Feedster Builder.

Conoscendo Scott Johnson sono sicuro che è il modo migliore per ottenere il vostro feed RSS di qualità se il vostro weblog è ospitato da qualcuno che non offre ancora questo servizio.

Oltre a creare il feed per il vostro sito, Feedster si preoccuperà anche di inviare un ping a Weblogs.com ad ogni vostro aggiornamento (anche se non sapete cosa questo significhi credetemi: è importante ;-).

 Martedì, 11 novembre 2003

Come per gli accenti sui nomi di città mediorientali o la pronuncia dei nomi di politici e sportivi stranieri, anche nel settore del terrorismo la stampa italiana non è in grado di trovare una linea comune. Sono "anarco-insurrezionalisti" o "anarchico-insurrezionalisti"?

 Giovedì, 6 novembre 2003

Lorenza Boninu: "... se mai ce ne furono. Bene, questo e' un post scritto per puro e semplice spirito di vendetta. Un post che sfrutta questa semplice considerazione: grazie al blog, anch'io ho il mio spazio pubblico in Rete, anch'io ho miei lettori, anch'io posso farmi sentire. Certo, non ho l'audience di un media tradizionale. Ma chi puo' dire cosa accadra'? Sono un nodo in una rete e, chissa', magari la mia voce, propagandosi per vie impensate in questo intreccio di relazioni virtuali, puo' risultare amplificata piu' di quanto si creda. Bando alle ciance e passiamo ai fatti" [continua...]

E' senz'altro vero che un weblog ha meno lettori al giorno di un quotidiano, anche se di provincia. Però un weblog è molto più google-friendly di quasi tutti i quotidiani italiani che, se pubblicano in Internet, cercano stupidamente in ogni modo di prevenire l'indicizzazione dei propri contenuti.

Chi in futuro cercherà informazioni sull'argomento troverà questo post di Lorenza, non l'articolo sul quotidiano. Così si imparano!

 Martedì, 4 novembre 2003

La vignetta di Non Sequitur di oggi ricorda certe campagne del nostro governo per stimolare l'economia.

Massimo DotComa Moruzzi mi segnala gentilmente che lui questa pagina con MS Exploder la vede così. Io la vedo bene. Voi? Grazie.

Questa storia del decreto spalma-debiti-salva-calcio è l'ennesima barzelletta italiana, una di quelle che sarebbe da ridere se non ci fosse da piangere.

Ammetto di non essere minimamente interessato al calcio, ma essendo interessato da anni alla gestione di imprese trovo assolutamente scandalosa questa situazione. Se hai un'azienda vivi in un ambiente che ha una semplice regola: se alla fine dell'anno sei in perdita o trovi i soldi per ripianare la perdita o porti i libri in tribunale (cioè chiudi).

Dare la possibilità ad un piccolo numero d'aziende, alcune delle quali quotate in borsa, quindi aziende vere e proprie e non associazioni bocciofile, di prendere la perdita e distribuirla su 10 anni è una totale assurdità contabile. Ma pare che nessuno se ne meravigli in modo particolare, anzi, sento da più parti dire che è una legge quasi dovuta per salvare l'istituzione del calcio italiano.

Ma cos'ha di particolare il calcio italiano?

Alcuni dicono sia una grande industria. Può anche essere, ma perché mantenere un'industria in perdita? I debiti di una qualunque industria se non pagati si distribuiscono sull'intera società. Come in fisica anche in economia nulla si crea e nulla si distrugge: se i soldi non escono dalle tasche dei proprietari delle squadre da qualche altra parte devono uscire (indovinate un po'...)

Altri dicono che le squadre italiane sono schiacciate dalle troppe tasse. Ma se queste aziende sono in perdita non pagano di certo tasse sui redditi, quindi sono schiacciate da cosa? L'IRAP?

E' importante per l'economia? Non credo. Tutti ci dicono che il vero problema sono gli stipendi dei calciatori. Non è la Fiat che mantiene migliaia di famiglie, se decidessimo di chiudere "l'industria" del calcio manderemmo a casa qualche centinaio di dirigenti ed atleti strapagati che probabilmente non dovrebbero neanche preoccuparsi di trovare un altro lavoro.

Credo sia tutto molto più complicato: il calcio è potere. E' uno strumento per creare consenso, per distribuire potere, per affermarsi. E in questo momento in questo paese, più ci si avvicina alla cima dell'Olimpo politico, più la vita diventa facile, spesso attraverso leggi fatte ad hoc.

Ma siamo in Europa. Le squadre degli altri paesi europei si chiedono perché mai loro le perdite le debbano coprire mentre le squadre italiane, con cui si confrontano sui campi da gioco, non lo debbano fare se non in 10 anni. Di consegnenza un commissario europeo tenta di bloccare questo colossale inganno.

Speriamo bene, e auguri a tutti.

 Domenica, 2 novembre 2003

Molti sono già piuttosto contenti della realtà dei weblog di oggi. Si sente spesso nell'aria un atteggiamento che urla:
In fondo prima non si poteva fare, adesso si può, perché incasinarci ulteriormente la vita? Anzi, ci sono già oggi alcune menate tecnologiche di cui certi parlano che a me sembrano troppo difficili da capire... che volete da noi?
Io penso che si tratti di un primo passo non di uno ma di molti possibili percorsi: siamo solo all'inizio.

La settimana scorsa ho scritto un po' di commenti, mail-list e trackback. Giuseppe ha ipotizzato una sorta di registro degli autori che consenta di tener traccia di cosa viene scritto in giro. Sono i primi sintomi dell'evoluzione di questa realtà.

Cerchiamo di guardare un po' oltre per capire cosa ci potrebbe offire la teconogia in un futuro neanche troppo lontano.

Oggi i weblog rappresentano la nostra presenza in rete. Per alcuni si tratta di raccontare il proprio lavoro ed i propri punti di vista, per altri di raccontare la propria vita, per altri ancora di commentare l'attualità. Certi lo fanno usando il proprio nome, altri usando un nickname, un avatar che consente loro di proteggere la propria identità reale.

In tutti questi casi si tratta di una nuova forma di comunicazione che consente di stabilire relazioni. Relazioni che vengono esplicitate attraverso i blogroll (metto i link di quelli che leggo sul mio sito) e conversazioni fatte di botta e risposta tra post, commenti e trackback.

Ma guardando un da una distanza un po' maggiore questa realtà, la vera novità mi sembra sia il fatto che migliaia di persone stiano usando un nuovo tipo di software per svolgere delle attività che prima non svolgevano. Pur dovendo restare il più semplici possibile da usare, l'evoluzione di queste applicazioni porterà a nuove ed entusiasmanti soluzioni.

Si parlava di relazioni. Alcuni stanno cercando di rappresentare questi sistemi di relazioni usando teconologie come FOAF (Friend Of A Friend) e offrendo servizi che consentono di amministrare le proprie relazioni on-line. Il mio amico Marc Canter, per esempio, lavora su PeopleAggregator, un servizio che consentirà di amministrare le proprie relazioni in rete in funzione della propria presenza.

Una nuova classe di programmi, il social software, aiuterà le persone a lavorare e comunicare meglio in un ambiente aperto. La vera novità risede nel fatto che mentre fino ad oggi si è lavorato soprattutto per creare programmi che servivano a comunicare con persone che conoscevamo già o che comunque appartenevano al nostro ambiente, con il social software si lavora per espandere queste conoscenze, per incontrare persone che ci interessano e che non avremmo avuto modo di conoscere in altri modi. Se siete frequentatori di weblog non avrete difficoltà a fare una lista di almeno dieci persone che oggi seguite quotidianamente e che avete conosciuto negli ultimi sei mesi.

Quello che dovrebbe succedere è una fusione tra questi diversi tipi di applicazione. Non vedremo più il nostro weblog come un semplice strumento per la pubblicazione ma come una vera e propria rappresentazione della nostra identità in rete, anzi, come una delle rappresentazioni della nostra identità. Infatti ognuno di noi vorrà apparire e relazionarsi con diversi gruppi adottando eventualmente diverse identità: cosa comunico e come lo faccio con miei colleghi sarà spesso diverso dal farlo con i miei amici, con la mia famiglia o nei confronti del pubblico in generale. Si tratterà di identità potenzialmente permeabili, dove i contenuti potranno passare da una parte all'altra, ma volendo potranno anche essere completamente separate.

E' difficile dire oggi se tutto questo potrà essere fatto con un'unica applicazione o mediante la fusione di programmi e servizi diversi che comunicheranno tra loro attraverso standard aperti. A meno che grossi player monopolistici non decidano di entrare in forze in questa realtà (e a dire il vero alcuni segnali ci sono), è probabile che sarà la seconda ipotesi a verificarsi o magari un mix delle due.

Qualunque cosa succeda penso che possiate rassegnarvi al fatto che la "blogosfera" così come la conosciamo oggi è destinata ad una rapida evoluzione: un giorno potrete dire ai vostri nipotini "io c'ero".

Mi capita spesso di ricevere spam o di trovare in giro pubblicità di aziende che offrono servizi di registrazione nei motori di ricerca (in questo momento c'è la pubblicità di una di queste tra i banner di google qua a destra). Quando ho tempo provo a fare su google una ricerca su "registrazione nei motori di ricerca" o qualcosa di simile. Fino ad ora non mi è mai capitato di trovare nella prima pagina dei risultati chi mi voleva vendere il servizio.

15 15 15
Paolo Valdemarin: 2005