Il post precedente mescola dettagli tecnici con pensieri e riflessioni sulla decentralizzazione dei dati, e su alcuni principi del Web che si dimenticano spesso, o che si sottovalutano.

Ho messo insieme molte cose, è vero, ma sto provando a focalizzare meglio alcuni temi da riprendere spesso, per capirli davvero profondamente in quello che ci dicono e ci mostrano.

Il fattore chiave della vicenda è quello di riuscire a svincolare la mente dai paletti e dai pregiudizi che abbiamo del Web e degli strumenti che ci mette a disposizione, e provare a fare un salto di qualità.

Mi viene in mente un riferimento di uno dei libri recenti che ho letto, “Architettura dell’informazione“ di Luca Rosati, dove alla fine c’è un capitoletto sul Wayfinding, scritto da Andrea Resmini, dove si spiega che il Web ha delle regole di navigazione diverse da quelle che applichiamo nella realtà, e quindi in un certo senso molto più flessibili a modo loro.

Viene usata la metafora di Matrix e di quel mondo virtuale parallelo al reale, dotato di regole simili a quelle nelle quali viviamo, ma che possono essere infrante. O dilatate. O estese.

Avvicinarsi al Semantic Web e al Linked Data, nel ripensare il ruolo che hanno i siti, e il modo in cui vengono progettati, e navigati, significa sempre più affrontare la medesima sfida.

Occorre rimettere in gioco quanto piu’ possibile di quello che riteniamo valido.

Infrangere certe regole e certe prassi, metodi anche complessi di programmazione del sito con il suo bel database alle spalle, per ritornare alla base, alla fonte, alla semplicità di quello che era e che è il Web come spazio universale di informazione, nei suoi paletti fondamentali.

Così come il social web è una forma matura di utilizzo sociale di queste tecnologie, adesso a livello tecnologico ci si avvicina, semplificando, ad un nuovo modello di programmazione dei siti, diverso e forse più semplice del modo normale di creare applicazioni desktop.

E’ cambiato il guscio, e il contesto, e forse è il caso di ripensare un po’ tutto il giro.

Un primo post in inglese su questa direzione, che sto intraprendendo sempre più:
-> Re-thinking the Web from URIs and URLs - step1

Partiamo quindi dalla ripresa di uno dei tool che si possono considerare sul confine tra i due mondi, un paio di strumenti più usabili e più chiari per l’utente avvezzo alle tecnologie del Web, rispetto a molte altre cose che si sentono sul Semantic Web e sul Linked Data.
Un tool sul quale smanetto spesso.

Un po’ di spunti su SIMILE Exhibit e sulla sua versione in backend, The Exhibition, in fase di completamento.
Tra l’altro, la parte server e che aggrega i twit di SMOB, usano proprio SIMILE Exhibit.

Quindi mi sembrava doverosa una premessa di stile e di pratica, prima di completare il testing sul prototipo di twitter decentralizzato in forma semantica.

Un po’ di materiale su SIMILE Exhibit

Si chiama SIMILE Exhibit.
Un ambiente potente e semplice allo stesso tempo, per provare il nuovo Web, piu’ evoluto e potenzialmente sempre piu’ potente e versatile, senza troppe complessita’ o cose strane.
Ne avevo parlato ancora nel 2006!!
-> Il web strutturato cresce…

E’ eccezionale.
E pure abbastanza indolore.

Ecco il testo quasi completo di una mail arrivata il 25 maggio 2008, nella mailing-list del gruppo SIMILE.

Ritengo che sia fondamentale per capire quanto questo gruppo stia facendo da ponte e traghettatore nell’avvicinarci tutti quanti nel Web prossimo venturo.

E’ oltre un anno che uso in vari casi e in varie modalità, a braccio, questo ambiente: adesso sto cercando di documentare un po’ tutto questo, visto che in italiano c’è ancora poco. E di comunicare al meglio delle mie possibilità il messaggio insito nell’usare queste cose.
Soprattutto il principio sotteso, il KISS: Keep It Simple Stupid :)

Abbiamo bisogno di semplicità, ove possibile.

Exhibit has been built to ease the process of publishing (structured) data to the Web. The immediate benefit to exhibit authors is, of course, that there’s no need to learn database technologies, set up web servers, design browsing interfaces, and build full 3-tier web applications that work across several browsers.

This benefit in itself is already worthwhile.

However, there is a secondary, long-term benefit, not to exhibit authors but to potentially everyone.

The data published through Exhibit is readily machine-processible.
This means that search engines (like Google) can take advantage of this data and provide better Web-wide search interfaces beyond simple keyword text search (e.g., “Which Republican presidents came into office after the age of 50 and had served in the XYZ war?”).
To this end, I have made a quick attempt at crawling the (publicly accessible) exhibits and showing their data in a Backstage installation.

Some statistics:

  • < 1.5 years of data after Exhibit 1.0 launch in December 2006

  • 2,800+ exhibits (publicly accessible and already in Google’s or Yahoo’s index)

  • 800+ item types
  • 5,800+ properties
  • 136,000+ items
    There are a lot of duplicates because I have not made an earnest effort in resolving them.

Much more can be done to improve “The Exhibition”. The lens templates in the original exhibits can be extracted so that items in the Exhibition can be shown in their original lenses. Also, the settings for map views and timeline views in the original exhibits can be extracted, so that maps and timelines can be constructed automatically in the Exhibition.
Faceted browsing can also be offered automatically on search results.

Recently, there have been many efforts in scraping (structured) data out of the Web and the Deep Web, so that in the future, the Web can be accessed like a single giant database, yielding more precise search results to complex queries (e.g., “Who were the Republican presidents who came into office after the age of 60 and had served in the XYZ war?”). However, these scraping efforts target only on large web sites (e.g., Wikipedia).

But these large web sites do not represent the whole Web there are a huge number of smaller web sites that, when accumulated, can rival the amount of data in the large web sites.

Exhibit and The Exhibition together are an effort to give these smaller web sites, and their authors, representation on the future “Data Web”, ensuring diversity beyond mainstream information found in large commercial and institutional web sites.

I concetti chiave sono, a mio avviso:

  • c’e’ la versione a lato client, leggera e che riesce a gestire circa 200, 300 elementi senza difficolta’, che e’ SIMILE Exhibit
  • c’e’ la versione in backend, capace di gestire poi la scalabilita’ di un grosso numero di elementi, che si chiama The Exhibition, che e’ in fase di scrittura e di testing, non e’ chiaro quando verra’ rilasciata pero’
  • e’ un modo di tornare a ripensare in forma semplice dal lato programmazione una pagina Web, e nello stesso tempo, ci si avvicina al Web of Data in un modo direi indolore e tranquillo
  • si riesce a dare uno strumento flessibile alla coda lunga dei siti, a tutti quegli autori che non e’ detto si appoggino a CMS complessi e maturi, in grado poi di integrare il Semantic Web nelle loro pagine. Sappiamo poi che questi autori sono la grande maggioranza di noi, no? Siamo la coda lunga del Web, e’ importante venire considerati fin da subito in questo cammino
  • e’ una tecnologia che abilita il mashup dei dati che mettiamo online, in forma decentrata e libera da tecnologie proprietarie, ma su questo faro’ un post dedicato. E’ importante capire che questo tool e’ scalabile anche per queste cose, e ci risolve molti problemi. E in parte puo’ essere scomodo per qualcuno. e’ una *innovazione distruttiva: quando arriva alla gente certi prodotti e certe cose che usiamo oggi ne escono meno competitive, e’ quindi una tecnologia distruttiva se vogliamo

Mostro al volo qualche esempio poco strutturato, presente in labs.dagoneye.it e che nei prossimi tempi sistemo e documento meglio, visto che adesso e’ tutto buttato la’:

Teniamo conto che anche IBM ne sta parlando, un po’ in ritardo:
-> Real Web 2.0: Practical linked, open data with Exhibit
Considerando il fatto che io ne ho accennato ancora nel 2006, come ho gia’ detto poco sopra…
-> Il web strutturato cresce…

Per vedere ed inquadrare meglio tutte le volte che ne ho parlato nel blog, meglio usare il tag locale exhibit:
-> Posts del blog taggati exhibit

Ultima nota a margine: se si cerca “simile exhibit” con google.it, il terzo link e’ la mia presentazione del tool fatta all’Opencamp 2007:
-> Semantic Web, Simile Exhibit e spunti semi- strutturati

Non male per facilitare la trovabilita’, no? :)
( stesso risultato usando yahoo, forte… )