Per prendere appunti visto che non ero presente all’evento, ho pubblicato uno storify della sessione mattutina, aggiungendo dei link all’inizio di riflessione su alcune domande aggiuntive, che si trovano dopo la sintesi, un po’ alla rinfusa, ma utili per porre sul piatto questioni collegate.
Sarà un’interessante discussione e confronto, dove portare esperienze ed idee, soprattutto sulla dimensione della percezione presente anche sul mondo Linked Data e di cosa ci sia bisogno, visto che sto preparando il materiale per il corso di Data Journalism, e la lezione sul Semantic Web ed interrogazione dei dati. Una sfida introduttiva al tema, molto pragmatico, dove userò sicuramente dati.camera.it e molto altro, ci sto lavorando.
Intanto la lezione di apertura di Gian Antonio Stella è davvero un portento, merita:
-> Open Data Journalism: lectio magistralis di Gian Antonio Stella
Cosa potrei portare per domani? Qualcosa a braccio, sicuramente, visto che è un barcamp .)
Qualcosa inerente l’esperienza di etucosacivedi.it, che nei prossimi giorni avrà uno sviluppo anche in chiave Linked Data, tra le altre cose. Sicuramente è affascinante quanto si potrebbe stimolare la cultura locale e la cittadinanza a comprendere quanto i dati ed i fatti che questi raccontano, possano essere utili per riutilizzare pratiche, e luoghi.
Quanto tutto questo potrebbe rendere più intelligenti le nostre città, nel senso più profondo del termine: abilitare la persone ad essere più consapevoli del loro bene pubblico locale, della governance del loro territorio e delle scelte che vengono fatte su di esso.
E su questa consapevolezza, abilitare l’Open Government vero, partecipato e portatore di valore condiviso.
Peccato che in Italia pochi abbiano visto la reale sinergia di quello che sta accadendo, e la maggior parte dei post sul tema siano semplici rilanci stampa del comunicato principale. ( Tranne per Guido Vetere che bacchetta gli autori di schema.org perchè forse così è stata definita un minimo di ontologia o schema globale, che tanto si diceva di non voler fare eh eh )
Da apprezzare Mauro Lupi, che sprona ad approfondire la questione, anche dal lato SEO, ed Il Post, che pone la questione all’attenzione di un pubblico più vasto del circolo tecnico. E che cita il fatto che, l’ultima volta che abbiamo avuto un accordo cross motori di ricerca, è stata la volta della creazione delle sitemap.xml, nel 2006. Una maniera condivisa di segnalare ai motori tutti i percorsi URL presenti nei nostri siti, che tanto ci facilitano oggi.
Un elemento non scontato. quindi quello dell’accordo tra motori.
Sicuramente si tratta di lavoro aggiuntivo per webmaster e publisher online, ma se l’obiettivo è quello di risultare maggiormente rilevanti e pertinenti ai motori di ricerca, lo sforzo potrebbe essere ampiamente premiato.
È altresì evidente che tale sistema accelera la direzione intrapresa dai motori di ricerca di passare da catalogatori di siti a fornitori di risposte
E’ affascinante fare una riflessione puntuale su quanto è successo attorno al tema schema.org, perchè coinvolge aspetti tecnologici legati al Web of Data ed al Semantic Web, e al futuro del SEO per come è stato inteso fino ad oggi. Unisco le mie reti sociali, nel fare questo: quelle legate al mondo Semantic Web e quelle legate al mondo del Web Marketing.
Non a caso sono un fervente sostenitore dell’esistenza del Data Web Marketing .)
Provo a fare un po’ di luce a livello generale. Si tratta di Web strutturato, di Internet of things e di aver semplificato ( perdendo dettagli non poco importanti ) la tecnologia per facilitarne la diffusione.
Anche se sono presenti certi ricorsi storici davvero inaspettati, dopo anni di discussioni e di confronti anche aspri tra chi pensava, come Google, che le parole chiave e gli algoritmi bastino alla gestione della conoscenza, e chi invece cercava modalità aperte per strutturare almeno un po’ tutto quello che si mette online. Per una gestione del sovraccarico informativo un attimo più evoluta, e più gestibile.
La sintesi più completa ed accurata, che per molti versi ha già scritto quello che penso, si può trovare a questo link, che in parte completa e definisce quello accennato da Mauro Lupi:
-> What Schema.org Means for SEO and Beyond
In generale, credo sia utile una sintesi dei miei tweet sul tema, densi di fonti che meritano attenzione e del tempo per rifletterci su, via lo splendido servizio Storify:
Come anticipato dall’ultimo post della settimana scorsa, anche in Italia ha iniziato ad arrivare l’onda lunga di questa news relativa a Google ed a Freebase: mi sarei aspettato però una più nutrita eco della vicenda. Il potenziale è davvero incalcolabile, o come dice una famosa pubblicità, è senza prezzo.
Il primo incipit da citare è quello di Marco Varone, dei Nova100, che chiude il suo post con questo condivisibile auspicio:
Anche se probabilmente l’acquisizione è stata accelerata per sottrarla ad altri concorrenti che parevano interessati (almeno così indicano le voci di corridoio e il fatto che Metaweb abbia un accordo con Bing), questo tocco di Semantic Web potrà essere un ulteriore contributo alla causa della semantica e l’ennesima dimostrazione che, pur tra difficoltà, passi falsi e successi, la direzione obbligata per tutti è quella. Serve dare più conoscenza ai sistemi automatici, serve dar loro la possibilità di “capire” quello che c’è scritto, serve in sostanza lavorare a livello semantico del testo e non più solo a keyword.
È dunque questo il famoso web semantico? No, affatto. Freebase è solo un maestoso strumento che mi può aiutare a fare applicazioni e siti che – loro sì – potranno creare il web semantico. Il fatto che all’interno dell’entità relativa a Tom Hanks sia presente la sua pagina di Wikipedia e il suo account Twitter non serve a niente, se non ho qualcosa che mi esponga in superficie questa informazione e, soprattutto, la metta in correlazione con altre informazioni (magari di tipo diverso). Fare browsing all’interno della base dati di Freebase è un po’ come fare browsing nel CD di Encarta (passatemi il paragone ai limiti dell’offensivo).
Ci vuole dunque qualcuno che prenda questa informazioni e ci faccia qualcosa di utile.
Questo è il mestiere di Metaweb.
[...] Poi sappiamo tutti, ormai è lampante, che con la quantità e la tipologia di fonti di informazioni che ci sono oggi, la semplice ricerca testuale non basta più. Occorre investire in strumenti semantici, davvero, che capiscano il contesto e che magari si adattino al mio personale pattern di ricerca. Chissà.
L’importante, ma questo è stato apertamente dichiarato, è che Freebase rimanga free.
Questo però è solo l’inizio del quadro. ( alcune cose dette da claudio in realtà sono incomplete: il Linked Data e il Semantic Web è già presente oggi, solo non ancora in maniera chiara per l’utente finale ).
From a technological perspective, the recent developments around RDFa, a simpler version of RDF which allows users to add metadata to their content, will further accelerate the growth of the Semantic Web. Drupal 7, one of the biggest open source content management systems used on hundreds of thousands of websites, comes with major RDFa functionality. The latest HTML5 draft has RDFa support in it. Facebook’s Open Graph protocol is based on RDFa. Google Rich Snippets support RDFa. According to a recent GigaOM report, Twitter Annotations are looking to use it.
[...]
But what about exploiting the power of the semantic web by pulling in data from different sources, the premise of linked data? Thomas Tague, VP Platform Strategy at Thomson Reuters and in charge of the OpenCalais project, a free service to analyze and extract concepts from user-submitted texts or web sources, told me about the exciting opportunities he sees at the intersection of highly trusted monetized content and free web content. He says that “people are not going to make $100 million bets based on blog postings. But that blog posting may be an outlier, may be an initial indicator, maybe about a layoff at a factory or something like that, that the user can now immediately link back to Thomson Reuters data and gain insight and take action.” While Tague certainly shares the enthusiasm for the growth of semantic technologies and adoption of standards by industry participants, utilization of linked data remains low in his view. Therefore, his short-term outlook with respect to utilization of the linked data cloud, remains rather cautious: “There is a lot of talk about it, but with respect to our linked-data company information, people aren’t picking it up yet very much.”
So what can we expect in the near future? Jamie Taylor tells me that he thinks “the idea that you can aggregate is something very novel: all of a sudden my data is not limited to my data silo.” He distinguishes two types of data: core data, which must be managed by the organization to drive the core business, and context data–such as geo data. He believes that what “semantic technologies allow is in some sense to outsource [context data] to the community for maintenance.”
Questo a mio avviso è il fulcro della vicenda: l’idea che ci sia un commons di dati, quella cloud chiamata Linked Data a disposizione degli sviluppatori per arricchire la User Experience di tutte le applicazioni ed i servizi Web che andiamo a creare disorienta come quando si doveva capire a cosa potesse servire il Web delle pagine. E’ il medesimo salto nell’approcciare un mezzo che non finisce mai di stupirci, come accennavo anche nella presentazione sull’economia degli Open Data in effetti.
-> Economia ed Open Data al VeneziaCamp 2010, ospite di Ecosistema 2.0
Abbiamo un database globale a disposizione: cosa mai ci potremmo fare?