Google, Freebase: il tipping point del Semantic Web? Il Linked Data è arrivato

Come anticipato dall’ultimo post della settimana scorsa, anche in Italia ha iniziato ad arrivare l’onda lunga di questa news relativa a Google ed a Freebase: mi sarei aspettato però una più nutrita eco della vicenda. Il potenziale è davvero incalcolabile, o come dice una famosa pubblicità, è senza prezzo.

Grazie a Memesphere, si traccia un po’ la discussione che emerge a livello di blog che citano il post di Google ufficiale:
-> Deeper understanding with Metaweb
Mentre anche via Blog Babel altre fonti si possono scovare:
-> Tag Metaweb via blogBabel

Il primo incipit da citare è quello di Marco Varone, dei Nova100, che chiude il suo post con questo condivisibile auspicio:

Anche se probabilmente l’acquisizione è stata accelerata per sottrarla ad altri concorrenti che parevano interessati (almeno così indicano le voci di corridoio e il fatto che Metaweb abbia un accordo con Bing), questo tocco di Semantic Web potrà essere un ulteriore contributo alla causa della semantica e l’ennesima dimostrazione che, pur tra difficoltà, passi falsi e successi, la direzione obbligata per tutti è quella. Serve dare più conoscenza ai sistemi automatici, serve dar loro la possibilità di “capire” quello che c’è scritto, serve in sostanza lavorare a livello semantico del testo e non più solo a keyword.

Una medesima conclusione raggiunta, attraverso ottimi riferimenti tecnici, anche da Claudio Cicali, che cito doverosamente:
-> Google acquisisce Metaweb e Freebase. Dunque?

È dunque questo il famoso web semantico? No, affatto. Freebase è solo un maestoso strumento che mi può aiutare a fare applicazioni e siti che – loro sì – potranno creare il web semantico. Il fatto che all’interno dell’entità relativa a Tom Hanks sia presente la sua pagina di Wikipedia e il suo account Twitter non serve a niente, se non ho qualcosa che mi esponga in superficie questa informazione e, soprattutto, la metta in correlazione con altre informazioni (magari di tipo diverso). Fare browsing all’interno della base dati di Freebase è un po’ come fare browsing nel CD di Encarta (passatemi il paragone ai limiti dell’offensivo).

Ci vuole dunque qualcuno che prenda questa informazioni e ci faccia qualcosa di utile.

Questo è il mestiere di Metaweb.
[...]
Poi sappiamo tutti, ormai è lampante, che con la quantità e la tipologia di fonti di informazioni che ci sono oggi, la semplice ricerca testuale non basta più. Occorre investire in strumenti semantici, davvero, che capiscano il contesto e che magari si adattino al mio personale pattern di ricerca. Chissà.

L’importante, ma questo è stato apertamente dichiarato, è che Freebase rimanga free.

Questo però è solo l’inizio del quadro. ( alcune cose dette da claudio in realtà sono incomplete: il Linked Data e il Semantic Web è già presente oggi, solo non ancora in maniera chiara per l’utente finale ).

Meritano una lettura anche i post del Tagliaerbe e quello di Giovanni Calia:
-> Il Tipping Point del Web Semantico

Giovanni cita un ottimo riferimento del MIT, utile per dare un contesto ancor più allargato:

From a technological perspective, the recent developments around RDFa, a simpler version of RDF which allows users to add metadata to their content, will further accelerate the growth of the Semantic Web. Drupal 7, one of the biggest open source content management systems used on hundreds of thousands of websites, comes with major RDFa functionality. The latest HTML5 draft has RDFa support in it. Facebook’s Open Graph protocol is based on RDFa. Google Rich Snippets support RDFa. According to a recent GigaOM report, Twitter Annotations are looking to use it.
[...]
But what about exploiting the power of the semantic web by pulling in data from different sources, the premise of linked data? Thomas Tague, VP Platform Strategy at Thomson Reuters and in charge of the OpenCalais project, a free service to analyze and extract concepts from user-submitted texts or web sources, told me about the exciting opportunities he sees at the intersection of highly trusted monetized content and free web content. He says that “people are not going to make $100 million bets based on blog postings. But that blog posting may be an outlier, may be an initial indicator, maybe about a layoff at a factory or something like that, that the user can now immediately link back to Thomson Reuters data and gain insight and take action.” While Tague certainly shares the enthusiasm for the growth of semantic technologies and adoption of standards by industry participants, utilization of linked data remains low in his view. Therefore, his short-term outlook with respect to utilization of the linked data cloud, remains rather cautious: “There is a lot of talk about it, but with respect to our linked-data company information, people aren’t picking it up yet very much.”

So what can we expect in the near future? Jamie Taylor tells me that he thinks “the idea that you can aggregate is something very novel: all of a sudden my data is not limited to my data silo.” He distinguishes two types of data: core data, which must be managed by the organization to drive the core business, and context data–such as geo data. He believes that what “semantic technologies allow is in some sense to outsource [context data] to the community for maintenance.”

Questo a mio avviso è il fulcro della vicenda: l’idea che ci sia un commons di dati, quella cloud chiamata Linked Data a disposizione degli sviluppatori per arricchire la User Experience di tutte le applicazioni ed i servizi Web che andiamo a creare disorienta come quando si doveva capire a cosa potesse servire il Web delle pagine. E’ il medesimo salto nell’approcciare un mezzo che non finisce mai di stupirci, come accennavo anche nella presentazione sull’economia degli Open Data in effetti.
-> Economia ed Open Data al VeneziaCamp 2010, ospite di Ecosistema 2.0

Abbiamo un database globale a disposizione: cosa mai ci potremmo fare?

Continue reading

Open Data: eppur si muove anche in Italia, Open Camera. Per un nuovo senso civico

Premesso che la trasparenza ed un giusto equilibrio di informazione sono fondamentali per correggere le derive del potere, derive che sono connaturate al potere stesso, di qualunque partito e di qualsiasi posizione politica si possa essere, ci sono importanti novità che vorrei riassumere sul tema Open Data.
Riprendo due note di Titti Commino che condivido perfettamente e che credo debbano essere condivise il più possibile per chi capita in queste righe:
-> Open Data in Italia? Eppur si muove

Però vorrei sottolineare , per ora, due considerazioni a mio avviso di fondamentale importanza per la comprensione del portato dell’Open Data policy:

  1. l’opendata , sebbene supportato e realizzato , almeno in embrione, da un partito (auguro a Emma Bonino di vincere la sfida elettorale spiacente di non poterla sostenere col mio voto non essendo io residente nel Lazio), ritengo, come scrissi nel mio documento, che si debba offrire con la creazione di un luogo in cui i dati siano open ma indipendentemente da un partito politico: gli Open Data sono un servizio PER il cittadino, un diritto DEL cittadino, non una questione di partito (sarà che vedo anche nel futuro la possibilità che questo messaggio diventi pervasivo e non sia recepito solo localmente).
  2. l’opendata ha senso in quanto abilita tutti al riuso degli stessi .. non è (solo) questione di “svelare i dati segreti“.

I Radicali, che tra le altre cose avevano contattato anche il sottoscritto per elaborare il piano operativo sull’ Open Data ( e che per mancanza di tempo non ho potuto aiutare a stilare ), hanno fatto fare a questo Paese un bel passetto in avanti. Un passetto che è iniziato dalla condivisione di materiale pubblico, che apre la strada con calma ad un processo di rinnovamento nella consapevolezza delle possibilità a nostra disposizione. E con noi intendo noi cittadini.
E vabbè, siamo nel 2010, e qui andiamo avanti come si puo’, no? .)

Via blogbabel è utile segnarsi alcuni post sugli open data ed i conti segreti della Camera dei deputati: ne riprendo tre fondamentali per questo contributo…

Ecco cosa significa avere i dati in XML o in Excel: significa che ognuno di noi puo’ far le visualizzazioni o le viste che vuole su quei dati, grazie alla semplice condivisione di dati grezzi in forma di un file condiviso. Allo stesso modo se io mettessi online un po’ di documenti in formato DOC o anche ODF, per dire, pensando ad una forma un po’ più data centrica, come il file con i dati in formato foglio elettronico, o in XML, tipo. Sto condividendo files digitali: vista la propensione a lasciare tutto nel cartaceo della PA, è già un bel passo in avanti devo dire. Con quelle spese in IT della Camera, non ci sta un po’ di Office Automation? Ma mettere i dati nel Web, è come mettere un file nel Web. E’ il passo iniziale, se vogliamo, ma è come se non avessimo il Web, in un certo senso, ma solo la condivisione di documenti via FTP.

Qual’è il vero potenziale di poter inserire i dati nel Web?
Lo stesso e molto di più del passare a mettere un PDF in Rete e metterlo come ipertesto, come pagine HTML.
Siamo ad un bivio, ad un passaggio di innovazione dirompente con un potenziale incredibile.
Perchè significa dare maggiore potere in mano alla Società nel suo complesso. Perchè si deve pretendere a livello politico e di rappresentanza democratica tout court, e trasversale ai partiti.
Per un comune, e nuovo, senso civico.

E qui Nicola Mattina ha sintetizzato assai bene una certa forma di potenziale:

Continue reading

Lessig, Fini, e Open Data: ovvero la libertà non è solo questione di principio

Metto insieme qualche pezzo al volo, dopo aver letto tra ieri e oggi i resoconti e le twittate sull’incontro organizzato da Capitale Digitale con il professor Lessig nel Parlamento italiano nella giornata di ieri. ( bello l’hashtag #difenderelarete )
Questo per chi se lo fosse perso l’intervento del professor Lessig ( il minimo che me lo guardassi visto che sono un Creative Commons Supporter .) ) :

E questo è il testo del suo intervento:
-> Convegno “Internet è libertà”. Atti parlamentari e intervento di Lawrence Lessig. Per chi si è perso la diretta

Qualche nota divertente nel flusso real-time me l’ero segnata in questo onelinr http://onelinr.com/difenderelarete, tra le altre cose…
Condivido in toto il pensiero di Giovanni in merito al contesto generale, e non mi ripeto in tal senso, ma riprendo una porzione di quello che ha scritto:

Non è stata sprecata forse neanche quando in apertura Fini, un po’ demagogicamente e poco programmaticamente, ha dichiarato che Internet “deve essere considerato un vero e proprio diritto fondamentale dell’uomo”. Assicurandosi così i titoli nei quotidiani nazionali.

E qui sta il punto. Il dibattito relativo alla Rete sui media Italiani sarà ridotto tra esaltazione modernista del politico d’antan e curiosità antropologica circa il cosiddetto “popolo della Rete”.

Di questo si parlerà nell’informazione del Paese. Di come Fini sostenga l’idea di candidatura della Rete al Nobel, ad esempio. Basta leggersi la Repubblica o Il Corriere o La Stampa.

[...]

Mentre avrebbero potuto titolare l’incontro con le parole usate da Lessig nel chiudere l’incontro quando ha detto che “occorre prendere sul serio la rabbia generazionale che c’è ed imparare ad ascoltare la Rete”. Io in Italia, oggi, lo ascolterei.

Proprio per porla in maniera costruttiva, e per provare ad enfatizzare quello che la Rete sta dicendo in merito, ricollegherei due pezzi di Nicola Mattina ed un mio commento forse mangiato dal sistema in questi giorni frenetici dal suo blog, che ripropongo qui interamente proprio perchè va a completare questo stesso post di Nicola di poco fa:
-> Lawrence Lessig: Internet è libertà (note a margine)

Mi ricollego proprio alla sua parte terminale, quando si dice:

Un’ultima considerazione, infine, riguarda gli esempi che Lessig porta per illustrare la cultura digitale: si tratta di ragazzini che giocano con i video, creando e remixando clip musicali. Trovo che, nel 2010, essi debbano essere aggiornati. Oggi avrebbe molto più senso mostrare i servizi web realizzati da molti programmatori negli Stati Uniti e in Gran Bretagna utilizzando i dati messi a disposizione dalle amministrazioni pubbliche. Il motivo è molto semplice. I primi possono essere tuttora guardati con un sorriso e ascritti al mondo delle stranezze giovanili. I secondi, invece, fanno intravedere come evolverà la democrazia quando vi sarà davvero trasparenza; sarei assai sorpreso se vedessi un solo politico sorridere!

Implicitamente mi pare che Nicola qui faccia riferimento a qualcosa che ha scritto qualche giorno fa, in merito alla trasparenza e agli open data:
-> Tim Berners-Lee: l’anno degli open data

Io avevo inserito proprio un commento di chiarimento e di sunto sugli Open Data ed il modo in cui si lega il tutto con il Semantic Web e il Linked Data, che propongo qui nella sua interezza.
Prima forse merita rivedere il video di Sir Tim al Ted 2010 sugli Open Data:

Continue reading