Google, Freebase: il tipping point del Semantic Web? Il Linked Data è arrivato

Come anticipato dall’ultimo post della settimana scorsa, anche in Italia ha iniziato ad arrivare l’onda lunga di questa news relativa a Google ed a Freebase: mi sarei aspettato però una più nutrita eco della vicenda. Il potenziale è davvero incalcolabile, o come dice una famosa pubblicità, è senza prezzo.

Grazie a Memesphere, si traccia un po’ la discussione che emerge a livello di blog che citano il post di Google ufficiale:
-> Deeper understanding with Metaweb
Mentre anche via Blog Babel altre fonti si possono scovare:
-> Tag Metaweb via blogBabel

Il primo incipit da citare è quello di Marco Varone, dei Nova100, che chiude il suo post con questo condivisibile auspicio:

Anche se probabilmente l’acquisizione è stata accelerata per sottrarla ad altri concorrenti che parevano interessati (almeno così indicano le voci di corridoio e il fatto che Metaweb abbia un accordo con Bing), questo tocco di Semantic Web potrà essere un ulteriore contributo alla causa della semantica e l’ennesima dimostrazione che, pur tra difficoltà, passi falsi e successi, la direzione obbligata per tutti è quella. Serve dare più conoscenza ai sistemi automatici, serve dar loro la possibilità di “capire” quello che c’è scritto, serve in sostanza lavorare a livello semantico del testo e non più solo a keyword.

Una medesima conclusione raggiunta, attraverso ottimi riferimenti tecnici, anche da Claudio Cicali, che cito doverosamente:
-> Google acquisisce Metaweb e Freebase. Dunque?

È dunque questo il famoso web semantico? No, affatto. Freebase è solo un maestoso strumento che mi può aiutare a fare applicazioni e siti che – loro sì – potranno creare il web semantico. Il fatto che all’interno dell’entità relativa a Tom Hanks sia presente la sua pagina di Wikipedia e il suo account Twitter non serve a niente, se non ho qualcosa che mi esponga in superficie questa informazione e, soprattutto, la metta in correlazione con altre informazioni (magari di tipo diverso). Fare browsing all’interno della base dati di Freebase è un po’ come fare browsing nel CD di Encarta (passatemi il paragone ai limiti dell’offensivo).

Ci vuole dunque qualcuno che prenda questa informazioni e ci faccia qualcosa di utile.

Questo è il mestiere di Metaweb.
[...]
Poi sappiamo tutti, ormai è lampante, che con la quantità e la tipologia di fonti di informazioni che ci sono oggi, la semplice ricerca testuale non basta più. Occorre investire in strumenti semantici, davvero, che capiscano il contesto e che magari si adattino al mio personale pattern di ricerca. Chissà.

L’importante, ma questo è stato apertamente dichiarato, è che Freebase rimanga free.

Questo però è solo l’inizio del quadro. ( alcune cose dette da claudio in realtà sono incomplete: il Linked Data e il Semantic Web è già presente oggi, solo non ancora in maniera chiara per l’utente finale ).

Meritano una lettura anche i post del Tagliaerbe e quello di Giovanni Calia:
-> Il Tipping Point del Web Semantico

Giovanni cita un ottimo riferimento del MIT, utile per dare un contesto ancor più allargato:

From a technological perspective, the recent developments around RDFa, a simpler version of RDF which allows users to add metadata to their content, will further accelerate the growth of the Semantic Web. Drupal 7, one of the biggest open source content management systems used on hundreds of thousands of websites, comes with major RDFa functionality. The latest HTML5 draft has RDFa support in it. Facebook’s Open Graph protocol is based on RDFa. Google Rich Snippets support RDFa. According to a recent GigaOM report, Twitter Annotations are looking to use it.
[...]
But what about exploiting the power of the semantic web by pulling in data from different sources, the premise of linked data? Thomas Tague, VP Platform Strategy at Thomson Reuters and in charge of the OpenCalais project, a free service to analyze and extract concepts from user-submitted texts or web sources, told me about the exciting opportunities he sees at the intersection of highly trusted monetized content and free web content. He says that “people are not going to make $100 million bets based on blog postings. But that blog posting may be an outlier, may be an initial indicator, maybe about a layoff at a factory or something like that, that the user can now immediately link back to Thomson Reuters data and gain insight and take action.” While Tague certainly shares the enthusiasm for the growth of semantic technologies and adoption of standards by industry participants, utilization of linked data remains low in his view. Therefore, his short-term outlook with respect to utilization of the linked data cloud, remains rather cautious: “There is a lot of talk about it, but with respect to our linked-data company information, people aren’t picking it up yet very much.”

So what can we expect in the near future? Jamie Taylor tells me that he thinks “the idea that you can aggregate is something very novel: all of a sudden my data is not limited to my data silo.” He distinguishes two types of data: core data, which must be managed by the organization to drive the core business, and context data–such as geo data. He believes that what “semantic technologies allow is in some sense to outsource [context data] to the community for maintenance.”

Questo a mio avviso è il fulcro della vicenda: l’idea che ci sia un commons di dati, quella cloud chiamata Linked Data a disposizione degli sviluppatori per arricchire la User Experience di tutte le applicazioni ed i servizi Web che andiamo a creare disorienta come quando si doveva capire a cosa potesse servire il Web delle pagine. E’ il medesimo salto nell’approcciare un mezzo che non finisce mai di stupirci, come accennavo anche nella presentazione sull’economia degli Open Data in effetti.
-> Economia ed Open Data al VeneziaCamp 2010, ospite di Ecosistema 2.0

Abbiamo un database globale a disposizione: cosa mai ci potremmo fare?

Continue reading

Il Web e il Semantic Web iniziano a fondersi: è il Web che evolve. Google acquisisce Metaweb e Freebase

E’ sabato, devo fare tante cose, ma questa merita 10 minuti per stendere un post, breve ma incisivo.
Una notizia storica, dai contorni poco definiti negli effetti per il Mercato, ma con un potenziale dirompente.

Un po’ come l’adozione degli standard del Semantic Web da parte di Facebook con l’ OpenGraph Protocol, e l’adozione di RDFa che è divenuta mainstream a livello di rich snippets, adesso si aprono scenari davvero intriganti.

Google ha acquisito Metaweb, società che gestisce tra le altre cose Freebase giusto per dare l’idea:
-> Tweet dell’acquisizione da parte di Google di Metaweb

Today we’ve acquired Metaweb. Working together we want to improve search, make web more meaningful. Details: http://bit.ly/dzrXmu

Alcuni della comunità del Semantic Web hanno scritto, e Tim O’Reilly in persona ha scritto:

RT @timoreilly: Google buys Metaweb. http://bit.ly/bnFEIP Important step in convergence of semweb and web 2.0 thinking. I like it.

La notizia mi è arrivata stanotte attraverso la mailing list del W3C dedicata al Semantic Web e al Linked Data.
Ma anche attraverso Twitter vale la pena di guardare un attimo:
-> Ricerca di metaweb all’interno di Twitter

Anche Luca Conti ha rilanciato la cosa ed i primi italiani stanno iniziando a rilanciarla.
Ormai la strada è imboccata: adesso bisogna comprenderne i confini.

A casa di Google il post merita una lettura:
-> Deeper understanding with Metaweb

Ne prendo alcuni stralci:

Over time we’ve improved search by deepening our understanding of queries and web pages. The web isn’t merely words—it’s information about things in the real world, and understanding the relationships between real-world entities can help us deliver relevant information more quickly. Today, we’ve acquired Metaweb, a company that maintains an open database of things in the world. Working together we want to improve search and make the web richer and more meaningful for everyone.

With efforts like rich snippets and the search answers feature, we’re just beginning to apply our understanding of the web to make search better. Type [barack obama birthday] in the search box and see the answer right at the top of the page. Or search for [events in San Jose] and see a list of specific events and dates. We can offer this kind of experience because we understand facts about real people and real events out in the world. But what about [colleges on the west coast with tuition under $30,000] or [actors over 40 who have won at least one oscar]? These are hard questions, and we’ve acquired Metaweb because we believe working together we’ll be able to provide better answers.

Finalmente anche Google lascia definitivamente il concetto di pagine e di parole, delle care keywords, ed inizia a parlare di informazioni relative alle cose del mondo reale. E’ il Web my dear .)

Una chiusa finale: le persone chiave che lavoravano all’interno del gruppo del MIT a cui sono tanto affezionato, il gruppo SIMILE che ha rilasciato il framework Exhibit per gli open data e la loro visualizzazione, sono passate a Freebase da un anno abbondante o anche più. Adesso sono di fatto in Google.

Il potenziale diventa astronomico.
Questo post potrebbe farvi capire qualcosa ( già citato a casa di Gigi Cogo sul tema economia degli open data ):
-> Freebase Gridworks, Data-Journalism and Open Data Network Effects

Queste persone sono ora passate a Google, di fatto, con strumenti di questo tipo:

Freebase Gridworks 1.0 Overview from David Huynh on Vimeo.

Il Web diventa semantico, si dota di significato e passa dalle pagine ai dati: e l’evoluzione del Web in senso lato è l’unica cosa che emergerà alla fine. Non più 2.0, non più 3.0: il Web al suo massimo potenziale, e niente più divisioni nette tra Web e Semantic Web.
La divisione sarà nella persona che avrà consapevolezza di quello che potrà fare con il Web, ma il mezzo ormai avrà un solo nome :)

E questa cosa è culturale, non tecnologica.

Economia ed Open Data al VeneziaCamp 2010, ospite di Ecosistema 2.0

E’ passata una settimana dal VeneziaCamp ( tralascio volutamente le polemiche ed i casini che sono emersi nell’evento, magari per un altro post ) , ma in questi giorni tra caldo e problemi vari, non avevo ancora fatto in tempo a mettere insieme un minimo di pensiero relativo al mio intervento sull’economia e gli Open Data. Grazie all’invito di Gino Tocchetti, alla fine pure a questo VeneziaCamp hanno dovuto sopportare le mie passioni tanto strane .)
L’occasione è stata quella della giornata del venerdì, dove Ecosistema2.0 ha organizzato un evento davvero notevole, come capacità di contaminazione tra idee ed esperienze differenti per unire il territorio al potenziale della logica della Rete, un’occasione ripresa positivamente anche da Zoes tra gli altri:
-> Ecosistemi aumentati: reti che attivano territori

Anche quest’anno, nell’ambito del VeneziaCamp2010, il network “Ecosistema 2.0″, e’ stato invitato a coordinare un evento di sensibilizzazione e diffusione dei modelli a rete aperta e sociale,
cosi’ come sono promossi e sostenuti da internet, e che abbiano incidenza nel territorio.

Il tema di quest’anno, coerentemente con la trasformazione del Veneziacamp in Festival dell’innovazione digitale, e’ “Ecosistemi aumentati: reti che attivano territori”, ( http://www.facebook.com/event.php?eid=107020039346666&index=1 ) ed e’ dedicato a tratteggiare lo stato dell’arte nello sviluppo di reti
aperte nei territori. Fa dunque seguito a quello della passata edizione del Veneziacamp, dedicato alla Cittadinanza Digitale, e che aveva il titolo “Civicita’: una citta’ glocale tra reale e virtuale” ( http://www.facebook.com/event.php?eid=156133468500 ).

In realtà è da un pò che sto approfondendo il tema delle economie attorno agli Open Data, un tema che sarà sempre più affrontato in queste pagine, ed infatti qualcosa era nato a casa di Gigi Cogo:
-> Economia degli open data

Visto che ne aveva parlato anche su Wired, mi ha stimolato, e vista la profondità della discussione, ho creato una categoria ad hoc in questo blog, se vorrete stare aggiornati su tale questione in particolare. Lo scamabio a casa sua merita comunque una lettura, che non ripeto in questa sede.

Partiamo quindi dalla presentazione portata al VeneziaCamp, che ho ampliato ed aggiornato rispetto a quella mostrata dove non filava troppo, o dove erano presenti troppi concetti impliciti:

Il tema è notevole e sempre attuale: anche Alfonso Fuggetta ne ha parlato con un bellissimo incipit, alla fine di un post nei medesimi giorni in cui si svolgeva l’evento di Venezia, che riprendo:

Date i dati


Chi espone dati e informazioni su Internet rende possibile il mashup e la creazione di servizi. Ovviamente ci sono i problemi di privacy e controllo nel caso di dati personali, ma quanto si può fare se invece di fare tanti silos verticali chiusi, ciascuno rendesse disponibili in modo intelligente e ragionevole dati e informazioni secondo formati standard?

Nella giornata del venerdì 2 luglio anche l’amico Ernesto Belisario ha parlato degli Open Data, e ne ha parlato in effetti pure il sabato al barcamp, per cui è impossibile fare una sintesi completa delle varie sfacettature della vicenda: è ormai assodato che fa parte dell’agenda setting di un certo tipo di eventi e che rappresenta una delle possibilità più concrete di nascita di nuovi business dirompenti per uscire dallo stallo istituzionale di questo Paese e rappresenta una valida occasione per fare innovazione in maniera pragmatica e non più solo parlata.
Sarà un autunno caldo su questi temi, soprattutto per la loro dirompenza relativa alla trasparenza e alla libertà di noi cittadini, sia nel creare consapevolezza nelle falle del sistema Paese, che nel essere davvero cittadini attivi nella costruzione del nostro futuro.
Non è un caso che anche l’amico Sergio Maistrello ne parli, in chiave giornalistica: in America in un certo senso nascono nuovi ruoli del giornalista su questi temi, riconosciuti sotto il cappello di Data Journalism

Torniamo all’intervento promosso da Ecosistema2.0: tante persone, tanti progetti ed iniziative diverse, con affinità e obiettivi comuni tutto sommato. Ma non è solo una questione di vicinanza dei fini e di persone con interessi comuni.
Il legame tra tutte queste iniziative è anche tecnico, oltre che sociale: alla fine la tecnologia è un fattore abilitante e la società deve capirne le potenzialità appieno per trarne un reale vantaggio a tutto tondo. Per introdurci meglio in questo mio flusso di pensiero mostrato nella presentazione, direi che questa ulteriore presentazione della Talis ci possa stare per introdurre il tema “If you love something, set it free“:

Passiamo ora a chiarire un po’ di punti, per chi ha un attimo di tempo.

Continue reading