Cercando un po’ in giro per la Rete, ho provato a vedere quali vocabolari vengono interpretati correttamente dallo strumento recente di parsing dei dati strutturati di Google, per iniziare a chiarirmi le idee.
Per far comprendere l’argomento ai neofiti, basta ricordarsi di due elementi per quanto riguarda il dato strutturato:

  • sintassi: ad oggi ci sono diversi modi per far digerire a Google dei dati strutturati nella propria pagina, ma questo per ora non sembra un problema. La sintassi consigliata è quella dei microdati, una modalità semplificata non ancora standard, nativa della specifica HTML5. L’altra alternativa è usare RDFa ( specie la sua ultima versione RDFa Lite 1.1 ), la stessa sintassi che usa Facebook con lo standard Open Graph. Nella visualizzazione anteprima del tool di Google, vengono mostrate entrambe.
  • struttura ( schemi e vocabolari ): è questo l’argomento spinoso, in effetti. Per ora il consiglio da dare è usare tutto quello presente su schema.org

In tutto questo, se volete un ottimo riassunto, SpazioDati ha fatto un video al Tedx di Brera che chiarirà le relazioni tra molti elementi oscuri ( Semantic Web, Linked Data e molto altro ).

Continua a leggere

Come anticipato dall’ultimo post della settimana scorsa, anche in Italia ha iniziato ad arrivare l’onda lunga di questa news relativa a Google ed a Freebase: mi sarei aspettato però una più nutrita eco della vicenda. Il potenziale è davvero incalcolabile, o come dice una famosa pubblicità, è senza prezzo.

Grazie a Memesphere, si traccia un po’ la discussione che emerge a livello di blog che citano il post di Google ufficiale:
-> Deeper understanding with Metaweb
Mentre anche via Blog Babel altre fonti si possono scovare:
-> Tag Metaweb via blogBabel

Il primo incipit da citare è quello di Marco Varone, dei Nova100, che chiude il suo post con questo condivisibile auspicio:

Anche se probabilmente l’acquisizione è stata accelerata per sottrarla ad altri concorrenti che parevano interessati (almeno così indicano le voci di corridoio e il fatto che Metaweb abbia un accordo con Bing), questo tocco di Semantic Web potrà essere un ulteriore contributo alla causa della semantica e l’ennesima dimostrazione che, pur tra difficoltà, passi falsi e successi, la direzione obbligata per tutti è quella. Serve dare più conoscenza ai sistemi automatici, serve dar loro la possibilità di “capire” quello che c’è scritto, serve in sostanza lavorare a livello semantico del testo e non più solo a keyword.

Una medesima conclusione raggiunta, attraverso ottimi riferimenti tecnici, anche da Claudio Cicali, che cito doverosamente:
-> Google acquisisce Metaweb e Freebase. Dunque?

Continua a leggere

E’ sabato, devo fare tante cose, ma questa merita 10 minuti per stendere un post, breve ma incisivo.
Una notizia storica, dai contorni poco definiti negli effetti per il Mercato, ma con un potenziale dirompente.

Un po’ come l’adozione degli standard del Semantic Web da parte di Facebook con l’ OpenGraph Protocol, e l’adozione di RDFa che è divenuta mainstream a livello di rich snippets, adesso si aprono scenari davvero intriganti.

Google ha acquisito Metaweb, società che gestisce tra le altre cose Freebase giusto per dare l’idea:
-> Tweet dell’acquisizione da parte di Google di Metaweb

Today we’ve acquired Metaweb. Working together we want to improve search, make web more meaningful. Details: http://bit.ly/dzrXmu

Alcuni della comunità del Semantic Web hanno scritto, e Tim O’Reilly in persona ha scritto:

RT @timoreilly: Google buys Metaweb. http://bit.ly/bnFEIP Important step in convergence of semweb and web 2.0 thinking. I like it.

La notizia mi è arrivata stanotte attraverso la mailing list del W3C dedicata al Semantic Web semantic-web@w3.org e al Linked Data public-lod@w3.org.
Ma anche attraverso Twitter vale la pena di guardare un attimo:
-> Ricerca di metaweb all’interno di Twitter

Anche Luca Conti ha rilanciato la cosa ed i primi italiani stanno iniziando a rilanciarla.
Ormai la strada è imboccata: adesso bisogna comprenderne i confini.

A casa di Google il post merita una lettura:
-> Deeper understanding with Metaweb

Ne prendo alcuni stralci:

Over time we’ve improved search by deepening our understanding of queries and web pages. **The web isn’t merely words—it’s information about things in the real world, and understanding the relationships between real-world entities can help us deliver relevant information more quickly. **Today, we’ve acquired Metaweb, a company that maintains an open database of things in the world. Working together we want to improve search and make the web richer and more meaningful for everyone.

With efforts like rich snippets and the search answers feature, we’re just beginning to apply our understanding of the web to make search better. Type [barack obama birthday] in the search box and see the answer right at the top of the page. Or search for [events in San Jose] and see a list of specific events and dates. We can offer this kind of experience because we understand facts about real people and real events out in the world. But what about [colleges on the west coast with tuition under $30,000] or [actors over 40 who have won at least one oscar]? These are hard questions, and we’ve acquired Metaweb because we believe working together we’ll be able to provide better answers.

Finalmente anche Google lascia definitivamente il concetto di pagine e di parole, delle care keywords, ed inizia a parlare di informazioni relative alle cose del mondo reale. E’ il Web my dear .)

Una chiusa finale: le persone chiave che lavoravano all’interno del gruppo del MIT a cui sono tanto affezionato, il gruppo SIMILE che ha rilasciato il framework Exhibit per gli open data e la loro visualizzazione, sono passate a Freebase da un anno abbondante o anche più. Adesso sono di fatto in Google.

Il potenziale diventa astronomico.
Questo post potrebbe farvi capire qualcosa ( già citato a casa di Gigi Cogo sul tema economia degli open data ):
-> Freebase Gridworks, Data-Journalism and Open Data Network Effects

Queste persone sono ora passate a Google, di fatto, con strumenti di questo tipo:

Freebase Gridworks 1.0 Overview from David Huynh on Vimeo.

**Il Web diventa semantico, si dota di significato e passa dalle pagine ai dati: e l’evoluzione del Web in senso lato è l’unica cosa che emergerà alla fine. Non più 2.0, non più 3.0: il Web al suo massimo potenziale, e niente più divisioni nette tra Web e Semantic Web. **
La divisione sarà nella persona che avrà consapevolezza di quello che potrà fare con il Web, ma il mezzo ormai avrà un solo nome :)

E questa cosa è culturale, non tecnologica.

Commenta e condividi

Foto dell'autore

Matteo Brunati

Attivista Open Data prima, studioso di Civic Hacking e dell’importanza del ruolo delle comunità in seguito, vengo dalle scienze dell’informazione, dove ho scoperto il Software libero e l’Open Source, il Semantic Web e la filosofia che guida lo sviluppo degli standard del World Wide Web e ne sono rimasto affascinato.
Il lavoro (dal 2018 in poi) mi ha portato ad occuparmi di Legal Tech, di Cyber Security e di Compliance, ambiti fortemente connessi l’uno all’altro e decisamente sfidanti.


Compliance Specialist SpazioDati
Appassionato #CivicHackingIT


Trento