Cercando un po’ in giro per la Rete, ho provato a vedere quali vocabolari vengono interpretati correttamente dallo strumento recente di parsing dei dati strutturati di Google, per iniziare a chiarirmi le idee. Per far comprendere l’argomento ai neofiti, basta ricordarsi di due elementi per quanto riguarda il dato strutturato:
sintassi: ad oggi ci sono diversi modi per far digerire a Google dei dati strutturati nella propria pagina, ma questo per ora non sembra un problema. La sintassi consigliata è quella dei microdati, una modalità semplificata non ancora standard, nativa della specifica HTML5. L’altra alternativa è usare RDFa ( specie la sua ultima versione RDFa Lite 1.1 ), la stessa sintassi che usa Facebook con lo standard Open Graph. Nella visualizzazione anteprima del tool di Google, vengono mostrate entrambe.
struttura ( schemi e vocabolari ): è questo l’argomento spinoso, in effetti. Per ora il consiglio da dare è usare tutto quello presente su schema.org
Come anticipato dall’ultimo post della settimana scorsa, anche in Italia ha iniziato ad arrivare l’onda lunga di questa news relativa a Google ed a Freebase: mi sarei aspettato però una più nutrita eco della vicenda. Il potenziale è davvero incalcolabile, o come dice una famosa pubblicità, è senza prezzo.
Il primo incipit da citare è quello di Marco Varone, dei Nova100, che chiude il suo post con questo condivisibile auspicio:
Anche se probabilmente l’acquisizione è stata accelerata per sottrarla ad altri concorrenti che parevano interessati (almeno così indicano le voci di corridoio e il fatto che Metaweb abbia un accordo con Bing), questo tocco di Semantic Web potrà essere un ulteriore contributo alla causa della semantica e l’ennesima dimostrazione che, pur tra difficoltà, passi falsi e successi, la direzione obbligata per tutti è quella. Serve dare più conoscenza ai sistemi automatici, serve dar loro la possibilità di “capire” quello che c’è scritto, serve in sostanza lavorare a livello semantico del testo e non più solo a keyword.
E’ sabato, devo fare tante cose, ma questa merita 10 minuti per stendere un post, breve ma incisivo. Una notizia storica, dai contorni poco definiti negli effetti per il Mercato, ma con un potenziale dirompente.
Un po’ come l’adozione degli standard del Semantic Web da parte di Facebook con l’ OpenGraph Protocol, e l’adozione di RDFa che è divenuta mainstream a livello di rich snippets, adesso si aprono scenari davvero intriganti.
Over time we’ve improved search by deepening our understanding of queries and web pages. **The web isn’t merely words—it’s information about things in the real world, and understanding the relationships between real-world entities can help us deliver relevant information more quickly. **Today, we’ve acquired Metaweb, a company that maintains an open database of things in the world. Working together we want to improve search and make the web richer and more meaningful for everyone.
With efforts like rich snippets and the search answers feature, we’re just beginning to apply our understanding of the web to make search better. Type [barack obama birthday] in the search box and see the answer right at the top of the page. Or search for [events in San Jose] and see a list of specific events and dates. We can offer this kind of experience because we understand facts about real people and real events out in the world. But what about [colleges on the west coast with tuition under $30,000] or [actors over 40 who have won at least one oscar]? These are hard questions, and we’ve acquired Metaweb because we believe working together we’ll be able to provide better answers.
Finalmente anche Google lascia definitivamente il concetto di pagine e di parole, delle care keywords, ed inizia a parlare di informazioni relative alle cose del mondo reale. E’ il Web my dear .)
Una chiusa finale: le persone chiave che lavoravano all’interno del gruppo del MIT a cui sono tanto affezionato, il gruppo SIMILE che ha rilasciato il framework Exhibit per gli open data e la loro visualizzazione, sono passate a Freebase da un anno abbondante o anche più. Adesso sono di fatto in Google.
**Il Web diventa semantico, si dota di significato e passa dalle pagine ai dati: e l’evoluzione del Web in senso lato è l’unica cosa che emergerà alla fine. Non più 2.0, non più 3.0: il Web al suo massimo potenziale, e niente più divisioni nette tra Web e Semantic Web. ** La divisione sarà nella persona che avrà consapevolezza di quello che potrà fare con il Web, ma il mezzo ormai avrà un solo nome :)
Attivista Open Data prima, studioso di Civic Hacking e dell’importanza del ruolo delle comunità in seguito, vengo dalle scienze dell’informazione, dove ho scoperto il Software libero e l’Open Source, il Semantic Web e la filosofia che guida lo sviluppo degli standard del World Wide Web e ne sono rimasto affascinato. Il lavoro (dal 2018 in poi) mi ha portato ad occuparmi di Legal Tech, di Cyber Security e di Compliance, ambiti fortemente connessi l’uno all’altro e decisamente sfidanti.