Cercando un po’ in giro per la Rete, ho provato a vedere quali vocabolari vengono interpretati correttamente dallo strumento recente di parsing dei dati strutturati di Google, per iniziare a chiarirmi le idee.
Per far comprendere l’argomento ai neofiti, basta ricordarsi di due elementi per quanto riguarda il dato strutturato:

  • sintassi: ad oggi ci sono diversi modi per far digerire a Google dei dati strutturati nella propria pagina, ma questo per ora non sembra un problema. La sintassi consigliata è quella dei microdati, una modalità semplificata non ancora standard, nativa della specifica HTML5. L’altra alternativa è usare RDFa ( specie la sua ultima versione RDFa Lite 1.1 ), la stessa sintassi che usa Facebook con lo standard Open Graph. Nella visualizzazione anteprima del tool di Google, vengono mostrate entrambe.
  • struttura ( schemi e vocabolari ): è questo l’argomento spinoso, in effetti. Per ora il consiglio da dare è usare tutto quello presente su schema.org

In tutto questo, se volete un ottimo riassunto, SpazioDati ha fatto un video al Tedx di Brera che chiarirà le relazioni tra molti elementi oscuri ( Semantic Web, Linked Data e molto altro ).

Continua a leggere

Come qualcuno ha detto, noi italiani abbiamo fatto ponte il 2 giugno, ed invece il mondo del search sta riscrivendo il futuro della ricerca, partendo da basi interessanti.
I tre colossi dei motori, Google, Bing e Yahoo, hanno lanciato il progetto Schema.org:
-> Schema.org

Peccato che in Italia pochi abbiano visto la reale sinergia di quello che sta accadendo, e la maggior parte dei post sul tema siano semplici rilanci stampa del comunicato principale. ( Tranne per Guido Vetere che bacchetta gli autori di schema.org perchè forse così è stata definita un minimo di ontologia o schema globale, che tanto si diceva di non voler fare eh eh )
Da apprezzare Mauro Lupi, che sprona ad approfondire la questione, anche dal lato SEO, ed Il Post, che pone la questione all’attenzione di un pubblico più vasto del circolo tecnico. E che cita il fatto che, l’ultima volta che abbiamo avuto un accordo cross motori di ricerca, è stata la volta della creazione delle sitemap.xml, nel 2006. Una maniera condivisa di segnalare ai motori tutti i percorsi URL presenti nei nostri siti, che tanto ci facilitano oggi.
Un elemento non scontato. quindi quello dell’accordo tra motori.

Continua a leggere

E’ sabato, devo fare tante cose, ma questa merita 10 minuti per stendere un post, breve ma incisivo.
Una notizia storica, dai contorni poco definiti negli effetti per il Mercato, ma con un potenziale dirompente.

Un po’ come l’adozione degli standard del Semantic Web da parte di Facebook con l’ OpenGraph Protocol, e l’adozione di RDFa che è divenuta mainstream a livello di rich snippets, adesso si aprono scenari davvero intriganti.

Google ha acquisito Metaweb, società che gestisce tra le altre cose Freebase giusto per dare l’idea:
-> Tweet dell’acquisizione da parte di Google di Metaweb

Today we’ve acquired Metaweb. Working together we want to improve search, make web more meaningful. Details: http://bit.ly/dzrXmu

Alcuni della comunità del Semantic Web hanno scritto, e Tim O’Reilly in persona ha scritto:

RT @timoreilly: Google buys Metaweb. http://bit.ly/bnFEIP Important step in convergence of semweb and web 2.0 thinking. I like it.

La notizia mi è arrivata stanotte attraverso la mailing list del W3C dedicata al Semantic Web semantic-web@w3.org e al Linked Data public-lod@w3.org.
Ma anche attraverso Twitter vale la pena di guardare un attimo:
-> Ricerca di metaweb all’interno di Twitter

Anche Luca Conti ha rilanciato la cosa ed i primi italiani stanno iniziando a rilanciarla.
Ormai la strada è imboccata: adesso bisogna comprenderne i confini.

A casa di Google il post merita una lettura:
-> Deeper understanding with Metaweb

Ne prendo alcuni stralci:

Over time we’ve improved search by deepening our understanding of queries and web pages. **The web isn’t merely words—it’s information about things in the real world, and understanding the relationships between real-world entities can help us deliver relevant information more quickly. **Today, we’ve acquired Metaweb, a company that maintains an open database of things in the world. Working together we want to improve search and make the web richer and more meaningful for everyone.

With efforts like rich snippets and the search answers feature, we’re just beginning to apply our understanding of the web to make search better. Type [barack obama birthday] in the search box and see the answer right at the top of the page. Or search for [events in San Jose] and see a list of specific events and dates. We can offer this kind of experience because we understand facts about real people and real events out in the world. But what about [colleges on the west coast with tuition under $30,000] or [actors over 40 who have won at least one oscar]? These are hard questions, and we’ve acquired Metaweb because we believe working together we’ll be able to provide better answers.

Finalmente anche Google lascia definitivamente il concetto di pagine e di parole, delle care keywords, ed inizia a parlare di informazioni relative alle cose del mondo reale. E’ il Web my dear .)

Una chiusa finale: le persone chiave che lavoravano all’interno del gruppo del MIT a cui sono tanto affezionato, il gruppo SIMILE che ha rilasciato il framework Exhibit per gli open data e la loro visualizzazione, sono passate a Freebase da un anno abbondante o anche più. Adesso sono di fatto in Google.

Il potenziale diventa astronomico.
Questo post potrebbe farvi capire qualcosa ( già citato a casa di Gigi Cogo sul tema economia degli open data ):
-> Freebase Gridworks, Data-Journalism and Open Data Network Effects

Queste persone sono ora passate a Google, di fatto, con strumenti di questo tipo:

Freebase Gridworks 1.0 Overview from David Huynh on Vimeo.

**Il Web diventa semantico, si dota di significato e passa dalle pagine ai dati: e l’evoluzione del Web in senso lato è l’unica cosa che emergerà alla fine. Non più 2.0, non più 3.0: il Web al suo massimo potenziale, e niente più divisioni nette tra Web e Semantic Web. **
La divisione sarà nella persona che avrà consapevolezza di quello che potrà fare con il Web, ma il mezzo ormai avrà un solo nome :)

E questa cosa è culturale, non tecnologica.

Commenta e condividi

Foto dell'autore

Matteo Brunati

Attivista Open Data prima, studioso di Civic Hacking e dell’importanza del ruolo delle comunità in seguito, vengo dalle scienze dell’informazione, dove ho scoperto il Software libero e l’Open Source, il Semantic Web e la filosofia che guida lo sviluppo degli standard del World Wide Web e ne sono rimasto affascinato.
Il lavoro (dal 2018 in poi) mi ha portato ad occuparmi di Legal Tech, di Cyber Security e di Compliance, ambiti fortemente connessi l’uno all’altro e decisamente sfidanti.


Compliance Specialist SpazioDati
Appassionato #CivicHackingIT


Trento