Archivio tag: google

Dati strutturati in Google: quali recepisce? Schema.org, RDFa e microdati

Cercando un po’ in giro per la Rete, ho provato a vedere quali vocabolari vengono interpretati correttamente dallo strumento recente di parsing dei dati strutturati di Google, per iniziare a chiarirmi le idee.
Per far comprendere l’argomento ai neofiti, basta ricordarsi di due elementi per quanto riguarda il dato strutturato:

  • sintassi: ad oggi ci sono diversi modi per far digerire a Google dei dati strutturati nella propria pagina, ma questo per ora non sembra un problema. La sintassi consigliata è quella dei microdati, una modalità semplificata non ancora standard, nativa della specifica HTML5. L’altra alternativa è usare RDFa ( specie la sua ultima versione RDFa Lite 1.1 ), la stessa sintassi che usa Facebook con lo standard Open Graph. Nella visualizzazione anteprima del tool di Google, vengono mostrate entrambe.
  • struttura ( schemi e vocabolari ): è questo l’argomento spinoso, in effetti. Per ora il consiglio da dare è usare tutto quello presente su schema.org

In tutto questo, se volete un ottimo riassunto, SpazioDati ha fatto un video al Tedx di Brera che chiarirà le relazioni tra molti elementi oscuri ( Semantic Web, Linked Data e molto altro ).

Tornando a qualche esempio pratico, passiamo agli screenshot, recuperato cercando rich snippets con Google Images:

Questa poi merita ancor di più per il volume di vocabolari citati:

Diversi elementi per Google Dati Strutturati

Diversi elementi per Google Dati Strutturati

Continua a leggere

Schema.org ovvero un Web un po’ strutturato per andare oltre al SEO, verso il Semantic Web

Come qualcuno ha detto, noi italiani abbiamo fatto ponte il 2 giugno, ed invece il mondo del search sta riscrivendo il futuro della ricerca, partendo da basi interessanti.
I tre colossi dei motori, Google, Bing e Yahoo, hanno lanciato il progetto Schema.org:
-> Schema.org

Peccato che in Italia pochi abbiano visto la reale sinergia di quello che sta accadendo, e la maggior parte dei post sul tema siano semplici rilanci stampa del comunicato principale. ( Tranne per Guido Vetere che bacchetta gli autori di schema.org perchè forse così è stata definita un minimo di ontologia o schema globale, che tanto si diceva di non voler fare eh eh )
Da apprezzare Mauro Lupi, che sprona ad approfondire la questione, anche dal lato SEO, ed Il Post, che pone la questione all’attenzione di un pubblico più vasto del circolo tecnico. E che cita il fatto che, l’ultima volta che abbiamo avuto un accordo cross motori di ricerca, è stata la volta della creazione delle sitemap.xml, nel 2006. Una maniera condivisa di segnalare ai motori tutti i percorsi URL presenti nei nostri siti, che tanto ci facilitano oggi.
Un elemento non scontato. quindi quello dell’accordo tra motori.

Partiamo con Mauro Lupi:
-> Uno Schema per usare i contenuti dei siti come strumento di risposta

Sicuramente si tratta di lavoro aggiuntivo per webmaster e publisher online, ma se l’obiettivo è quello di risultare maggiormente rilevanti e pertinenti ai motori di ricerca, lo sforzo potrebbe essere ampiamente premiato.

È altresì evidente che tale sistema accelera la direzione intrapresa dai motori di ricerca di passare da catalogatori di siti a fornitori di risposte

E’ affascinante fare una riflessione puntuale su quanto è successo attorno al tema schema.org, perchè coinvolge aspetti tecnologici legati al Web of Data ed al Semantic Web, e al futuro del SEO per come è stato inteso fino ad oggi. Unisco le mie reti sociali, nel fare questo: quelle legate al mondo Semantic Web e quelle legate al mondo del Web Marketing.
Non a caso sono un fervente sostenitore dell’esistenza del Data Web Marketing .)

Provo a fare un po’ di luce a livello generale.
Si tratta di Web strutturato, di Internet of things e di aver semplificato ( perdendo dettagli non poco importanti ) la tecnologia per facilitarne la diffusione.
Anche se sono presenti certi ricorsi storici davvero inaspettati, dopo anni di discussioni e di confronti anche aspri tra chi pensava, come Google, che le parole chiave e gli algoritmi bastino alla gestione della conoscenza, e chi invece cercava modalità aperte per strutturare almeno un po’ tutto quello che si mette online. Per una gestione del sovraccarico informativo un attimo più evoluta, e più gestibile.

La sintesi più completa ed accurata, che per molti versi ha già scritto quello che penso, si può trovare a questo link, che in parte completa e definisce quello accennato da Mauro Lupi:
-> What Schema.org Means for SEO and Beyond

In generale, credo sia utile una sintesi dei miei tweet sul tema, densi di fonti che meritano attenzione e del tempo per rifletterci su, via lo splendido servizio Storify:


Continua a leggere

Il Web e il Semantic Web iniziano a fondersi: è il Web che evolve. Google acquisisce Metaweb e Freebase

E’ sabato, devo fare tante cose, ma questa merita 10 minuti per stendere un post, breve ma incisivo.
Una notizia storica, dai contorni poco definiti negli effetti per il Mercato, ma con un potenziale dirompente.

Un po’ come l’adozione degli standard del Semantic Web da parte di Facebook con l’ OpenGraph Protocol, e l’adozione di RDFa che è divenuta mainstream a livello di rich snippets, adesso si aprono scenari davvero intriganti.

Google ha acquisito Metaweb, società che gestisce tra le altre cose Freebase giusto per dare l’idea:
-> Tweet dell’acquisizione da parte di Google di Metaweb

Today we’ve acquired Metaweb. Working together we want to improve search, make web more meaningful. Details: http://bit.ly/dzrXmu

Alcuni della comunità del Semantic Web hanno scritto, e Tim O’Reilly in persona ha scritto:

RT @timoreilly: Google buys Metaweb. http://bit.ly/bnFEIP Important step in convergence of semweb and web 2.0 thinking. I like it.

La notizia mi è arrivata stanotte attraverso la mailing list del W3C dedicata al Semantic Web e al Linked Data.
Ma anche attraverso Twitter vale la pena di guardare un attimo:
-> Ricerca di metaweb all’interno di Twitter

Anche Luca Conti ha rilanciato la cosa ed i primi italiani stanno iniziando a rilanciarla.
Ormai la strada è imboccata: adesso bisogna comprenderne i confini.

A casa di Google il post merita una lettura:
-> Deeper understanding with Metaweb

Ne prendo alcuni stralci:

Over time we’ve improved search by deepening our understanding of queries and web pages. The web isn’t merely words—it’s information about things in the real world, and understanding the relationships between real-world entities can help us deliver relevant information more quickly. Today, we’ve acquired Metaweb, a company that maintains an open database of things in the world. Working together we want to improve search and make the web richer and more meaningful for everyone.

With efforts like rich snippets and the search answers feature, we’re just beginning to apply our understanding of the web to make search better. Type [barack obama birthday] in the search box and see the answer right at the top of the page. Or search for [events in San Jose] and see a list of specific events and dates. We can offer this kind of experience because we understand facts about real people and real events out in the world. But what about [colleges on the west coast with tuition under $30,000] or [actors over 40 who have won at least one oscar]? These are hard questions, and we’ve acquired Metaweb because we believe working together we’ll be able to provide better answers.

Finalmente anche Google lascia definitivamente il concetto di pagine e di parole, delle care keywords, ed inizia a parlare di informazioni relative alle cose del mondo reale. E’ il Web my dear .)

Una chiusa finale: le persone chiave che lavoravano all’interno del gruppo del MIT a cui sono tanto affezionato, il gruppo SIMILE che ha rilasciato il framework Exhibit per gli open data e la loro visualizzazione, sono passate a Freebase da un anno abbondante o anche più. Adesso sono di fatto in Google.

Il potenziale diventa astronomico.
Questo post potrebbe farvi capire qualcosa ( già citato a casa di Gigi Cogo sul tema economia degli open data ):
-> Freebase Gridworks, Data-Journalism and Open Data Network Effects

Queste persone sono ora passate a Google, di fatto, con strumenti di questo tipo:

Freebase Gridworks 1.0 Overview from David Huynh on Vimeo.

Il Web diventa semantico, si dota di significato e passa dalle pagine ai dati: e l’evoluzione del Web in senso lato è l’unica cosa che emergerà alla fine. Non più 2.0, non più 3.0: il Web al suo massimo potenziale, e niente più divisioni nette tra Web e Semantic Web.
La divisione sarà nella persona che avrà consapevolezza di quello che potrà fare con il Web, ma il mezzo ormai avrà un solo nome :)

E questa cosa è culturale, non tecnologica.