In tema di query SPARQL: un esempio usando Dbpedia

13 nov 2007 in Semantic Web

[ _altro post mediamente tecnico e non lungo .) _]

Visto che mi sento in tema di esempi di applicazione del Semantic Web, in confronto a tecniche consolidate di text-mining e di ricerca, ho scovato un altro esempio very cool, che stavolta non faro’ direttamente io pero’.

Mi sembrava particolarmente significativo.

-> Querying DBpedia - And looking forward to more.

Per chi non lo sapesse, Dbpedia e’ uno dei progetti di maggior successo nel far arrivare alla massa il significato e i reali vantaggi che il Semantic Web porta con se’. [ ne avevo parlato un po’ tempo fa ]

-> DBpedia.org

DBpedia is a community effort to extract structured information from Wikipedia and to make this information available on the Web. DBpedia allows you to ask sophisticated queries against Wikipedia and to link other datasets on the Web to Wikipedia data.

Bob sta cercando di visionare tutte le possibili scritte che Bart Simpson ha dovuto scrivere alla lavagna a scuola, nella serie dei Simpsons. Non e’ una domanda banale, direi.

Instead of a “Hello World” example, I went with more of an “I will not publish the principal’s credit report” example: a list of things written by Bart on the school blackboard at the beginning of a collection of Simpsons episodes.

La parte piu’ complessa a cui deve andare incontro per formulare la query in SPARQL e’ capire come vengono identificate le risorse di cui ha bisogno: cioe’ che URI usare per identificare Bart Simpson, per identificare la lavagna e qualcosa per la serie o almeno una delle serie del cartone animato.

Once I knew the following three things, I could create the SPARQL query:
The Simpson episode Wikipedia pages are the identified “things” that we would consider as the subjects of our RDF triples (or, put another way, as the objects in the {object, attribute name, attribute value} triplets that contain our data).
The bottom of the Wikipedia page for the “Tennis the Menace” episode tells us that it is a member of the Wikipedia category “The Simpsons episodes, season 12”.
The episode’s DBpedia page tells us that p:blackboard is the property name for the Wikipedia infobox “Chalkboard” field.

Questo perche’ nel mondo di RDF tutto e’ almeno una TRIPLA di informazione, dove ogni componente puo’ essere un URI, un modo univoco di identificare qualcosa.
Questo e’ ancora lo scoglio piu’ grande in effetti, da rendere trasparente per l’utente medio, per capire come chiedere qualcosa al sistema.

Ma, se ci pensiamo, non e’ un problema da poco identificare qualcosa a livello non ambiguo, e a livello mondiale.
E’ vero che ci sono piu’ modi per identificare la stessa cosa, e ognuno puo’ usare il suo, a patto che dica che quel modo e’ equivalente ad un altro gia’ conosciuto, in modo da potersi gestire con la transitivita’ della referenza che si sta facendo. [ owl:sameAs docet ]

Ma su questo ci torneremo. ( un dibattito durato parecchio sulla questione delle URI, qc ne avevo accennato tempo fa, molto per fortuna e’ cambiato in meglio, stay tuned ).

Continua a leggere

Identita' semantiche, Linked Data e Social Graph...

02 nov 2007 in Semantic Web

Dopo le recenti discussioni intraprese sulla gestione della propria identita’ digitale ( fatto un passo avanti a partire da questo post ), e del proprio Social Graph, sto preparando e completando alcuni tasselli per i miei passi successivi… ( alcuni anche in corso d’opera da questo post )

Aggiornato il profilo FOAF con le persone che ho conosciuto direttamente nei miei giri per l’Italia di quest’anno, tra barcamp e aperitivi vari e il progetto Metafora, che mi entusiasma sempre piu’…

Oltre al fatto che ho completato il settaggio del profilo con le direttive emerse nel Linked Data tutorial, che consiglio di leggere davvero attentamente, e’ assolutamente imperdibile. ( un esempio su tutti, i link presenti rispetto ai miei interessi puntano tutti a risorse sotto il progetto Dbpedia )

Ok, direte voi, ma questa e’ una cosa tecnica: proviamo pero’ ad iniziare un viaggio di consapevolezza verso il mondo del FOAF e della sua malleabilita’. Da esempi e piccoli spunti di utilizzo…

Emerge subito una decisa divisione tra PRESENTAZIONE e CONTENUTO. Principio tanto ripetuto nel web design, quanto incompreso molte volte.
Una piccola prova con alcune diverse visualizzazioni da parte di browsers RDF generici, oppure orientati a vedere proprio il FOAF:

Versione piu’ recente e potente: lo Zitgist Browser dell’amico Frederick Giasson
una versione a triple di informazione, con il Disco Browser del progetto Dbpedia

Il file contenente i dati e’ il medesimo, ma a seconda del servizio che si usa, o che vogliamo creare, quegli stessi dati possono essere renderizzati ed interrogati, aggregati e filtrati, come si vuole…
Ma il sistema e’ decentrato: sono gli altri servizi che raccolgono e aggiornano il singolo dato dal mio: distribuzione decentrata del MIO dato sui ALTRUI servizi… Scusate se e’ poco.

Dovrebbe valere cosi’ anche per molte altre cose… ( _energia in primis, dico io, ma stiamo divagando… _)

Aggiungiamo poi una questione tecnica di gestione della Content Negotation del file RDF [ alla meta’ di questo post un ottimo quadro della negoziazione dei contenuti ]: in parole povere quando noi con il browser chiediamo una risorsa, entrambe le parti ( il nostro browser e il web server che ospita tale risorsa ) si scambiano i formati che accettano e, secondo una scaletta di priorita’, lo scambio avviene con certi formati in tal modo condivisi.

Questo aspetto merita prove e post apposito, pero’… [ oltre al fatto che devo vedere meglio come renderla, ci sono idee discordanti al riguardo ]

Si puo’ provare l’effetto, sorpassando l’ostacolo della Content Negotation che dovro’ risolvere, installando il plugin del Tabulator di Sir Tim Berners Lee, che spalanca le possibilita’ di navigazione del browser…

The Tabulator Extension is an extension for Firefox that provides a human-readable interface for linked data. It is based on the Tabulator, a web-based interface for browsing RDF. Using Tabulator’s outline mode, query views, and back-end code, the Tabulator Extension integrates the browsing of linked data directly into the Firefox browser, making for a more natural and seamless experience when browsing linked data on the Web.

Dal Web di Documenti al Web di Dati.
Web of Data .)

Ne sono entusiasta, al pari di Danny, che non ha tutti i torti .)

After a few moments wondering what danbri had been smoking, I realised I was now browsing data. The Tabulator also allows editing of online data (through SPARQL update), which is intensely cool, though I didn’t have any joy with the demo Wiki.

Ho accennato all’inizio al discorso del Social Graph: tema di un altro post e di esempi ben piu’ forti e lampanti… [ qualcosa inerente anche a LinkedIn e all’importanza di FOAF ]

Qc idea casuale a braccio:il profilo FOAF contiene i servizi Web che utilizzo maggiormente, se inserisco poi come un rdf:SeeAlso anche i feed associati ad ogni servizio, posso facilmente aggregare poi via una query SPARQL le fonti che piu’ mi interessano e farne un mashup personale del flusso informativo… (work in progress )
Per poi iniziare a costruire qualcosa di interessante…

Una parte del LifeStream che si accennava qua e la’, insomma…
Terreno di prossimi esperimenti…

Being digital, diceva Granieri: impariamo a prenderci del tempo come esseri umani e lasciare gli automatismi alle macchine…

Semantic Web in progress

Commenta e condividi

In tema di query SPARQL: un esempio usando Dbpedia

Identita' semantiche, Linked Data e Social Graph...

Matteo Brunati