[ _altro post mediamente tecnico e non lungo .) _]

Visto che mi sento in tema di esempi di applicazione del Semantic Web, in confronto a tecniche consolidate di text-mining e di ricerca, ho scovato un altro esempio very cool, che stavolta non faro’ direttamente io pero’.

Mi sembrava particolarmente significativo.

-> Querying DBpedia - And looking forward to more.

Per chi non lo sapesse, Dbpedia e’ uno dei progetti di maggior successo nel far arrivare alla massa il significato e i reali vantaggi che il Semantic Web porta con se’. [ ne avevo parlato un po’ tempo fa ]

-> DBpedia.org

DBpedia is a community effort to extract structured information from Wikipedia and to make this information available on the Web. DBpedia allows you to ask sophisticated queries against Wikipedia and to link other datasets on the Web to Wikipedia data.

Bob sta cercando di visionare tutte le possibili scritte che Bart Simpson ha dovuto scrivere alla lavagna a scuola, nella serie dei Simpsons. Non e’ una domanda banale, direi.

Instead of a “Hello World” example, I went with more of an “I will not publish the principal’s credit report” example: a list of things written by Bart on the school blackboard at the beginning of a collection of Simpsons episodes.

La parte piu’ complessa a cui deve andare incontro per formulare la query in SPARQL e’ capire come vengono identificate le risorse di cui ha bisogno: cioe’ che URI usare per identificare Bart Simpson, per identificare la lavagna e qualcosa per la serie o almeno una delle serie del cartone animato.

Once I knew the following three things, I could create the SPARQL query:

  • The Simpson episode Wikipedia pages are the identified “things” that we would consider as the subjects of our RDF triples (or, put another way, as the objects in the {object, attribute name, attribute value} triplets that contain our data).
  • The bottom of the Wikipedia page for the “Tennis the Menace” episode tells us that it is a member of the Wikipedia category “The Simpsons episodes, season 12”.
  • The episode’s DBpedia page tells us that p:blackboard is the property name for the Wikipedia infobox “Chalkboard” field.

Questo perche’ nel mondo di RDF tutto e’ almeno una TRIPLA di informazione, dove ogni componente puo’ essere un URI, un modo univoco di identificare qualcosa.
Questo e’ ancora lo scoglio piu’ grande in effetti, da rendere trasparente per l’utente medio, per capire come chiedere qualcosa al sistema.

Ma, se ci pensiamo, non e’ un problema da poco identificare qualcosa a livello non ambiguo, e a livello mondiale.
E’ vero che ci sono piu’ modi per identificare la stessa cosa, e ognuno puo’ usare il suo, a patto che dica che quel modo e’ equivalente ad un altro gia’ conosciuto, in modo da potersi gestire con la transitivita’ della referenza che si sta facendo. [ owl:sameAs docet ]

Ma su questo ci torneremo. ( un dibattito durato parecchio sulla questione delle URI, qc ne avevo accennato tempo fa, molto per fortuna e’ cambiato in meglio, stay tuned ).

Continua a leggere

Parlando sempre di Social Network, di LifeStream e via dicendo…

Proviamo qualche piccola idea sul Semantic Web, tanto per cambiare .)

Partiamo da un caso pratico, utile per fare degli step su alcuni argomenti che vorrei affrontare nel prossimo futuro…
Anche per iniziare a sondare qualche reale vantaggio derivato dall’utilizzo di tali tecnologie.

Se una persona volesse capire che account utilizzo online, come Matteo Brunati ad esempio.

Usando Google

Con Google potrebbe fare due cose:

Ora, tra l’altro, nella prima ipotesi non e’ detto che venga fuori del tutto un quadro veriterio e completo, perche’ non sono informazioni che io posso controllare….
Sono informazioni derivate, se ho omonimi o qualcuno che si spaccia per me, non e’ certo un quadro attendibile.

Per quanto riguarda la seconda voce, emerge una pagina, ClaimID.net, che e’ la versione con i microformati del mio profilo.
E’ sempre un account, ma e’ un ponte tra il livello senza struttura e il livello totalmente semantico, che e’ il profilo FOAF.

Una specie di passaggio intermedio, che dona piu’ struttura alle informazioni libere che Google indicizza tutti i giorni.

( al momento la terza voce e’ solo semantica, quindi per le macchine: ne faro’ una versione umana di mia scelta a breve )

Se invece avessi un modo di definire in forma comprensibile dalle macchine, e rappresentabile anche in forma piu’ umana, tutto questo? E quindi di poter permettere risposte piu’ attendibili alle domande che poniamo?

Continua a leggere
  • pagina 1 di 1
Foto dell'autore

Matteo Brunati

Attivista Open Data prima, studioso di Civic Hacking e dell’importanza del ruolo delle comunità in seguito, vengo dalle scienze dell’informazione, dove ho scoperto il Software libero e l’Open Source, il Semantic Web e la filosofia che guida lo sviluppo degli standard del World Wide Web e ne sono rimasto affascinato.
Il lavoro (dal 2018 in poi) mi ha portato ad occuparmi di Legal Tech, di Cyber Security e di Compliance, ambiti fortemente connessi l’uno all’altro e decisamente sfidanti.


Compliance Specialist SpazioDati
Appassionato #CivicHackingIT


Trento