Molti ormai sono abituati ad usare i tags per catalogare in modo piu’ semplice e intuitivo i propri contenuti…

Premessa: questo post prevede la conoscenza di RDF e delle ontologie, almeno a livello teorico, ma puo’ essere uno spunto per quelli curiosi: e’ quindi un post tecnico

Il problema nasce quando i tags iniziano ad essere molti e gestiscono in realta’ un’area della conoscenza, per non parlare delle lingue e dei sinonimi che entrano in gioco…

In breve c’e’ un doppio problema:

  • uno di natura semantica e linguistica: il fatto che io possa usare il tag apple per indicare la ditta mentre un altro possa indicare il frutto e una cosa non del tutto scontata quale la lingua in cui e’ scritto il tag…
  • gestire i sinonimi impliciti per i tags… iniziare a gestirli con il loro significato ed evitare doppie presenze.. esempio tecnologia e tecnologie per indicare la medesima cosa

Partiamo da un caso pratico: questo blog e’ dotato di tags… ma il loro uso e’ limitato e voglio provare a potenziarlo:

  • gestire la lingua e la collisione sintattica
  • avere un backend di RDF che gestisca il tutto

Questo chiaramente in chiave di gestire tutto il sito anche semanticamente, oltre che per i lettori umani ( in forma testuale semplice, quale e’ adesso ).

Il primo passo in effetti e’ trasformare il feed RSS1 ( totalmente RDF ) potenziandolo con il modulo per le taxonomies inserendo appunto i tags locali e le categorie per indicare gia’ nel feed il contesto dei posts… ( questa parte verra’ discussa in un post futuro ).

Il passo successivo e’ usare un datastore RDF locale per salvare in un sol colpo questo RSS potenziato con tutti i posts del blog e creare un cron giornaliero che aggiorni tale datastore.

Continua a leggere

Fino ad ora per le masse l’uso di RDF non e’ stato elevato, tanto piu’ che il suo cavallo di battaglia, RSS e’ stato diviso e frammentato in due- tre versioni solamente XML-compliant e non RDF…

Ritenuto a torto o a ragione troppo complicato…

Comunque volevo segnalare una interessante iniziativa alla quale stavo pensando anch’io…
Come utenti di feeds RSS iniziamo ad averne diversi associati alla nostra persona ( filckr per le foto, del.icio.us o altri per i nostri link, il nostro blog personale ) e bisognerebbe avere un modo univoco per collegare a noi queste risorse e unirle…
e cosa non usare di meglio se non le potenzialita’ di RDF?

Purtroppo a mio parere tutti sono fissati con creare alfabeti XML per fare cose che usando RDF sarebbero meglio gestite: prendiamo il NEUTRINO XML:

A Neutrino feed is a collection of pointers to other syndication feeds - say, a blog, Flickr and Del.icio.us - all of which belong to one individual. It’s essentially indirection for feeds - point someone at your Neutrino feed and they can then discover your blog feed, your Flickr feed, your Del.icio.us feed, and anything else you care to include which you publish and can be syndicated.

L’idea non e’ male, ma fatta con RDF sarebbe molto meglio…

A breve ho intenzione di unire tutte le risorse collegate che uso in un unico modello RDF accessibile anche via HTTP RDF API per essere interrogato: la chiave del Semantic Web e’ infatti nell’avere informazioni accessibili in modo automatico anche da agenti software che le usano per i propri scopi in modo trasparente… proviamo questa cosa, no? :)

Immaginiamo di avere un unico punto di riferimento dal quale parlare dei contenuti del nostro sito e dei contenuti che in qualche modo si legano al nostro sito, in modo da essere comprensibili sia da noi come persone sia dalle macchine… e rendere talmente aperti questi dati che non servira’ piu’ re-inserirli in altri siti o in altri nostri dispositivi ( cellulari, palmari, portatili )
Non e’ noioso dover re-inserire dati a seconda del sito in cui siamo e che non riesca a prelevarli in modo automatico?

Ovviamente la questione importante in questo contesto e’ la sicurezza: dall’autenticazione di questi dati alla gestione della nostra privacy.. ma ne riparleremo…

Questa cosa ho visto in giro che a molti sta interessando, vediamone alcuni approcci:

-> Introducing Adactio Elsewhere
Un’esigenza ormai molto comune…

I mentioned a little while back that there seems to be more and more bits of me scattered around the internet. My photos are on Flickr, my wishlist is on Amazon, my links are on Del.icio.us and my events are on Upcoming.

I’ve been working on a way of pulling these pieces together. This is what I’ve come up with: Adactio Elsewhere.

All of those sites I mentioned have something in common. They all provide APIs. I like the idea of using each API to display the different services in a combined way.

Se la volete vedere in azione e’ qui:

-> http://elsewhere.adactio.com/

A mio parere l’idea e’ molto buona e anche come e’ stata sviluppata: ma io sarei partito da una cosa diversa.. nel senso che questo e’ un collante che collega i dati posti in questi servizi tramite le API disponibili nei servizi stessi…

Ma sono invece completamente d’accordo su questo:

I had a lot of fun making this little app.
At times, I was positively grinning with glee as I programmed the latest addition. I really enjoyed being able to use so many different technologies at one time: PHP5, Web Services, XML, XSL, OPML, RSS, JavaScript, DOM Scripting, Ajax, XHTML and CSS.
Personal projects like this really help me get to grips with ins and outs of technologies that will come in useful on commercial work.

Quello che vorrei io invece e’ lavorare sui dati in LOCALE prelevati dai siti di servizio e centralizzarli sul mio sito.. tramite RDF… e ovviamente aggiornandoli continuamente…

Vedremo cosa ne esce fuori…

Commenta e condividi

Questo post vuole essere un iniziale accenno all’uso di XML e dei cosiddetti Microformats all’interno dei blogs: una tendenza che si sta sviluppando per riuscire a creare quel “web of data“ futuro del web attuale e passato.

In realta’ da quel poco che ho visto in pratica l’uso di questi formati XML all’interno del testo semplice e’ se vogliamo un passo semplicistico di quello che ci offrira’ il Semantic Web
Il problema maggiore e’ che per usare e capire il Semantic Web ci vuole tempo, risorse e formalita’… per non parlare che per la massa non e’ ancora facile iniziare ad usarlo e gli strumenti si stanno facendo strada in questo momento…

La comunita’ quindi ha risposto introducendo i tags e questi formati basati su XML, che vogliono potenziare il testo semplice senza la difficolta’ d’uso dei livelli superiori a XML: chiaramente ci sono lati positivi e negativi nel fare questo.

Comunque giusto per iniziare volevo segnalare un link:

-> Beyond Text

Vediamone un estratto:

The basic idea is to go beyond “mere” text in blogs and include structured XML that describes job-openings, events, new prices, press releases, updates to phone numbers and contact info, requests for proposals, etc. i.e. Using the now almost ubiquitous content syndication network to broadcast useful business data – not just prose or text commentaries.

Questo significa usare la potenzialita’ della syndication, e quindi degli RSS per segnalare eventi e cose simili oltrepassando i semplici commenti e notizie, usando XML.

E ancora: parlando delle direzioni del blogging…

Future developments: Convergence with web search, Mutimedia, functional RSS feeds for more than just news, Richer blogging tools, more sharing and social networking features.

Indicatori delle direzioni che si possono dare ai contenuti: non dimentichiamoci infatti che l’origine degli RSS e della syndication altro non e’ che i famosi “canali” di Microsoft Explorer 5… l’idea di offrire qualcosa di broadcasting simile a quello che accade per la televisione…

Probabilmente idea finita male per i tempi: la Rete costava e non c’era l’ADSL ancora qui in Italia e nessuno voleva qualcosa di simile alla tv…

L’idea e’ rimasta ed e’ stata modificata…

Giusto per inciso in questo blog ho installato un plugin che gestisce le recensioni dei libri e dei film seguendo un formato basato su XML:

-> What is Structured Blogging?
e questa e’ la spiegazione:

Structured blogging is about making a movie review look different from a calendar entry. On the surface, it’s as simple as that - formatting blog entries around their content.

On another level, it’s a bit more complicated -** what we want to do is create structure (in the form of XML) around each of these types of entries, to organize the data inside and to let machine readers** - other programs, sites, and aggregators -** better understand the content**.

Questo per inciso e’ proprio lo scopo del Semantic Web:

fare in modo che le macchine siano in grado di dialogare ad un livello base autonomamente alleggerendo il nostro lavoro e capendo un po’ di piu’ i contenuti che stanno gestendo…

Riferimenti:

-> Beyond Text
-> What is Structured Blogging?
-> Dal web statico al web semantico
-> microformats

Commenta e condividi

Foto dell'autore

Matteo Brunati

Attivista Open Data prima, studioso di Civic Hacking e dell’importanza del ruolo delle comunità in seguito, vengo dalle scienze dell’informazione, dove ho scoperto il Software libero e l’Open Source, il Semantic Web e la filosofia che guida lo sviluppo degli standard del World Wide Web e ne sono rimasto affascinato.
Il lavoro (dal 2018 in poi) mi ha portato ad occuparmi di Legal Tech, di Cyber Security e di Compliance, ambiti fortemente connessi l’uno all’altro e decisamente sfidanti.


Compliance Specialist SpazioDati
Appassionato #CivicHackingIT


Trento