[ crosspost su VoIT ]

Delle folksonomies e dell’uso dei tags ormai tutti o quasi ne siamo consapevoli: il problema e’ che oltre un certo limite quest’uso inizia a risultare difficoltoso…
[ altre info su alcune mie sperimentazioni che devo completare… ]

Partiamo da un caso personale: il mio uso quotidiano di Del.icio.us

Prima degli ultimi cambiamenti significativi, inserivo tags che mi sembravano vicini al tema trattato sul link che volevo salvare, ma era facile sia scriverlo sbagliato che magari usare sinonimi per termini e concetti che avevo gia’ usato prima…

Insomma non avevo un’idea chiara di quello che avevo usato precedentemente e magari usavo termini quali_ semweb, semantic, SemanticWeb_ per indicare la stessa cosa: in questo modo disperdevo la potenza intrinseca dei tags…

Poi fortunatamente e’ stata aggiunta la possibilita’ di vedere tutti i propri tags e di sceglierli per inserirli nel nuovo link che stavamo aggiungendo: era una soluzione splendida per un problema semantico.

Ci si appoggia all’intelligenza umana dell’utente per eliminare problemi non facili da gestire in modo automatico: un approccio vincente direi, e semplice da implementare.

Tagyu: un nuovo servizio sociale

Ho trovato in questo contesto un nuovo servizio:
-> Tagyu

Tagyu is a hosted service that automates the process of creating document metadata by discovering what keywords, tags, and categories are relevant for a document.
Instead of relying on machine learning to understand what a document is about, Tagyu uses human intelligence.
Tagyu harnesses the collective wisdom that is already present in your documents to categorize your other text.

Lo sto usando da pochi momenti, ma ad occhio usa lo stesso approccio: facilita l’aggregazione di informazioni gia’ disponibili su un dato contenuto e suggerisce i possibili tags che si possono usare, in base alle scelte fatte da UTENTI precedenti.

Per capire meglio quello che fa, qualche stralcio dalle FAQ:

Tagyu suggests tags for your content. Give it a URL or some text, and it will give you some suggestions for tags.

How does it work?

Tagyu compares your text to things that other people have written and how they’ve tagged it. It uses that information to pick some tags that seem appropriate. I thought about having Tagyu suggest inappropriate tags, but I don’t really need the lawsuits.

Direi notevole: sia nell’idea che nella trasparenza offerta all’utente…

Da capire come si possa migliorare usando tecnologie semantiche: anche se a livello implementativo sarei curioso di vedere come funziona, magari gia’ le usa….

Comunque sia offre delle API attraverso un REST service che danno un file XML con le suggestions dei tags, magari uno dei prox giorni le provo…

In modo del tutto simile alle API di del.icio.us …

Verso l’Automatic Tagging?

In effetti il tagging manuale su base utente, anche grazie a tool del genere potra’ essere facilitato e diventare trasparente per l’utente abituale: ma possibile che alcune tecnologie semantiche non possano essere perfezionate per fare le stesse cose?

-> Automatic Tagging of micro contents

E’ un post da leggere assolutamente, con ottime risorse per approfondire la questione.

Intanto mi ha colpito una parte in particolare:

For newly developed Semantic Web resources, such annotation can be done manually or by help of sophisticated authoring tools.
However, it is not practical to semantically annotating existing Web pages due to the gigantic amount of them.
To bridge the gap between the Semantic Web and the World Wide Web, we propose a machine learning approach to automatically generate semantic markups for traditional Web pages. The proposed method applies the self-organizing map algorithm to cluster training Web pages and conducts a text mining process to discover the words to be tagged and their semantic descriptions.
Preliminary experiments show that our method may successfully generate semantical markups for the Web pages.

http://blog.delaranja.com/?p=393

Insomma di cose interessanti, e sulle quali riflettere, ce ne sono parecchie direi…