Casual.info.in.a.bottle

Semantic Web, Linked Data, and Web Science con spicchi di economia della conoscenza by Matteo Brunati

Grafi e Web: qualche considerazione…

Posted on | giugno 17, 2005 |

Per quelli che hanno fatto percorsi scientifici la teoria dei grafi risulta familiare, ed e’ alla base di Internet in effetti..

La Rete ha una topologia a grafo e la sua metastruttura formata di links e’ di fatto un grafo immane: applicando alla Rete le teorie dei grafi si puo’ studiare la Rete stessa…

[ immagine tratta da Wikipedia ]

Non dimentichiamo che poi il principio base del funzionamento di Google usa proprio l’dea che un nodo ( quindi un sito ) e’ tanto piu’ importante tanto il numero di archi in arrivo su di esso ( links che lo linkano e ne aumentano la popolarita’ )

Volevo segnalare un interessante articolo di ApogeoOnLine:
-> Teoria dei grafi e Web: una teoria matematica applicata al WWW

Per chi non lo sapesse ecco cosa sono i grafi:

Le strutture a grafo constano di un insieme di punti (o nodi) che possono essere connessi da collegamenti (archi): il numero di archi per punto costituisce il “grado” di un nodo.
Una grande varietà di sistemi naturali e artificiali è rappresentabile attraverso questo genere di astrazione (il Web come un insieme di pagine e contenuti connessi da hyperlinks).

Una cosa notevole e’ che lo svilupparsi e l’evoluzione stessa del sistema Web in generale e’ legata molto alle teorie dei grafi: consideriamo che RDF stesso come meta-modello e’ un grafo, ( grafo orientato per essere precisi )…e lo sviluppo del Semantic Web stesso passa attraverso studi dei grafi, come dice l’alrticolo stesso…

Semantic Web e Web Trust hanno del resto bisogno di definire e spiegare il funzionamento dei rapporti che regolano l’instradamento di dati e informazioni attraverso il WWW, di costruirne una topologia utilizzabile per scopi diversi, ma complementari: un modello matematico fornisce un’astrazione stilizzata, sostenuta da formule, per rappresentare, nel suo insieme o nel particolare, il Sistema.

La cosa particolarmente interessante e’ che il modello RDF ha come assunzione di non essere totalizzante: nel senso che si basa su un’assunzione di “open world“… cioe’ tutto quello che si dice di una determinata risorsa non e’ detto che sia tutto quello che si possa dire su di essa…

E’ questa a mio avviso la caratteristica fondamentale di successo di un tale modello: l’umilta’ di non essere onnisciente…
E questa e’ la chiave anche della sua mantenibilita’ e della sua capacita’ di integrarsi con altre risorse grazie all’uso dei namespaces…

Riprendendo l’articolo si parla poi di due caratteristiche delle reti che in qualche modo coinvolgono e modellano il Web: la presenza di sottoreti sociali e la Rete come forma di nodi aristocratici…

Tra queste, la conformazione Small World (tipica dei sistemi sociali), per cui esistono sistemi a grafo dalla struttura regolare, ma che presentano un certo numero di “scorciatoie” che garantiscono il passaggio da un “ambiente” a un “altro”, saltando più o meno passaggi. Si tratta di una proprietà evidentemente riscontrabile nel Web, in cui gli hyperlinks svolgono la funzione di “porte dimensionali”, consentendo l’annullamento o il restringimento delle distanze.

I links sono quindi un elemento di primaria importanza nello sviluppo della Rete, mentre i nodi hanno questa caratteristica:

Un’altra proprietà presente in molti casi di grafi reali è quella dell’ “autosimilarità del grado di un vertice”, che stabilisce come non esista un valore caratteristico per questa grandezza: al contrario, si può riscontrare ogni valore (da molto piccolo a molto grande) all’interno del sistema.
Dallo studio di casi reali, emerge tuttavia una regola particolare, per cui esistono una miriade di punti terminali con pochi collegamenti e un numero piccolo di grandi siti centrali, secondo una distribuzione a potenza dei gradi: è il caso del Web, Rete aristocratica in cui sono presenti pochi nodi di grande importanza.

Sembra difficile, ma in realta’ il fatto e’ questo: il divario tra siti famosi e siti piccoli e’ che i siti famosi e popolari tendono ad acquistare sempre maggiore importanza, mentre quelli piccoli e poco visti tendono a sparire dalla visibilita’ dei siti popolari.

La cosa interessante e’ che a questo proposito seguendo i links di qualche anno fa di un motore di ricerca, la struttura del Web assomiglia a quella di una piovra, con una concentrazione molto forte di links e quindi di siti visibili nelle stesse zone, mentre una periferia poco visibile che alla lunga sparisce o si modifica..

Una delle conseguenze di questo e’ che con le tecniche vecchie di ricerca si poteva raggiungere poco meno del 10% dei siti reali

Adesso forse con i blog questa cosa sta cambiando, perche’ si creano in modo automatico delle reti sociali, se vogliamo interne: ma la questione di visibilita’ rimane la stessa.. [ la questione del ping e del trackback aiuta a creare reti di links in modo massiccio e veloce ]

Tags, categorie e rigidita’ delle strutture ad albero

Tornando al nostro articolo, il paragrafo successivo e’ quello piu’ importante e la chiave di volta del Semantic Web: descrive infatti in modo nascosto il vantaggio di avere uno strato di RDF e quindi un modello aperto a grafo dei dati….

Per discendere maggiormente nel particolare e dare un’idea delle implicazioni della teoria, il modello del grafo è stato utilizzato per suggerire una strutturazione alternativa nell’organizzazione della conoscenza sul Web.
I sistemi di classificazione gerarchico-enumerativi (come le strutture “ad albero”) presentano infatti caratteristiche di rigidità, per cui ogni classe o categoria è concepita come una scatola fisica all’interno della quale collocare gli oggetti di una collezione: il percorso per raggiungere un oggetto è perciò univoco, non modellabile dal fruitore.

Questo se volete e’ un limite delle strutture tipo le categorie dei blog… un qualcosa di gerarchico che facciamo fatica poi ad ampliare e a modellare.. la controparte invece sono i tags :)

Nei sistemi analitico-sintetici (che implementano in qualche modo la teoria dei grafi) le classi non sono contenitori ma descrittori (concetti o proprietà) in relazione semantica.
Tali sistemi abbandonano l’idea di un’enumerazione a priori di tutte le classi, per costituire classi “mobili”, modificabili a seconda dell’esigenza dell’utente, partendo da alcuni elementi preventivamente accettati.
A un elemento sono associabili più categorie o parametri, ciascuno rappresentante un aspetto dell’oggetto.

Questo in parole povere significa che al posto di definire a priori l’oggetto di studio e tutte le sue caratteristiche, ho la possibilita’ di dire semplicemente delle proprieta’ di tale oggetto secondo regole standard, ma posso farlo in qualunque momento e MAI ho la sicurezza di aver detto tutto su quell’oggetto.

Questo in pratica e’ quello che fa RDF

’sito’ autore ‘pincopallo’
’sito’ modificato ‘dataModifica’
’sito’ legatoA ‘altroSito’

E’ questo infatti il cambiamento folle che potremo avere nel strutturare i siti e quindi l’informazione stessa:

In questo senso si è sviluppato ad esempio il progetto Platypus Wiki, in cui è l’utente a creare classi di contenuto attraverso l’aggregazione di alcuni concetti isolati.
Lo spazio è inteso come relazione semantica fra concetti, attraverso un’architettura informativa non più bidimensionale e gerarchica, ma pluridimensionale e relazionale.

Di fatto questo e’ un protitipo di Wiki che si basa in tutto e per tutto su un modello RDF di base…
A mio parere stiamo per assistere all’arrivo di tools abbastanza semplici che cambieranno totalmente il nostro approccio con gerarchie informative sia per quello che riguarda i siti sia a livello desktop: il dilagare dei tags e delle meta-informazioni ( pensiamo a Spotlight ) e’ il sintomo che ormai ne abbiamo bisogno…

Riferimenti:
-> Teoria dei grafi e Web: una teoria matematica applicata al WWW
-> Semantic Web e Web [ italiano ]
-> Semantic Web [ inglese ]
-> Teoria dei grafi
-> Platypus Wiki

Comments

6 Responses to “Grafi e Web: qualche considerazione…”

  1. FG
    giugno 18th, 2005 @ 4:48 pm

    Riflessione molto interessante. Si tratta di un tema che ho trattato anche io spesso nel mio blog.

  2. marcorose'
    giugno 20th, 2005 @ 10:09 am

    Ho visto il Platypus wiki al workshop italiano sul semantic web (http://semanticweb.deit.univpm.it/swap2004/) e devo dire che e’ stato uno dei pochi progetti che ho molto apprezzato (=che ho capito). Ti consiglio di leggerti anche il paper, che trovi qui: http://semanticweb.deit.univpm.it/swap2004/cameraready/castagna.pdf

  3. dagoneye
    giugno 20th, 2005 @ 11:07 am

    A FG: grazie per l’interessante… ho letto il tuo articolo su indire: molto bello e ben fatto.. a breve penso di parlarne..

    Per marcorose:
    Per il Platypus e’ un po’ che lo tengo d’occhio e in effetti e’ uno dei progetti piu’ intriganti che vedo in giro… ma l’uso di java lato server secondo me e’ un punto debole.. grazie per il paper..
    A proposito, il workshop com’e’ stato secondo te? Non sono riuscito a venire…

  4. marcorose'
    giugno 20th, 2005 @ 11:54 am

    Sto imparando a conoscere il web semantico da poco tempo per cui non posso dare un giudizio illuminante, comunque ho trovato i lavori un po’ troppo legati all’aspetto teorico (divagazioni estenuanti sulle ontologie) e poco sull’aspetto pratico, forse perche’non ci sono in giro molte applicazioni di riferimento.

  5. dagoneye
    giugno 20th, 2005 @ 12:59 pm

    Il problema e’ che la verita’ sta nel mezzo…
    Io ormai e’ un anno che mi ci sono buttato ( piu’ o meno )… e le ontologie ho capito a cosa servono, ma devo ancora usarle nella pratica…

    C’e’ uno scoglio in ogni caso sia negli strumenti che nell’approccio…
    che bisogna rendere meno forte…

    Servono strumenti che usino linguaggi e tecnologie aperte a tutti per iniziare a creare una massa critica… e’ un bel casino…

    Ma a breve ne vedremo delle belle: ne sono certo…
    Io nel mio piccolo sto cercando di fare qualcosa usando PHP e come ambiente di test questo sito.. vedremo cosa ne esce…

    Ne vale sicuramente la pena: le potenzialita’ sono immense…
    Il vero problema e’ che si toccano temi che vanno al di la’ delle pure scelte tecniche e la cosa non e’ semplice da gestire..

  6. Casual.info.in.a.bottle » Blog Archive » Riflessioni sulla blogosphera…
    luglio 1st, 2005 @ 1:38 pm

    [...] i e che adesso stanno creando effetti non previsti, ma positivi per fortuna… Grazie al mio post di commento sui grafi, dove ho accennato qualche mia idea e la con [...]

Leave a Reply





Additional comments powered by BackType

  • About

    Viso di Matteo Brunati che sorride

    Blog personale di Matteo Brunati, aka dagoneye. Di tutto un po'.
    Chi sarei?

  • RSS Dal mio lifestream

  • Categorie

  • Archivi

  • Meta