Per quelli che hanno fatto percorsi scientifici la teoria dei grafi risulta familiare, ed e’ alla base di Internet in effetti..

La Rete ha una topologia a grafo e la sua metastruttura formata di links e’ di fatto un grafo immane: applicando alla Rete le teorie dei grafi si puo’ studiare la Rete stessa…

[ immagine tratta da Wikipedia ]

Non dimentichiamo che poi il principio base del funzionamento di Google usa proprio l’dea che un nodo ( quindi un sito ) e’ tanto piu’ importante tanto il numero di archi in arrivo su di esso ( links che lo linkano e ne aumentano la popolarita’ )

Volevo segnalare un interessante articolo di ApogeoOnLine:

-> Teoria dei grafi e Web: una teoria matematica applicata al WWW

Per chi non lo sapesse ecco cosa sono i grafi:

Le strutture a grafo constano di un insieme di punti (o nodi) che possono essere connessi da collegamenti (archi): il numero di archi per punto costituisce il “grado” di un nodo.
Una grande varietà di sistemi naturali e artificiali è rappresentabile attraverso questo genere di astrazione (il Web come un insieme di pagine e contenuti connessi da hyperlinks).

Una cosa notevole e’ che lo svilupparsi e l’evoluzione stessa del sistema Web in generale e’ legata molto alle teorie dei grafi: consideriamo che RDF stesso come meta-modello e’ un grafo, ( grafo orientato per essere precisi )…e lo sviluppo del Semantic Web stesso passa attraverso studi dei grafi, come dice l’alrticolo stesso…

Semantic Web e Web Trust hanno del resto bisogno di definire e spiegare il funzionamento dei rapporti che regolano l’instradamento di dati e informazioni attraverso il WWW, di costruirne una topologia utilizzabile per scopi diversi, ma complementari: un modello matematico fornisce un’astrazione stilizzata, sostenuta da formule, per rappresentare, nel suo insieme o nel particolare, il Sistema.

La cosa particolarmente interessante e’ che il modello RDF ha come assunzione di non essere totalizzante: nel senso che si basa su un’assunzione di “open world“… cioe’ tutto quello che si dice di una determinata risorsa non e’ detto che sia tutto quello che si possa dire su di essa…

E’ questa a mio avviso la caratteristica fondamentale di successo di un tale modello: l’umilta’ di non essere onnisciente…
E questa e’ la chiave anche della sua mantenibilita’ e della sua capacita’ di integrarsi con altre risorse grazie all’uso dei namespaces…

Riprendendo l’articolo si parla poi di due caratteristiche delle reti che in qualche modo coinvolgono e modellano il Web: la presenza di sottoreti sociali e la Rete come forma di nodi aristocratici…

Tra queste, la conformazione Small World (tipica dei sistemi sociali), per cui esistono sistemi a grafo dalla struttura regolare, ma che presentano un certo numero di “scorciatoie” che garantiscono il passaggio da un “ambiente” a un “altro”, saltando più o meno passaggi. Si tratta di una proprietà evidentemente riscontrabile nel Web, in cui gli hyperlinks svolgono la funzione di “porte dimensionali”, consentendo l’annullamento o il restringimento delle distanze.

I links sono quindi un elemento di primaria importanza nello sviluppo della Rete, mentre i nodi hanno questa caratteristica:

Un’altra proprietà presente in molti casi di grafi reali è quella dell’ “autosimilarità del grado di un vertice”, che stabilisce come non esista un valore caratteristico per questa grandezza: al contrario, si può riscontrare ogni valore (da molto piccolo a molto grande) all’interno del sistema.
Dallo studio di casi reali, emerge tuttavia una regola particolare, per cui esistono una miriade di punti terminali con pochi collegamenti e un numero piccolo di grandi siti centrali, secondo una distribuzione a potenza dei gradi: è il caso del Web, Rete aristocratica in cui sono presenti pochi nodi di grande importanza.

Sembra difficile, ma in realta’ il fatto e’ questo: il divario tra siti famosi e siti piccoli e’ che i siti famosi e popolari tendono ad acquistare sempre maggiore importanza, mentre quelli piccoli e poco visti tendono a sparire dalla visibilita’ dei siti popolari.

La cosa interessante e’ che a questo proposito seguendo i links di qualche anno fa di un motore di ricerca, la struttura del Web assomiglia a quella di una piovra, con una concentrazione molto forte di links e quindi di siti visibili nelle stesse zone, mentre una periferia poco visibile che alla lunga sparisce o si modifica..

Una delle conseguenze di questo e’ che con le tecniche vecchie di ricerca si poteva raggiungere poco meno del 10% dei siti reali

Adesso forse con i blog questa cosa sta cambiando, perche’ si creano in modo automatico delle reti sociali, se vogliamo interne: ma la questione di visibilita’ rimane la stessa.. [ la questione del ping e del trackback aiuta a creare reti di links in modo massiccio e veloce ]

Tags, categorie e rigidita’ delle strutture ad albero

Tornando al nostro articolo, il paragrafo successivo e’ quello piu’ importante e la chiave di volta del Semantic Web: descrive infatti in modo nascosto il vantaggio di avere uno strato di RDF e quindi un modello aperto a grafo dei dati….

Per discendere maggiormente nel particolare e dare un’idea delle implicazioni della teoria, il modello del grafo è stato utilizzato per suggerire una strutturazione alternativa nell’organizzazione della conoscenza sul Web.
I sistemi di classificazione gerarchico-enumerativi (come le strutture “ad albero”) presentano infatti caratteristiche di rigidità, per cui ogni classe o categoria è concepita come una scatola fisica all’interno della quale collocare gli oggetti di una collezione: il percorso per raggiungere un oggetto è perciò univoco, non modellabile dal fruitore.

Questo se volete e’ un limite delle strutture tipo le categorie dei blog… un qualcosa di gerarchico che facciamo fatica poi ad ampliare e a modellare.. la controparte invece sono i tags :)

Nei sistemi analitico-sintetici (che implementano in qualche modo la teoria dei grafi) le classi non sono contenitori ma descrittori (concetti o proprietà) in relazione semantica.
Tali sistemi abbandonano l’idea di un’enumerazione a priori di tutte le classi, per costituire classi “mobili”, modificabili a seconda dell’esigenza dell’utente, partendo da alcuni elementi preventivamente accettati.
A un elemento sono associabili più categorie o parametri, ciascuno rappresentante un aspetto dell’oggetto.

Questo in parole povere significa che al posto di definire a priori l’oggetto di studio e tutte le sue caratteristiche, ho la possibilita’ di dire semplicemente delle proprieta’ di tale oggetto secondo regole standard, ma posso farlo in qualunque momento e MAI ho la sicurezza di aver detto tutto su quell’oggetto.

Questo in pratica e’ quello che fa RDF

‘sito’ autore ‘pincopallo’

‘sito’ modificato ‘dataModifica’

‘sito’ legatoA ‘altroSito’

E’ questo infatti il cambiamento folle che potremo avere nel strutturare i siti e quindi l’informazione stessa:

In questo senso si è sviluppato ad esempio il progetto Platypus Wiki, in cui è l’utente a creare classi di contenuto attraverso l’aggregazione di alcuni concetti isolati.
Lo spazio è inteso come relazione semantica fra concetti, attraverso un’architettura informativa non più bidimensionale e gerarchica, ma pluridimensionale e relazionale.

Di fatto questo e’ un protitipo di Wiki che si basa in tutto e per tutto su un modello RDF di base…

A mio parere stiamo per assistere all’arrivo di tools abbastanza semplici che cambieranno totalmente il nostro approccio con gerarchie informative sia per quello che riguarda i siti sia a livello desktop: il dilagare dei tags e delle meta-informazioni ( pensiamo a Spotlight ) e’ il sintomo che ormai ne abbiamo bisogno…

Riferimenti:

-> Teoria dei grafi e Web: una teoria matematica applicata al WWW
-> Semantic Web e Web [ italiano ]
-> Semantic Web [ inglese ]
-> Teoria dei grafi
-> Platypus Wiki