In tema di query SPARQL: un esempio usando Dbpedia

13 nov 2007 in Semantic Web

[ _altro post mediamente tecnico e non lungo .) _]

Visto che mi sento in tema di esempi di applicazione del Semantic Web, in confronto a tecniche consolidate di text-mining e di ricerca, ho scovato un altro esempio very cool, che stavolta non faro’ direttamente io pero’.

Mi sembrava particolarmente significativo.

-> Querying DBpedia - And looking forward to more.

Per chi non lo sapesse, Dbpedia e’ uno dei progetti di maggior successo nel far arrivare alla massa il significato e i reali vantaggi che il Semantic Web porta con se’. [ ne avevo parlato un po’ tempo fa ]

-> DBpedia.org

DBpedia is a community effort to extract structured information from Wikipedia and to make this information available on the Web. DBpedia allows you to ask sophisticated queries against Wikipedia and to link other datasets on the Web to Wikipedia data.

Bob sta cercando di visionare tutte le possibili scritte che Bart Simpson ha dovuto scrivere alla lavagna a scuola, nella serie dei Simpsons. Non e’ una domanda banale, direi.

Instead of a “Hello World” example, I went with more of an “I will not publish the principal’s credit report” example: a list of things written by Bart on the school blackboard at the beginning of a collection of Simpsons episodes.

La parte piu’ complessa a cui deve andare incontro per formulare la query in SPARQL e’ capire come vengono identificate le risorse di cui ha bisogno: cioe’ che URI usare per identificare Bart Simpson, per identificare la lavagna e qualcosa per la serie o almeno una delle serie del cartone animato.

Once I knew the following three things, I could create the SPARQL query:
The Simpson episode Wikipedia pages are the identified “things” that we would consider as the subjects of our RDF triples (or, put another way, as the objects in the {object, attribute name, attribute value} triplets that contain our data).
The bottom of the Wikipedia page for the “Tennis the Menace” episode tells us that it is a member of the Wikipedia category “The Simpsons episodes, season 12”.
The episode’s DBpedia page tells us that p:blackboard is the property name for the Wikipedia infobox “Chalkboard” field.

Questo perche’ nel mondo di RDF tutto e’ almeno una TRIPLA di informazione, dove ogni componente puo’ essere un URI, un modo univoco di identificare qualcosa.
Questo e’ ancora lo scoglio piu’ grande in effetti, da rendere trasparente per l’utente medio, per capire come chiedere qualcosa al sistema.

Ma, se ci pensiamo, non e’ un problema da poco identificare qualcosa a livello non ambiguo, e a livello mondiale.
E’ vero che ci sono piu’ modi per identificare la stessa cosa, e ognuno puo’ usare il suo, a patto che dica che quel modo e’ equivalente ad un altro gia’ conosciuto, in modo da potersi gestire con la transitivita’ della referenza che si sta facendo. [ owl:sameAs docet ]

Ma su questo ci torneremo. ( un dibattito durato parecchio sulla questione delle URI, qc ne avevo accennato tempo fa, molto per fortuna e’ cambiato in meglio, stay tuned ).

Continua a leggere

Qualche query SPARQL sul profilo FOAF...

10 nov 2007 in Semantic Web

Parlando sempre di Social Network, di LifeStream e via dicendo…

Proviamo qualche piccola idea sul Semantic Web, tanto per cambiare .)

Partiamo da un caso pratico, utile per fare degli step su alcuni argomenti che vorrei affrontare nel prossimo futuro…
Anche per iniziare a sondare qualche reale vantaggio derivato dall’utilizzo di tali tecnologie.

Se una persona volesse capire che account utilizzo online, come Matteo Brunati ad esempio.

Usando Google

Con Google potrebbe fare due cose:

cercarmi con Google e vedere cosa viene fuori
cercare con Google stavolta matteo brunati account
cercare sul mio sito se io in qualche modo parlo o faccio una lista dei miei account preferiti

Ora, tra l’altro, nella prima ipotesi non e’ detto che venga fuori del tutto un quadro veriterio e completo, perche’ non sono informazioni che io posso controllare….
Sono informazioni derivate, se ho omonimi o qualcuno che si spaccia per me, non e’ certo un quadro attendibile.

Per quanto riguarda la seconda voce, emerge una pagina, ClaimID.net, che e’ la versione con i microformati del mio profilo.
E’ sempre un account, ma e’ un ponte tra il livello senza struttura e il livello totalmente semantico, che e’ il profilo FOAF.

Una specie di passaggio intermedio, che dona piu’ struttura alle informazioni libere che Google indicizza tutti i giorni.

( al momento la terza voce e’ solo semantica, quindi per le macchine: ne faro’ una versione umana di mia scelta a breve )

Se invece avessi un modo di definire in forma comprensibile dalle macchine, e rappresentabile anche in forma piu’ umana, tutto questo? E quindi di poter permettere risposte piu’ attendibili alle domande che poniamo?

Continua a leggere

IASummit a Trento, blog e links: che caos...

09 nov 2007 in Web Design

Due righe veloci per dire che all’ultimo ho deciso di partecipare a questo splendido e ricco Summit, e poi vedremo se entro quei giorni avro’ realizzato un po’ di struttura attorno ai contenuti di questo blog.
-> Architettura dell’Informazione e Innovazione - IA Summit 2007 - Trento

Architettura dell’Informazione e Innovazione
Nel fare Architettura dell’Informazione classificare, strutturare, rendere trovabile, rendere interoperabile sono passi necessari per la produzione di innovazione nelle aziende, nelle università e nella Pubblica Amministrazione.

Conoscendo l’amico Alberto Mucignat e di sfuggita anche Luca Mascaro, sono certo che saranno affrontati temi fondamentali e collegati molto direi, con la grande vision del Semantic Web. Integrarsi e muoversi insieme non puo’ che far bene a tutti noi.

Ho sempre pensato di lasciarlo crescere questo blog, cosi’ come veniva, e poi vedere cosa accadeva.

La sensazione che ormai risulti stretto come strumento, era nell’aria gia’ da tempo. [ sul tema a breve una piccola chicca, fatti parecchi passi avanti .) ]

Ora ci sono filoni che vorrei seguire, in stile bottom up, proprio a partire da spunti emersi dalle mie peregrinazioni e dalle segnalazioni che sono emerse in queste righe.
Lo scopo principale del blog era quello di creare un mio personalissimo flusso mentale registrato nel tempo: ma ora e’ giusto stendere questo flusso, in forma piu’ umana .) Anche perche’ altrimenti perdo pezzi per strada pure io!!

Lavorero’ per fare un po’ di cosuccie:

facilitare la lettura immediata delle idee che voglio esprimere - una specie di summary iniziale
far rivivere l’ottimo plugin di Shelley Powers, che semanticamente raccoglieva i riferimenti a fondo post, per migliorare la leggibilita’ dei post, e diminuirne l’affollamento di links - e non solo [ si veda questo post per capire un po’ ]* usare in parallelo un** motore prettamente semantico di appoggio** - una sorpresa in merito arrivera’
un wiki di completamento per tracciare in forma piu’ organica e strutturata il caos che emerge tra le righe
riprendere a scrivere posts in inglese, in forma avanzata e costante - non solo divulgazione, ma anche implementazione del Semantic Web in prima persona - questa e’ la fase in cui sto entrando, vi avviso .)

Queste sono alcune delle cose che sto mettendo in piedi, il resto si sta concentrando su FullOut e il progetto M.A.N. at work…

Ad esempio, sul blog di FullOut c’e’ molto semantic web, ma l’interfaccia e’ ancora implicita e va esplicitata senza troppi giri di parole… Oltre al fatto che ci sono i dati, ma non le loro applicazioni visibili .)
Diciamo che il lavoro da fare sta andando avanti…

Insomma: il puzzle si fa interessante .)

Riprendo proprio il post in tema di Alberto, dicendogli che saro’ davvero attento a quello che si dira’, visto che questo sito e’ un vero e proprio sito da coda lunga, e che la maggior parte del traffico arriva proprio dai motori di ricerca ( oltre ai link saltuari su segnalazioni di mass media vari ).

Mi e’ capitato proprio in questi giorni di ricevere un commento di scarso aggiornamento del sito ( di un singolo post, nel caso specifico ), da una persona che probabilmente non e’ ancora abituata al design di un blog, e che senza aiuti proposti dall’interfaccia, si e’ proprio persa nella singola pagina. Senza capire che la pagina era un post, ma pensando che la pagina fosse tutto il sito.

La colpa e’ del blog stesso, non strutturato per natura, e mia inconsapevolmente: cerchero’ ora di rimediare a queste mie mancanze.

Fa riflettere che molte volte si dia per scontata l’usabilita’ di un’interfaccia, in base anche all’esperienza pregressa che noi tutti possiamo avere.
Quanto invece sia difficile e quasi filosofico il modo di porsi verso queste nostre interazioni, molte volte dimenticate, o lasciate per ultime.

Il lavoro dell’architetto dell’informazione e’ quasi incompreso, ma di primaria importanza.

Piu’ ci penso, e non vedo l’ora di esserci a Trento, a dirla tutta :)

Una chicca: questo scritto mi sta facendo davvero riflettere…
-> Don’t click here: the art of hyperlinking

Oltre a questa, aggiungo una chicca semantica, del caro Danny Ayers, che in tema di links e di cose che diamo per implicite, ci sta davvero tutta…
-> My work is done

**But the thing is, pretty much every single page on the Web contains some useful semantic information - links. **

Commenta e condividi