Giovanni Pirrotta

Just a curious person

Semantic Web Ingredients: why the XML alone is not sufficiently powerful

November 20, 2013

In this post we continue the Semantic Web post series (the last published in July) and in particular I will explain why XML alone is not sufficiently powerful in the Semantic Web context.

XML is the acronym of Extensible Markup Language and represents a meta-language for the syntactic definition of markup languages allowing to add metadata to local data and separate contents from presentations with a neutral textual format.

Imagine we have the following XML code:


<?xml version="1.0" encoding="ISO-8859-1" ?>
<mailbox>
	<mail id="01">
		<to>Giovanni</to>
		<from>Francesco</from>
		<title>Enjoy Christmas</title>
		<body>Merry Christmas and a Happy New Year</body>
	</mail>
</mailbox>

In the above example the tags <mailbox>, <mail>,<to>,<from>,<title> and <body> have been created specifically for our document and the name of each tag has been implemented to describe in the best possible way the content data. The big problem is that XML is unsuitable to the global semantic interpretation because there is no way to explain to the machine that for example, the string Giovanni, enclosed withing the tag <to>, represents the name of a person.

With XML it is possible to adequately describe the content of a document, bux XML syntax does not define any explicit mechanism to semantically describe relationships between resources inside and outside the document. In fact, XML alone is not sufficiently powerful to explain the semantics in an independent and autonomous way from the context.

Also it is not able to generate new knowledge starting from the original data infering new statements. For example, if we have the fact The dog is a mammal, the XML does not allow to define the sentence in terms of relationship. Also if we consider the fact Fido is a dog, it should be possible to infer the new fact Fido is a mammal. But XML does not allow to explicit this rule between resources because of it is unsuitable to represent semantically the resource on the Web.

To overcome the XML semantic markup limitations, the W3C Consortium has formalized some models which aim to provide an abstract formalism to describe resources and their relationships (RDF, RDFs, OWL).

The RDF model will be described in the next post, so, stay tuned!

CosaCeInTV.it: guida TV a portata di tweet

October 04, 2013

Fra tutti i social network presenti online uno dei miei preferiti è Twitter. La semplicità e immediatezza del servizio di invio, in soli 140 caratteri, di informazioni in tempo reale è diventato negli anni un modello vincente di business. Non sto qui ad elencare il numero di utenti in costante crescita, le centinaia di applicazioni sviluppate da terzi, la possibilità di interagire con i tweets tramite API, la quasi imminente entrata in borsa dell’azienda, etc.

Proprio per la sua diffusione capillare e globale, secondo me però, twitter potrebbe essere utilizzato per fare anche altro. Mi piacerebbe infatti utilizzare il mio client twitter come un telecomando da pigiare per ottenere specifici servizi: informazioni sui programmi televisi attualmente in onda, previsioni meteo, eventi serali della mia città, orari di apertura degli uffici pubblici, etc.
Mi piacerebbe avere la possibilità di interagire in modo semplice e immediato, tramite un banale tweet, ed ottenere queste informazioni, in modo centralizzato, direttamente sul mio smartphone.

Sono state queste motivazioni che mi hanno portato a ideare e sviluppare cosaceintv, un servizio quindi tweet-driven.

OpenGazzettaUfficiale: la legge e' Open per tutti

August 28, 2013

Circa un anno fa avevo intenzione di sviluppare un servizio che automaticamente mi inviasse via mail il bando dei concorsi pubblici non scaduti, relativamente a dei settori di interesse da me specificati. In rete esistono già svariati siti Web sui concorsi ma io volevo ottenere una maggiore flessibilità di interrogazione. Così, di primo acchito, sono andato sulla fonte ufficiale e più importante dei concorsi pubblici in Italia, vale a dire la gazzetta ufficiale, dove, con mia grande sorpresa, ho letto il seguente disclaimer:

OpenAlboPretorio: apriti sesamo - aggiornato

July 22, 2013

Sono iscritto ormai da più di due anni alla mailing list Spaghetti Open Data (SOA), punto di incontro di un gruppo di persone, di professione tra loro eterogenea (programmatori, ricercatori, avvocati, esperti del settore, semplici curiosi, etc.), interessati al rilascio dei dati pubblici in formato aperto, leggi Open Data. Anche se non partecipo attivamente alle attività della community, ogni volta che torno a leggere i post della lista trovo sempre qualcosa che mi arricchisce e ispira.

Così è stato anche quando nel novembre del 2012 ho letto che l’utente eccoilmoro aveva realizzato, come esperimento di civic-hacking, lo scraping dell’albo pretorio online dei comuni della Bassa Romagna, reindirizzando il tutto su una pagina FB prima e su un profilo Twitter dopo. Il tutto è stato poi riportato in questo blog.

Can machines think?

July 04, 2013

Suppose we want to become a policeman and to participate in the selection we need to complete the online request application available in the police Website. To do this, we decide to rely this task to our software agent to achieve an independent interaction between the software agent and the police homepage. Simplifying a lot, our software agent could start from the police homepage and, through string-matching analysis and exploration of the links, it might be able to recognize a page containing the words selection and 2013 and it could “think” to have found the right page to start its interaction.

Terme Vigliatore Statistics

June 12, 2013

Il popolo sovrano ha deciso.
Terme Vigliatore ha eletto il suo primo cittadino riconfermando il sindaco uscente.
Personalmente non ne potevo più del fermento elettorale che si era innescato da mesi e che vedeva i protagonisti delle varie liste, dei movimenti e degli schieramenti darsele (metaforicamente parlando) di santa ragione per accrescere il proprio bacino elettorale.
Tutto questo è ormai (e per fortuna) acqua passata!

Da qualche tempo però, appassionato di data mining, è nato in me il desiderio di effettuare ricerche statistiche sulla storia delle amministrazioni passate, per ricavarne qualcosa di interessante e curioso.

Limits of the Web today

June 03, 2013

The Web was born in 1999 at the CERN laboratory, when scientist need to share information and scientific researches in realtime. To accomplish this task, Tim Berners-Lee conceived a hypertextual system of communication between documents that became, in few years, the keystone of the World Wide Web (WWW). He introduces a markup convention, called HyperText Markup Language (HTML), to visualize and format documents allowing the linking through anchor words. When HTML pages are loaded in Web server programs installed on computers and located in different places of the world, users can reach the Web documents using particular programs called browsers allowing them to navigate the Web of linked documents.