Il progetto FOod in Open Data (FOOD) mette a disposizione modelli di standardizzazione e ontologie di riferimento per la rappresentazione semantica dei contenuti dei disciplinari relativi ai marchi di qualità dei prodotti agroalimentari, emanati dal Ministero delle Politiche Agricole, Alimentari e Forestali e a disposizione in formato PDF.
Il progetto FOOD è nato dalla collaborazione tra l'Istituto di Scienze e Tecnologie Cognitive del CNR- presso il Laboratorio di Tecnologie Semantiche (STLab) - e l'Agenzia per l’Italia Digitale (AgID). Gli obiettivi principali del progetto riguardano:
la creazione di ontologie di riferimento per la rappresentazione semantica dei contenuti dei disciplinari relativi ai marchi di qualità dei prodotti agroalimentari messi a disposizione dal Ministero delle Politiche Agricole, Alimentari e Forestali;
la produzione, a partire dai disciplinari e dalle ontologie create, di dati aperti espressi secondo il paradigma Linked Data, attraverso l’uso di standard del Web Semantico (e.g., RDF);
la pubblicazione degli stessi dati rilasciati con licenza Creative Commons Attribution 4.0 International License, ai fini del riutilizzo da parte di chiunque e per qualunque scopo.
Hanno lavorato al progetto, per il CNR, il team di lavoro STLab coordinato da Aldo Gangemi e composto da Silvio Peroni, Luigi Asprino, Giorgia Lodi, Andrea Nuzzolese e Daria Spampinato. Il gruppo si è inoltre avvalso di una breve collaborazione con l’Istituto per la valorizzazione del legno e delle specie arboree (IVALSA) del CNR di Catania. Per l’AgID ha contributo l’area architetture, standard e infrastrutture guidata da Francesco Tortorelli.
I principali risultati ottenuti dalle attività svolte dalla fine del 2014 a maggio 2015 sono le seguenti:
Sono state definite una serie di ontologie OWL (Ontology Web Language) sui prodotti a marchio di qualità. Nell'ambito di questa attività sono state riutilizzate ontologie di riferimento di settore. Per esempio, AGROVOC è stata usata per la definizione della materie prima dei prodotti DOP e IGP.
L’estrapolazione sia automatica che manuale di una serie di dati relativi ai marchi di qualità secondo le ontologie OWL prodotte.
La produzione di dataset RDF secondo il paradigma Linked Open Data, allineati alle ontologie prodotte.
L’abilitazione di collegamenti tra i dati prodotti e altri Linked Data già presenti nel Web dei dati. I dati relativi ai luoghi di produzione sono stati collegati a DBpedia, a quelli pubblicati dall'AgID nell’ambito del progetto SPCData e a quelli pubblicati recentemente dall’ISTAT sulla classificazione territoriale nazionale di riferimento.
La definizione di metadati che descrivono i dati e tutte le attività svolte per arrivare alla produzione dei Linked Open Data dei marchi di qualità. Anche in questo caso si è fatto uso di standard di riferimento del W3C quali PROV-O e DCAT.
E' stata creata l'ontologia generale dei marchi di qualità (DOP e IGP) e una serie di ontologie specifiche per ciascuna categoria di prodotto.
L'intero dataset FOOD, contenente tutti i dati, le ontologie e i metadati, può essere scaricato in "bulk".
Per poter abilitare pienamente il paradigma dei Linked Open Data è necessario rendere disponibile uno sparql endpoint. mediante il quale interrogare i dati.
Nell'ambito del progetto FOOD, lo SPARQL endpoint può essere utilizzato per interrogare i dati attraverso un'interfaccia più user-friendly. Ad esempio, una possibile query SPARQL, che può essere usata per trovare i primi 10 vini e le relative denominazioni se queste ultime hanno come uno dei luoghi di produzione la città di Lucca, è la seguente:
PREFIX wine: <http://w3id.org/food/ontology/disciplinare-vino/>
PREFIX upper: <http://w3id.org/food/ontology/disciplinare-upper/>
PREFIX dbpedia: <http://dbpedia.org/resource/>
SELECT DISTINCT ?vino ?den
WHERE {
?vino a wine:Vino ;
upper:haDenominazione ?den .
?den upper:haLuogoDiProduzione dbpedia:Lucca
} LIMIT 10
In alternativa, è possibile interrogare lo SPARQL endpoint mediante un servizio REST, utile nel caso di sviluppo di applicativi. Un esempio di questa tipologia di richieste (via cURL), della stessa query menzionata sopra, è il seguente:
curl -L http://w3id.org/food/sparql?query=PREFIX+wine%3A+%3Chttp%3A%2F%2Fw3id.org%2Ffood%2Fontology%2Fdisciplinare-vino%2F%3E+PREFIX+upper%3A+%3Chttp%3A%2F%2Fw3id.org%2Ffood%2Fontology%2Fdisciplinare-upper%2F%3E+PREFIX+dbpedia%3A+%3Chttp%3A%2F%2Fdbpedia.org%2Fresource%2F%3E+SELECT+DISTINCT+%3Fvino+%3Fden+WHERE+%7B%3Fvino+a+wine%3AVino+%3B+upper%3AhaDenominazione+%3Fden+.+%3Fden+upper%3AhaLuogoDiProduzione+dbpedia%3ALucca%7D+LIMIT+10
I dati e i metadati presenti nel triplestore del progetto sono navigabili anche attraverso LodView.