Il progetto LOIUS - Linking Italian University Statistics

Autore:
Giovanni Pirrotta (Dipartimento di Matematica, Università di Messina, Italia)

Introduzione

Il progetto LOIUS ha come obiettivo quello di rappresentare le statistiche universitarie pubblicate dal MIUR mediante l’utilizzo di linguaggi semantici e di esporre tali dati secondo le regole previste dai “Linked Data”.
Le statistiche universitarie pubblicate ogni anno dal MIUR costituiscono un’importante fonte di informazione sull’andamento del sistema universitario italiano in termini di iscritti e laureati e consentono di effettuare analisi mirate atte al miglioramento del sistema universitario stesso.
Ad oggi, è possibile visualizzare tali statistiche tramite un’applicazione Web sviluppata dal CINECA che analizza in modo semplice e veloce i dati MIUR. Nonostante ciò i dati rimangono confinati all’interno dell’applicazione senza possibilità di essere processati ed automaticamente esportati in contesti differenti da quello originale. Non è possibile quindi riusare i dati, aumentarne il valore combinandoli con fonti esterne, sviluppare automaticamente applicazioni di mashup.
Il progetto LOIUS intende superare questi limiti assegnando informazioni e metadati alle statistiche MIUR in modo da specificarne il contesto semantico in un formato adatto all’interrogazione, all’interpretazione e, più in generale, all’elaborazione automatica.
L’ontologia LOIUS, creata estendendo l’ontologia SCOVO, definisce in modo completo tutto il dominio statistico dei dati MIUR. La piattaforma espone quindi le statistiche MIUR in formato RDFa, pubblicando i dati originali secondo i principi "Linked Data", dando la possibilità sia di effettuare interrogazioni in modo flessibile ed efficiente sia di sviluppare applicazioni effettuando il mashup dei dati.
La piattaforma espone inoltre un endpoint SPARQL assicurando piena interoperabilità con l’esterno, garantendo un’esplorazione profonda dei dati riguardanti l’intero panorama universitario italiano, in termini di flessibilità e facilità di accesso.
I dati sono rilasciati con licenza Creative Commons Attribuzione.
Il progetto LOIUS vuole offrire alla comunità un nuovo modo di esplorare le statistiche MIUR, sfruttando tutto il potenziale del Web semantico. Nello stesso tempo, ispirato dagli stessi ideali, il progetto LOIUS vuole essere un contributo alla comunità "Linked Open Data".

I dati di riferimento

I dati

I modelli MIUR

  • Mod.1 - Studenti iscritti suddivisi per corso di laurea e anno di immatricolazione
  • Mod.2 - Studenti trasferiti
  • Mod.3 - Studenti non regolari
  • Mod.4 - Laureati suddivisi per corso di laurea e anno di immatricolazione
  • Mod.5 - Laureati stabili suddivisi per corso di laurea e sesso
  • Mod.6 - Studenti iscritti per crediti acquisiti
  • Mod.8 - Studenti iscritti senza crediti iniziali
  • Mod.9 - Studenti iscritti suddivisi per tipo di diploma e corso di laurea
  • Mod.10 - Laureati suddivisi per corso di laurea
  • Mod.12 - Studenti iscritti suddivisi per provenienza, anno di diploma, corso di laurea e sesso
  • Mod.13 - Studenti iscritti suddivisi per provenienza, anno di nascita e corso di laurea
  • Mod.14 - Laureati suddivisi per provenienza, anno di nascita e corso di laurea
  • Mod.15 - Laureati suddivisi per tipo di diploma, anno di nascita e sesso
  • Mod.21 - Laureati suddivisi per voto di diploma e corso di laurea
  • Mod.22 - Laureati suddivisi per voto di laurea e corso di laurea
  • Mod.24 - Immatricolati suddivisi per anno di nascita, corso di laurea e sesso
  • Mod.25 - Immatricolati suddivisi per voto di diploma, corso di laurea e sesso
  • Mod.27 - Laureati non stabili
  • Mod.28 - Studenti part-time
  • Mod.32 - Laureati in possesso di altre lauree
  • Mod.34 - Immatricolati suddivisi per crediti convalidati in fase di immatricolazione
  • L'ontologia LOIUS

    Per definire l'ontologia LOIUS decidiamo di estendere l'ontologia scheletro SCOVO...


    ...identificando i seguenti tipi di dimensione:


    Esempio Mapping

    Nell'esempio che segue utilizziamo l'ontologia LOIUS per mappare il numero degli studenti maschi dell'anno accademico 2001/02, all'Università di Verona, Facoltà di Scienze Motorie, corso di Laurea in Sport e Attività Motorie provenienti dalla città di Belluno, con un diploma di scuola superiore conseguito nell'anno 2000/2001.


    L'architettura LOIUS


    Nella piattaforma LOIUS i dati, partendo dalla fonte MIUR e normalizzati su un repository locale, sono stati prima trasformati da un tool realizzato appositamente, che agisce come "triplificatore" e poi pubblicati sul Web in formato RDFa.
    Per garantire l’accesso a dati appartenenti a più dataset, quindi per collegare grafi diversi, è stato inserito un RDF store, in grado di consentire l’interrogazione dei dati MIUR da un endpoint SPARQL.

    Pubblicazione dei Dataset

    RDFa


    RDF/XML


    Esempi interrogazioni SPARQL su LOIUS

    Scenario 1

    La classifica dei corsi di Laurea con il maggior numero di studentesse nell'anno accademico 2007/08
    ...omessi i PREFIX...
    SELECT ?course ?val
    	  WHERE {
    		?items a scv:Item;
    	    rdf:value ?val;
    		scv:dataset [scv:dimension <http://sw.unime.it/loius/dimension/model/24>];
    		scv:dimension <http://sw.unime.it/loius/dimension/academicyear/2007_2008>;
    		scv:dimension [a loius:Course; dc:title ?course];
    		scv:dimension <http://sw.unime.it/loius/dimension/birthyear/all_years_total>;
    		scv:dimension <http://sw.unime.it/loius/dimension/gender/f>.
    	}
    ORDER BY DESC(?val) LIMIT 10

    Scenario 2 (con Google Motion Chart)

    L'andamento dei Laureati negli anni per Facoltà. Demo
    Esempio: Facoltà di Scienze MMFFNN, Universita' di Messina
    ...omessi i PREFIX...
    SELECT ?year ?course SUM(?val) as ?outgoing
    		WHERE {
    		 ?items   a scv:Item;
    		          rdf:value ?val;
    		          scv:dimension <http://sw.unime.it/loius/dimension/university/08301>;    
    		          scv:dimension <http://sw.unime.it/loius/dimension/faculty/563>;                 	          
    				  scv:dimension <http://sw.unime.it/loius/dimension/degreescore/all_scores_total>;
    		          scv:dimension [a loius:Year; dc:title ?year];
    		          scv:dimension [a loius:Course; dc:title ?course];
    		          scv:dataset [scv:dimension <http://sw.unime.it/loius/dimension/model/22>].
    		   }
    		  order by ?year DESC(?outgoing)
    





    Scenario 3 (con Google Chart)

    Vogliamo confrontare il sistema universitario italiano col sistema universitario scozzese in termini di laureati in un preciso anno accademico.
    A scopo didattico mappiamo con l'ontologia LOIUS i dati in formato excel forniti dall'Agenzia Scozzese sull'Istruzione (HESA), caricandoli sull'RDF store.
    Link file excel
    ...omessi i PREFIX...
    SELECT ?university ?lat ?long  sum(?val) as ?num
    FROM <http://sw.unime.it/loius>
    FROM NAMED <http://sw.unime.it/uniscotland>
    WHERE { {
         ?items a scv:Item;
         scv:dimension <http://sw.unime.it/loius/dimension/academicyear/2004_2005>;
         scv:dimension <http://sw.unime.it/loius/dimension/matriculationyear/all_years_total>;
    	 rdf:value ?val;
    	 scv:dataset [scv:dimension <http://sw.unime.it/loius/dimension/model/1>];
    	 scv:dimension [a loius:University;dc:title ?university; owl:sameas ?same].
    	 ?same geo:lat ?lat;
    		   geo:long ?long . } 
    		     UNION
    {GRAPH <http://sw.unime.it/uniscotland>  {
    	 ?items a scv:Item;
    	 scv:dataset <http://example.org/uniscotland#table0b>;
    	 scv:dimension <http://sw.unime.it/loius/dimension/academicyear/2004_2005>;
    	 rdf:value ?val;
    	 scv:dimension ?unidim.
    	 ?unidim a loius:University;
    	 owl:sameas ?unire.
    	 ?unire dc:title ?university;
    		     geo:lat ?lat;
    		     geo:long ?long. 
        	} 
        } 
    }
    


    Altri esempi

    Yahoo Pipes (collegato con le ontologie SWIUP e GEONAME)


    Da Yahoo Pipes a Google Chart


    LOIUS nella nuvola (LOD cloud)


    Dettagli

    Links

    Homepage Statistiche MIUR in RDFa
    SPARQL Endpoint
    Dataset Dump Download (in formato N-Triples)
    Sorgenti Dati: http://statistica.miur.it
    Fonte dati:
    Ministero dell'Universita' e della Ricerca - Ufficio di Statistica. Indagine sull'Istruzione Universitaria. (Dati aggiornati a gennaio 2009)