TESI

Relatore: Prof. Paolo Ciaccia

Tesi già discusse


Gli argomenti su cui assegno tesi sono principalmente collegati a quelli trattati nel corso di Sistemi Informativi LS

Le seguenti sono le tesi disponibili al momento (aggiornate al 30/11/2007). In ogni caso potete venire a ricevimento per saperne di più e per eventuali altri titoli

Argomento Breve descrizione
Caratterizzazione statistica di banche dati curriculari per ricerche basate su preferenze Il problema di trovare, all'interno di banche dati di grandi dimensioni, i curricula che meglio rispondono alle esigenze specifiche di un'azienda puņ essere affrontato efficacemente rinunciando al classico modello Booleano in favore di un approccio che tratta le richieste in termini di preferenze. D'altronde, richieste che ignorano il contenuto attuale della banca dati possono spesso dar luogo a risultati poco informativi e/o difficili da utilizzare. Scopo della tesi è investigare le possibilità offerte da un approccio che, sia per la formulazione delle richieste che per la fruizione dei risultati, si basi su una caratterizzazione sintetica del contenuto della banca dati e di una sua eventuale rappresentazione grafica, allo scopo di aiutare a focalizzare la ricerca sulle parti interessanti dello spazio e, allo stesso tempo, di permettere una navigazione mirata dei risultati. Il lavoro verrà svolto in collaborazione con il personale di AlmaLaurea e potrà avvalersi, per la necessaria fase sperimentale, della banca dati di AlmaLaurea (circa 900.000 CV)
Interrogazioni con preferenze dipendenti da contesto In molti casi le preferenze di un utente dipendono dal contesto in cui lo stesso si trova (es. luogo, dispositivo di accesso alla rete, ecc.). Scopo della tesi è mettere a punto uno strumento che, dato il contesto corrente e una rappresentazione opportuna delle preferenze basata su CP-net, determini il sottoinsieme di preferenze rilevanti e le applichi per estrarre i migliori risultati da una base di dati
Dinamiche di costituzione di percorsi viari in epoca medievale Il lavoro di tesi si propone di realizzare un programma in grado di modellare il comportamento assunto da uno o più esseri umani posti di fronte al problema di quale percorso scegliere per spostarsi tra due dati punti dello spazio collocati su terreno impervio, al fine di riprodurre i meccanismi formativi delle reti di spostamento in epoca pre-protostorica o medievale, allorquando le Istituzioni centrali non erano in grado di pianificare e realizzare strade vere e proprie, ma i percorsi stessi nascevano in maniera spontanea ed intuitiva. La tesi, di natura chiaramente interdisciplinare, verrà svolta in collaborazione con il Dipartimento di Paleografia e Medievistica dell'Università di Bologna, e si avvarrà della collaborazione del Dott. Alberto Monti (archeologo, PhD in storia e informatica), il quale fornirà i dati di partenza ed il necessario supporto storico-antropologico
Indici metrici "domain-aware" Tutti gli indici per spazi metrici oggi esistenti, tra cui l'M-tree, di fatto assumono che il dominio dei dati coincida con il tipo dei dati stessi (es. vettori di reali). Ciò impedisce di considerare situazioni in cui, ad esempio, i dati sono normalizzati, vi sono delle regioni ben definite (ostacoli) che non fanno parte del dominio, ecc. La tesi ha l'obiettivo di estendere l'attuale implementazione dell'M-tree con opportune astrazioni che rendano tale indice "domain-aware". Obiettivo secondario è realizzare un'estensione che permetta di dotare l'M-tree di un metodo in grado, dipendentemente dal tipo dei dati, di creare regioni il cui centro è dato da un punto non facente parte dell'insieme di dati indicizzato (cosa attualmente non possibile)
Riduzione della dimensionalità a massima energia Per ovviare al problema del "dimensionality curse", si fa spesso ricorso a tecniche di riduzione della dimensionalità, che proiettano i vettori da indicizzare in uno spazio a dimensione molto minore di quello originario. Tale trasformazione è tipicamente la stessa per tutti i vettori (ad es. i primi k coefficienti della trasformata di Fourier, nel caso di serie temporali). La tesi ha l'obiettivo di studiare il caso in cui la trasformazione sia dipendente dallo specifico vettore, in particolare selezionando i k coefficienti con massima energia (il che minimizza per ogni vettore l'errore di approssimazione), e di fornire una realizzazione basata su M-tree
Top-k similarity join su stream di dati Trovare correlazioni tra stream di dati è di interesse in una varietà di applicazioni e scenari, tra cui reti di sensori, applicazioni finanziarie e mediche, ecc. Assimilando un'elevata correlazione a una bassa distanza, il problema si riformula come quello di determinare, ad ogni istante, quali sono le k coppie di (sottosequenze) degli stream che sono a distanza minima. La tesi, a partire da un framework di analisi di stream sviluppato in Java, ha l'obiettivo di realizzare e valutare algoritmi per risolvere il problema che tengano in debito conto i vincoli di memoria, i ritardi con cui si forniscono i risultati e l'inevitabile grado di approssimazione che è necessario introdurre quando il carico del sistema richiede l'uso di distanze approssimate, quali la SDTW che approssima la distanza di Dynamic Time Warping (DTW)

Per ulteriori informazioni: : paolo.ciaccia[at]unibo.it