Diario delle lezioni e del laboratorio di sistemi informativi per il supporto alle decisioni
A.A. 2006-2007

Data Ora Luogo Argomenti Pagine
Giovedí 1 marzo 2007 9-13 Lab T Il problema dell'analisi dei gruppi (cluster analysis). Omogeneità e separazione. Requisiti di un algoritmo di cluster analysis ideale. Coefficienti di somiglianza e dissomiglianza. Metodi gerarchici e aggregativi. Single linkage, complete linkage, group-average cluster analysis. Inconvenienti dei metodi gerarchici. L'algoritmo BIRCH. Clustering feature e CF tree. Stime di densità istogramma e naive. c.pdf: 1-26; 28-29; 42-44
Giovedí 8 marzo 2007 9-13 Lab T Stime di densità kernel. Algoritmo DENCLUE. Funzioni di influenza e densità. Attrattori di densità e cluster definiti da un centro. Proprietà e confronto con DBSCAN. Vantaggi e svantaggi di DENCLUE. Algoritmo DBSCAN. Epsilon-intorno di un punto. Raggiungibilità diretta e per densità. Connessione per densità e definizione di cluster. Algoritmo in notazione object-oriented. Esempi di cluster riconosciuti da DBSCAN. c.pdf: 45-58; 61-65; 67. dc-dbscan.pdf: 1-7.
Giovedí 15 marzo 2007 9-11:30 Lab T Microsoft SQL Server 2005: importazione di dati da file testuali, clustering di dati, visualizzazione e analisi dei diagrammi e profili dei cluster.
Giovedí 22 marzo 2007 9–13; 14:30–17 Lab T Complessità computazionale degli algoritmi: O-grande, Omega-grande, Theta-grande, o-piccolo. Clustering di stream di dati: l'algoritmo CluStream. Data mining distribuito: cenni. Data Warehouse Editition: procedure Easy Mining. Esempi di estrazione di outlier, riconoscimento di cluster, estrazione di regole associative con IBM Intelligent Miner Modeling 9.1 e visualizzazione dei modelli con IBM Intelligent Miner Visualization 9.1. stream_ddm_2006_05_23.pdf: 1–11; 22–37
24 marzo 2007 -Stefano Lodi