| Data | Ora | Luogo | Argomenti | Pagine |
|---|---|---|---|---|
| Giovedí 1 marzo 2007 | 9-13 | Lab T | Il problema dell'analisi dei gruppi (cluster analysis). Omogeneità e separazione. Requisiti di un algoritmo di cluster analysis ideale. Coefficienti di somiglianza e dissomiglianza. Metodi gerarchici e aggregativi. Single linkage, complete linkage, group-average cluster analysis. Inconvenienti dei metodi gerarchici. L'algoritmo BIRCH. Clustering feature e CF tree. Stime di densità istogramma e naive. | c.pdf: 1-26; 28-29; 42-44 |
| Giovedí 8 marzo 2007 | 9-13 | Lab T | Stime di densità kernel. Algoritmo DENCLUE. Funzioni di influenza e densità. Attrattori di densità e cluster definiti da un centro. Proprietà e confronto con DBSCAN. Vantaggi e svantaggi di DENCLUE. Algoritmo DBSCAN. Epsilon-intorno di un punto. Raggiungibilità diretta e per densità. Connessione per densità e definizione di cluster. Algoritmo in notazione object-oriented. Esempi di cluster riconosciuti da DBSCAN. | c.pdf: 45-58; 61-65; 67. dc-dbscan.pdf: 1-7. |
| Giovedí 15 marzo 2007 | 9-11:30 | Lab T | Microsoft SQL Server 2005: importazione di dati da file testuali, clustering di dati, visualizzazione e analisi dei diagrammi e profili dei cluster. | |
| Giovedí 22 marzo 2007 | 9–13; 14:30–17 | Lab T | Complessità computazionale degli algoritmi: O-grande, Omega-grande, Theta-grande, o-piccolo. Clustering di stream di dati: l'algoritmo CluStream. Data mining distribuito: cenni. Data Warehouse Editition: procedure Easy Mining. Esempi di estrazione di outlier, riconoscimento di cluster, estrazione di regole associative con IBM Intelligent Miner Modeling 9.1 e visualizzazione dei modelli con IBM Intelligent Miner Visualization 9.1. | stream_ddm_2006_05_23.pdf: 1–11; 22–37 |