Offerta formativa | Università degli Studi di Firenze

Anno di corso

Primo Anno - Secondo Semestre

Dipartimento di Afferenza

Ingegneria dell'Informazione

Tipo insegnamento

Attività formativa monodisciplinare

Settore Scientifico disciplinare

ING-INF/05 - SISTEMI DI ELABORAZIONE DELLE INFORMAZIONI

Crediti Formativi

9

Ore Didattica

72

Periodo didattico

01/03/2021 ⇒ 11/06/2021

Frequenza Obbligatoria

No

Tipo Valutazione

Voto Finale

Contenuto del corso

mostra

Programma del corso

mostra

Docenza

Lingua Insegnamento

Italiano

Contenuto del corso

.

Libri di testo consigliati (Cerca nel catalogo della biblioteca)

- Computer Vision: Models, Learning, and Inference
Simon J. D. Prince
University College London

- Computer and Machine Vision: Theory, Algorithms, Practicalities
E. R. Davies
Academic Press

- Digital Image Processing
R.C. Gonzalez, R.E. Woods
Ed. Pearson, Prentice Hall

- Materiale disponibile sul sito web del docente www.dsi.unifi.it/pala/

- Altro materiale
www.icaen.uiowa.edu/~dip/LECTURE/contents.html

Obiettivi Formativi

Obiettivo del corso è quello di fornire le conoscenze e competenze
necessarie ad effettuare operazioni di elaborazione ed analisi di immagini e video.
- Conoscenza dei modelli per la descrizione di caratteristiche globali e locali delle immagini in termini di colore e tessitura
- Conoscenza di modelli per la rappresentazione multiscala del contenuto di immagini
- Conoscenza dei modelli per la sogliatura e segmentazione di immagini in base a caratteristiche locali
- Conoscenza di modelli per la descrizione della dinamica in un video
- Capacità di applicare le conoscenze acquisite per il progetto di moduli software per l'analisi del contenuto di immagini e video.

Prerequisiti

Calcolo differenziale di più variabili, Calcolo vettoriale, Elementi di probabilità e statistica, Filtraggio lineare nello spazio 2D, Principali costrutti della programmazione procedurale

Metodi Didattici

Lezioni in aula ed esercitazioni in laboratorio con Python

Altre Informazioni

.

Modalità di verifica apprendimento

L'esame si svolge attraverso una prova orale, eventualmente affiancata dallo sviluppo di un elaborato. Nella prova viene verificata la capacità comunicativa del candidato e la conoscenza dei modelli di descrizione di immagini e video e la capacità di formalizzare in forma algoritmica o con pseudocodice la struttura di un modulo di analisi di immagini/video con riferimento a problemi di segmentazione di immagine e stima del flusso ottico.

Programma del corso

Proprietà metriche, distanza di Hausdorff, distanza di Mahalanobis, proprietà topologiche.

Trasformazioni puntuali: istogramma, espansione di scala, equalizzazione di immagine: modelli globali e locali

Trasformazioni position dependent; Local histogram equalization ; trasformazioni geometriche: applicazione e stima; image morphing

Operatori locali: introduzione; Smoothing: media, gaussiano; bilateral filter, filtro mediano; Correlazione e template matching;

Concetto di edge; edge e derivate; operatori del primo ordine; maschere di roberts, prewit, sobel; operatori del secondo ordine; Laplaciano, LoG, DoG; Filtro di canny: principi, soppressione non massimale, isteresi; Contronto risultati edge su immagine con rumore; edge detection con modelli parametrici; estrazione edge su immagini a colori;

Corner detection: modello di Harris

Rappresentazione multiscala e scale-space: motivazioni e definizione del modello, N-jet ed invarianti; Anisotropic diffusion models;

Invarianti di colore;

Descrizione tessiture: introduzione, motivazione e contesti applicativi; matrici co-occorrenza, matrice di covarianza; Tamura, Local Binary Patterns, Fourier Power Spectrum, Region covariance, Gabor, Momenti;

La Gestalt ed i principi di raggruppamento; Sogliatura di immagini con il metodo di Otsu; Sogliatura immagini rumorose, sogliatura con media mobile;

Binary mathematical morphology: erode and dilate; open, close, smooth, hit-or-miss, gradient, hole filling; binary reconstruction by dilation and erosion, open by reconstruction, ultimate erosion, distance transform.

Lattice morphology: erosion, dilation, open, close, morphological gradient, top-hat, bottom-hat, contrast enhancement, grayscale reconstruction, opening by reconstruction; Granulometry with MM;

Segmentazione di immagini attraverso clustering; Clustering gerarchico, K-means
Gaussian Mixtures, Algoritmo EM; Mean Shift;

Segmentazione basata su grafi: Normalized Cuts;

Edge-based segmentation: Hough rette, rette con parametrizzazione theta; Hough cerchi e generalizzata; Watersheds

Principio di formazione del moto sul piano immagine. Applicazioni ed esempi pratici di analisi del moto. Relazione tra 3D motion field e 2D motion field.

Flusso ottico. Definizione e relazione con 2D motion field. Casi particolari e degeneri. Distinzione tra metodi densi e metodi sparsi. Stima del flusso ottico tramite metodi differenziali: algoritmo Horn&Schunk.

Stima del flusso ottico tramite il metodo di Lucas e Kanade. Stima del flusso con modello di moto globale affine: l'algoritmo KLT. Stima in caso di displacement elevato: algoritmo KLT piramidale, metodo di Brox e Malik basato su Region Matching.

Segmentazione del moto. Casi possibili (telecamera fissa, brandeggiabile, in movimento). Segmentazione background/foreground. Metodi dinamici di modellazione del background basati su modelli statistici. Algoritmo Mixture of Gaussian. Object tracking.

B024269 - IMAGE AND VIDEO ANALYSIS

Anno Accademico 2020-21

Lingua Insegnamento

Contenuto del corso

Libri di testo consigliati (Cerca nel catalogo della biblioteca)

Obiettivi Formativi

Prerequisiti

Metodi Didattici

Altre Informazioni

Modalità di verifica apprendimento

Programma del corso