- Computer Vision: Models, Learning, and Inference
Simon J. D. Prince
University College London
- Computer and Machine Vision: Theory, Algorithms, Practicalities
E. R. Davies
Academic Press
- Digital Image Processing
R.C. Gonzalez, R.E. Woods
Ed. Pearson, Prentice Hall
- Materiale disponibile sul sito web del docente www.dsi.unifi.it/pala/
- Altro materiale
www.icaen.uiowa.edu/~dip/LECTURE/contents.html
Obiettivi Formativi
Obiettivo del corso è quello di fornire le conoscenze e competenze
necessarie ad effettuare operazioni di elaborazione ed analisi di immagini e video.
- Conoscenza dei modelli per la descrizione di caratteristiche globali e locali delle immagini in termini di colore e tessitura
- Conoscenza di modelli per la rappresentazione multiscala del contenuto di immagini
- Conoscenza dei modelli per la sogliatura e segmentazione di immagini in base a caratteristiche locali
- Conoscenza di modelli per la descrizione della dinamica in un video
- Capacità di applicare le conoscenze acquisite per il progetto di moduli software per l'analisi del contenuto di immagini e video.
Prerequisiti
Calcolo differenziale di più variabili, Calcolo vettoriale, Elementi di probabilità e statistica, Filtraggio lineare nello spazio 2D, Principali costrutti della programmazione procedurale
Metodi Didattici
Lezioni in aula ed esercitazioni in laboratorio con Python
Altre Informazioni
.
Modalità di verifica apprendimento
L'esame si svolge attraverso una prova orale, eventualmente affiancata dallo sviluppo di un elaborato. Nella prova viene verificata la capacità comunicativa del candidato e la conoscenza dei modelli di descrizione di immagini e video e la capacità di formalizzare in forma algoritmica o con pseudocodice la struttura di un modulo di analisi di immagini/video con riferimento a problemi di segmentazione di immagine e stima del flusso ottico.
Programma del corso
Proprietà metriche, distanza di Hausdorff, distanza di Mahalanobis, proprietà topologiche.
Trasformazioni puntuali: istogramma, espansione di scala, equalizzazione di immagine: modelli globali e locali
Trasformazioni position dependent; Local histogram equalization ; trasformazioni geometriche: applicazione e stima; image morphing
Concetto di edge; edge e derivate; operatori del primo ordine; maschere di roberts, prewit, sobel; operatori del secondo ordine; Laplaciano, LoG, DoG; Filtro di canny: principi, soppressione non massimale, isteresi; Contronto risultati edge su immagine con rumore; edge detection con modelli parametrici; estrazione edge su immagini a colori;
Corner detection: modello di Harris
Rappresentazione multiscala e scale-space: motivazioni e definizione del modello, N-jet ed invarianti; Anisotropic diffusion models;
Invarianti di colore;
Descrizione tessiture: introduzione, motivazione e contesti applicativi; matrici co-occorrenza, matrice di covarianza; Tamura, Local Binary Patterns, Fourier Power Spectrum, Region covariance, Gabor, Momenti;
La Gestalt ed i principi di raggruppamento; Sogliatura di immagini con il metodo di Otsu; Sogliatura immagini rumorose, sogliatura con media mobile;
Binary mathematical morphology: erode and dilate; open, close, smooth, hit-or-miss, gradient, hole filling; binary reconstruction by dilation and erosion, open by reconstruction, ultimate erosion, distance transform.
Lattice morphology: erosion, dilation, open, close, morphological gradient, top-hat, bottom-hat, contrast enhancement, grayscale reconstruction, opening by reconstruction; Granulometry with MM;
Segmentazione di immagini attraverso clustering; Clustering gerarchico, K-means
Gaussian Mixtures, Algoritmo EM; Mean Shift;
Segmentazione basata su grafi: Normalized Cuts;
Edge-based segmentation: Hough rette, rette con parametrizzazione theta; Hough cerchi e generalizzata; Watersheds
Principio di formazione del moto sul piano immagine. Applicazioni ed esempi pratici di analisi del moto. Relazione tra 3D motion field e 2D motion field.
Flusso ottico. Definizione e relazione con 2D motion field. Casi particolari e degeneri. Distinzione tra metodi densi e metodi sparsi. Stima del flusso ottico tramite metodi differenziali: algoritmo Horn&Schunk.
Stima del flusso ottico tramite il metodo di Lucas e Kanade. Stima del flusso con modello di moto globale affine: l'algoritmo KLT. Stima in caso di displacement elevato: algoritmo KLT piramidale, metodo di Brox e Malik basato su Region Matching.
Segmentazione del moto. Casi possibili (telecamera fissa, brandeggiabile, in movimento). Segmentazione background/foreground. Metodi dinamici di modellazione del background basati su modelli statistici. Algoritmo Mixture of Gaussian. Object tracking.