02
Computer vision e videosistemi per la gestione urbana Computer vision e videosistemi per la gestione urbana
progetti correlati
10
02
15
La visione artificiale La Visione Artificiale (o Computer Vision, in inglese) è una disciplina dell'informatica che si occupa della sviluppo di algoritmi e sistemi per l'elaborazione automatica di immagini e video allo scopo di estrarre da essi informazioni di medio-alto livello. Storicamente la Visione Artificiale nasce come replica al computer della Visione Umana.
Il sistema visivo umano è di grande qualità, grazie anche ad un eccellente elaboratore come il nostro cervello, ma è soggetto ad "errori" e "malinterpretazioni". Cosa che non succede - o non dovrebbe succedere - per la Visione Artificiale.
Esempi di illusioni ottiche - interpretazioni multiple
Esempi del fenomeno del "contrasto simultaneo"
Di seguito possiamo vedere alcuni celebri esempi di grafiche che inducono illusioni ottiche.
Esempi di percezioni di parallelismi variate
A volte accade il contrario di quanto avviene nelle illusioni ottiche. In alcune immagini o video, individuare le componenti è relativamente facile per l'uomo mentre è alquanto complicato per gli algoritmi di visione artificiale.
Esempi di percezione di movimento apparente
Computer vision e videosistemi per la gestione urbana
02
Architettura di un sistema di Visione Artificiale In generale, qualunque sia l'applicazione, un sistema di visione artificiale è caratterizzato dalle seguenti 5 fasi (talvolta opzionali): 1) 2) 3) 4) 5)
Acquisizione immagine/video Pre-elaborazione o migliormanto delle immagini Segmentazione dell'immagine Rappresentazione e descrizione di regioni e forme Classificazione e riconoscimento di forme
Le fasi 1 e 2 sono spesse identificate con il termine "low-level vision" e si caratterizzano per avere come input un'immagine e come uscita un'immagine modificata e in cui vengono esaltate certe caratteristiche (ad esempio i contorni) e de-enfatizzate altre (ad esempio il rumore).
Le fasi 3 e 4 sono spesso identificate come "medium-level vision" e in questo caso hanno come ingresso un'immagine e come uscita un insieme di regioni e di descrittori delle regioni (livello astratto). In pratica, queste fasi si occupano di "segmentare" (dividere) l'immagine negli oggetti semanticamente significativi che la compongono (regioni) e di estrarre automaticamente dei descrittori (visuali) che rappresentano in modo univoco le regioni estratte. I descrittori possono riguardare la regione stessa (tessitura e colore) o la sua forma e devono essere discriminativi rispetto ad altre regioni/oggetti potenzialmente presenti nell'immagine. La fase 5 è anche chiamata "high-level vision" e trasforma i descrittori della medium-level vision in concetti, cioè cerca di classificare le regioni estratte identificandole per quello che sono.
Dispositivi di acquisizione utilizzabili per la fase 1
Telecamera standard fissa, telecamera PTZ/dome/brandeggiabile, Action Camera 4K
Omnidirectional camera 360°, telecamere termiche a infrarossi passive
Telecamera NIR (Near Infrared) a infrarossi attiva, telecamere TOF (Time Of Flight)
Telecamere a luce strutturata Kinect, telecamera stero
Computer vision e videosistemi per la gestione urbana
02
Applicazioni della Visione Artificiale
Medical Imaging - Elaborazione di immagini mRI, TAC, XRay e altro per identificare patologie e/o misurare parametri biologici.
Security/Controllo Traffico/Video Sorveglianza - Elaborazione di video per l'individuazione, inseguimento e analisi dei comportamenti di singole persone, veicoli o altri oggetti in movimento. Controllo velocità natanti. Evoluzione della precedente nel caso di veicoli marittimi.
Analisi di folle e conteggio persone. Evoluzione avanzata del tema velocità veicoli dove l'analisi è effettuata a livello di folle (di persone tipicamente) per la prevenzione di incidente e la generazione di allarmi
Applicazioni industriali di controllo di qualità, controllo difettosità, movimentazione automatica oggetti, smistamento/impacchettamento oggetti.