• Home
  • /
  • News
  • /
  • AI, Computer Vision e Deep Convolutional Neural Network

AI, Computer Vision e Deep Convolutional Neural Network



28/05/2021

Il mondo dell’intelligenza artificiale (IA) sta suscitando sempre maggiore interesse da parte sia degli addetti ai lavori che dei meno esperti. Strettamente legato al Machine Learning e alla Data Science, l’IA si avvale di tecniche di apprendimento automatico ponendosi come e l’obiettivo di emulare il comportamento “umano” in diverse situazioni.

All’interno di questo vasto mondo, a partire dagli anni ‘60, si è sviluppata una branca che si occupa esclusivamente dello studio e della riproduzione delle dinamiche tipiche del sistema visivo umano, ovvero la Computer Vision. Proprio di tale argomento si è discusso con il Professor Sebastiano Battiato, professore ordinario di informatica presso l’Università di Catania ed esperto di Digital Forensics, ovvero delle applicazioni in ambito forense delle tecniche di analisi e di IA ai contesti investigativo forensi.

L’evoluzione della tecnologia, la disponibilità di dati e la sempre maggiore capacità computazionale hanno permesso di ottenere miglioramenti esponenziali delle performance di tali tecniche nei più disparati ambiti di applicazione: dalla semplice classificazione di immagini, all’identificazione di oggetti e persino alla descrizione di attività rappresentate all’interno delle stesse (image captioning). Grazie alla loro elevata accuratezza si è arrivati a poter utilizzare tali strumenti in un ambito molto complesso come quello dei sistemi di guida autonoma.

La rivoluzione delle CNN

Il punto di rottura, in termini di performance si è registrato a partire dal 2012, con il passaggio da metodi cosiddetti tradizionali, dove il processamento delle immagini avveniva tramite trasformazioni “manuali” e basate su esperienza e conoscenza di dominio, alle Deep Convolutional Neural Network o DCNN in cui l’apprendimento delle “feature”  di interesse viene demandato interamente all’algoritmo di apprendimento. Il vantaggio ottenuto in termini di accuratezza e robustezza complessiva anche su task complessi è stato enorme, portando il livello di errore commesso dalle macchine, spesso al di sotto di quello umano.

L’evoluzione di tali tecniche  ha però fatto sorgere problematiche legate soprattutto all’utilizzo fraudolento di tali strumenti. L’esempio per eccellenza è il Deep Fake, ovvero la generazione di immagini, video o testi realizzati con un livello di realismo così spinto da poter essere utilizzati per ingannare a scopo fraudolento ( es revenge porn), frodare o addirittura influenzare il pensiero collettivo. Per limitare i danni, diverse sono le tecniche di detection che sempre tramite meccanismi analoghi vengono impiegati per individuare le forme di manipolazione di fonti audio-visive a qualsiasi titolo

Computer vision e sport

Tra i vari ambiti di applicazione della Computer Vision c’è anche lo sport. Si può utilizzare uno Human Pose Tracker, un sistema in grado di riconoscere un corpo umano all’interno di un’immagine e di identificare e tracciare le articolazioni all’interno di uno spazio di coordinate, per osservare e studiare l’esecuzione di gesti tecnici, coma la battuta nella pallavolo. Questo strumento è in grado di supportare le sedute di allenamento e aiutare  gli atleti a migliorare le loro performance. 

Si può inoltre costruire un sistema di monitoraggio in grado di misurare e memorizzare gli esiti di una seduta di allenamento di tiro con l’arco restituendo un report dettagliato per ciascuna sessione di tiro contenente le performance ottenute su diversi archi temporali.

Grazie allo Human Pose Tracker è possibile fornire informazioni in real time agli appassionati di calcio attraverso un’applicazione di la realtà aumentata che fornisce le specifiche sul posizionamento e le performance dei giocatori semplicemente inquadrando il campo di gioco con lo smartphone. 

Contattaci per ricevere ulteriori informazioni