Pour être efficaces, les solutions de surveillance doivent permettre de comprendre et d'agir sur des scènes complexes. Dans la pratique, cela nécessite de rassembler d'énormes quantités de détails dans des flux vidéo et/ou audio provenant d'un grand nombre de sources potentielles. Plus il y a d'appareils dans le système, plus la quantité de détails d'intérêt potentiels est importante.
En fin de compte, une surveillance efficace consiste à agir sur les détails d'une scène qui importent aux administrateurs et aux opérateurs du système. Mais que se passe-t-il si les administrateurs ou les opérateurs ne savent pas de quelles informations ils ont besoin - ou même ce qu'ils recherchent dans une scène, par exemple ce qui sort de l'ordinaire ? Les détails qui comptent peuvent concerner une personne, un objet ou un mouvement spécifique dans une scène ou un type d'événement qui ne s'est jamais produit auparavant.
Les systèmes de surveillance modernes génèrent une quantité impressionnante de données (la plupart du temps inutilisées). C'est particulièrement vrai lorsqu'il s'agit d'enregistrer des vidéos dans le cadre d'opérations 24 heures sur 24 et 7 jours sur 7, ce qui est essentiel pour recueillir des preuves, des incidents et des événements. Il est non seulement difficile d'identifier ce qui est vraiment important dans une scène, mais cela prend également beaucoup de temps. Rendre les données plus identifiables et exploitables est un problème clé à résoudre. L'application de descripteurs de métadonnées pour décrire les détails clés d'une scène permet aux données d'être plus identifiables et exploitables.
C'est pourquoi les métadonnées constituent la base de la collecte de renseignements à partir de flux vidéo et/ou audio de surveillance. Les métadonnées offrent un moyen rapide de trouver, d'évaluer et d'agir sur les détails singuliers qui comptent le plus dans un, des centaines ou des milliers de flux de séquences vidéo et audio. Les métadonnées sont désormais un élément essentiel d'une sécurité efficace et des opérations commerciales.
Mais qu'est-ce que les métadonnées ?
Une définition s'impose. Comme le révèlent les recherches sur Google, les métadonnées sont généralement désignées comme des "données sur d'autres données". Dans le contexte de la vidéosurveillance, il s'agirait de "données sur des données vidéo". Mais cela peut être très large. Pour être plus précis, vous devez prendre en compte les détails de la scène qui comptent. Ceux-ci décrivent les détails "où, quoi et comment" des modifications apportées à une scène dans un flux vidéo.
Les métadonnées vidéo décrivent avec précision les détails importants d'une scène en termes d'emplacement, de nature et de déplacement de ces détails dans la scène.
Cela signifie que les attributs des métadonnées peuvent décrire toutes sortes de détails sur les objets mobiles d'intérêt, par exemple :
- Emplacement, heure, couleurs, tailles, formes, coordonnées, pistes, volume en décibels, vitesse, voix, durée dans la scène, direction du déplacement
En outre, des détails plus fondamentaux tels que la description du flux vidéo, le codec, l'horodatage, l'identité de l'appareil, etc. peuvent être ajoutés.
Ainsi que des détails plus fondamentaux comme
- Description du flux vidéo, codec, horodatage, identité de l'appareil, etc.
Tous les éléments ci-dessus sont des "méta" descriptions de détails dans ou liés à une scène.
Sur la base de l'intelligence artificielle et de l'apprentissage en profondeur, les méta-descriptions peuvent être plus (ou moins) granulaires. Cela signifie que les méta-descriptions peuvent décrire des attributs à un niveau élevé ou à des niveaux plus profonds. Cela permet de classer un groupe de pixels comme une personne, un animal, un véhicule ou d'autres classes d'objets prédéfinies. Ou d'être plus précis avec des descriptions plus affinées de personnes ou d'objets, par exemple :
- Sous-type :
- Véhicule
- Voiture, bus, vélo, etc.
- Plaque d'immatriculation
- Modèle et marque
- Véhicule
- Couleur
- Rouge, jaune, bleu, vert, etc.
- Caractéristiques du mouvement
- Type de mouvement
- Vitesse
- Coordonnées de l'emplacement
La valeur des métadonnées
Les métadonnées ne fournissent pas seulement des détails sur les personnes, les objets et les événements d'une scène. Elles permettent également de regrouper, de trier, de rechercher, de récupérer et d'utiliser rapidement de grandes quantités de vidéos et de séquences enregistrées. Par conséquent, les cas d'utilisation des métadonnées se répartissent en trois domaines :
- Déclenchement d'alarmes et notifications en temps réel
- Recherche médico-légale a posteriori
- Analyse statistique et établissement de rapports
Ajouter de l'intelligence aux scènes grâce aux métadonnées
Les métadonnées attribuent essentiellement une signification numérique à chaque image vidéo concernant les objets et les événements qui s'y trouvent. En d'autres termes, elles ajoutent une interprétation ou une intelligence à la scène plutôt que de se contenter de la séquence vidéo brute qui doit être traitée manuellement par un opérateur.
Une fois que le logiciel peut interpréter les scènes de cette manière, il peut comprendre les détails de la scène et permettre d'agir sur la scène en temps réel par le biais d'événements, après les événements (post-événement), par le biais d'une recherche manuelle ou simplement par le biais d'une analyse statique. Cela permet d'utiliser les métadonnées pour concevoir des lignes de base qui définissent ce qui est "normal" pour n'importe quel flux de scène provenant de n'importe quelle caméra. En retour, cela permet au logiciel de reconnaître tout degré de déviation, d'anomalie ou de comportement ou d'activité spécifique, etc. ainsi que de prédire ce qui se passera dans cette scène avec une probabilité spécifique.
Les métadonnées permettent de nombreux autres et nouveaux cas d'utilisation, par exemple :
- Effectuer une recherche post-événement : par exemple, trouver des personnes portant des vêtements rouges dans une scène
- Effectuer une règle d'automatisation : par exemple, ouvrir la barrière pour une voiture bleue portant le numéro de plaque d'immatriculation texane XYZ123
- Effectuer une analyse statistique : par exemple, compter combien de voitures se sont déplacées dans une direction spécifique sur une route
Les métadonnées vidéo apportent une valeur ajoutée considérable à un système de gestion vidéo. En fait, leur véritable potentiel est exploité lorsqu'elles sont appliquées à de multiples entrées, qu'elles soient visuelles, sonores, liées à l'activité ou au processus. Des éléments tels que le suivi RFID, les coordonnées GPS, les alertes de détérioration, les relevés de compteurs (par exemple, la température ou les niveaux de produits chimiques), la détection du bruit et les données transactionnelles des points de vente. Dans le cadre de la gestion d'un site, il s'agit là de sources de données de grande valeur. Elles peuvent toutes être alignées sur la base de leurs horodatages. L'unification des métadonnées provenant de différentes sources permet d'obtenir beaucoup plus d'informations qu'il n'est possible d'en obtenir à partir de chaque système (isolé) pris isolément.
L'accent est mis sur l'interopérabilité. Le monde de la propriété intellectuelle peut apporter un autre avantage important. Les protocoles ouverts et les normes industrielles sont à nouveau essentiels pour permettre une intégration transparente des métadonnées. Les quantités massives de données provenant de tous les types de systèmes nous aideront à comprendre plus rapidement, plus profondément et plus largement tout ce qui nous entoure.