Identifier les abus de téléphone portable des conducteurs avec des filtres polarisants et la reconnaissance d’objets

Publié le 08 septembre 2021 par Mycamer

Des chercheurs au Royaume-Uni ont proposé un système routier pour automatiser la détection de l’utilisation illégale de téléphones portables parmi les conducteurs, en utilisant des filtres photo-optiques classiques et une capture infrarouge. Selon la qualité de l’équipement de capture, le système a démontré un taux de précision allant jusqu’à 95,81 % lors d’essais en conditions réelles.

L’un des modèles des chercheurs en action. La zone du pare-brise est d’abord identifiée et isolée en tant que zone de chalandise pour une recherche assistée par IA d’images d’un téléphone mobile. Le système est conçu pour ignorer les téléphones portables montés et rechercher les appareils qui sont activement tenus par le conducteur. Source : https://www.youtube.com/watch?v=PErIUr3Cxvg

Les recherche est intitulé Identification des violations d’utilisation du téléphone par le conducteur via une détection d’objets à la pointe de la technologie avec suivi, et vient de la School of Computing de l’Université de Newcastle.

Surmonter la réflectivité des pare-brise

Les approches antérieures de la détection de l’utilisation des appareils mobiles chez les conducteurs ont été entravées par la haute réflectivité des pare-brise pendant les heures de lumière du jour, exacerbée lorsque les réflexions des groupes de gros nuages ​​obscurcissent davantage l’intérieur du véhicule. De tels cas ne peuvent pas être résolus de manière réaliste avec des sources de lumière infrarouge, car la quantité d’éclairage IR nécessaire pour pénétrer la lumière du jour naturelle serait gourmande en ressources.

C’est pourquoi les chercheurs de Newcastle proposent la plus ancienne astuce du livre (datant de à 1812) pour éliminer les reflets d’une surface de verre perçue – un bon marché, physique filtre polarisant qui pourraient être attachés à des caméras de surveillance routière, calibrées une fois, et permettre par la suite un regard clair sur l’intérieur des véhicules.

<img loading="lazy" decoding="async" aria-describedby="caption-attachment-177519" class="wp-image-177519 size-full" src="https://ml8ygptwlcsq.i.optimole.com/fMKjlhs-CVtJaqdE/w:727/h:628/q:auto/https://www.unite.ai/wp-content/uploads/2021/09/polarizing-filter.jpg" alt="Ci-dessus, une vue non filtrée d'un pare-brise de voiture. Ci-dessous, la même vue avec un filtre polarisant physique attaché à la caméra. Source : https://arxiv.org/pdf/2109.02119.pdf" width="727" height="628" />

Ci-dessus, une vue non filtrée d’un pare-brise de voiture. Ci-dessous, la même vue avec un filtre polarisant physique attaché à la caméra. Source : https://arxiv.org/pdf/2109.02119.pdf

Avec le passage populaire des caméras dédiées aux capteurs mobiles, la présence du filtre polarisant dans la culture populaire a été largement réduite à son inclusion dans des lunettes de soleil de qualité raisonnable, où le porteur peut observer ses propriétés antireflet en inclinant son point de vue ou en changeant son point de vue sur l’objet réfléchissant.

La lumière du soleil est diffusée par les molécules d’oxygène et d’azote, la lumière bleue étant plus largement diffusée que les autres longueurs d’onde, faisant du bleu la couleur native d’un ciel clair pendant la journée. La lumière bleue est polarisée et une linéaire ou circulaire La lentille polarisée peut éliminer efficacement cette lumière polarisée, éliminant ainsi les reflets.

Le journal reconnaît que des pare-brise fumés pourraient entraver ou même déjouer cette méthode de vision à l’intérieur de la voiture. Cependant, puisqu’il s’agit limité par la loi britannique, avec des règlements variant selon l’état aux États-Unis, le journal ne considère pas cela comme un obstacle principal.

YOLO

Le système proposé par le document est destiné à être intégré dans les infrastructures civiques, telles que les caméras de surveillance routière installées par le gouvernement. Conscients des obstacles possibles en matière de coût, les chercheurs ont testé diverses configurations de système de reconnaissance d’objets sur une variété de niveaux de qualité d’équipement de capture et proposent un scénario à coût minimal dans lequel des filtres polarisants bon marché pourraient être ajoutés aux caméras existantes, avec tous les autres aspects de la système à distance.

Quatre frameworks de reconnaissance d’objets ont été testés : You-Only-Look-Once (YOLO) versions 3 et 4 ; SSD réseau de base; R-CNN plus rapide; et CentreNet. Lors des tests, les résultats les plus précis ont été obtenus avec YOLO V3, en utilisant un flux de travail en deux étapes qui localise d’abord la zone du pare-brise, puis recherche un appareil mobile dans cet espace.

<img loading="lazy" decoding="async" class="alignnone wp-image-177520 size-full" src="https://ml8ygptwlcsq.i.optimole.com/fMKjlhs-B7rGxZmY/w:1200/h:288/q:auto/https://www.unite.ai/wp-content/uploads/2021/09/YOLO.jpg" alt="" width="1200" height="288" />

Cependant, la nécessité de diffuser la vidéo sur deux réseaux se traduit par une fréquence d’images moins qu’optimale de 13,15 ips, contre plus de 30 ips sur le système plus simple. La qualité des résultats dépend de l’équipement d’entrée, et les chercheurs ont découvert que lorsque l’entrée était divisée entre des caméras bas de gamme et des équipements de meilleure qualité, un taux de précision de près de 96% était possible sur le meilleur kit et de 74,35% sur le moins cher. appareils photo.

Limiter les infractions reconnues

En plus de rendre le système économiquement viable, les chercheurs sont soucieux de développer un système entièrement automatisé avec un minimum de surveillance humaine nécessaire, et le système a été conçu pour infliger automatiquement des amendes. Cependant, étant donné que les lois concernant l’utilisation du téléphone portable au volant deviennent plus sévères dans le monde, avec des sanctions pouvant dépasser de simples amendes ou déductions de points de permis (c’est-à-dire au Royaume-Uni), il semble probable qu’une vérification humaine occasionnelle resterait un facteur dans le déploiement de un tel système.

<img loading="lazy" decoding="async" class="alignnone wp-image-177521 size-full" src="https://ml8ygptwlcsq.i.optimole.com/fMKjlhs-KJs0Tew-/w:623/h:410/q:auto/https://www.unite.ai/wp-content/uploads/2021/09/mobile-device-recognition.jpg" alt="" width="623" height="410" />

Malgré l’utilisation du flux optique et d’autres méthodes pour prendre en compte l’intégralité du contenu vidéo, les algorithmes de reconnaissance d’objets tels que YOLO considèrent chaque image comme une « histoire complète », et l’image suivante comme un projet ultérieur. Par conséquent, un système de cette nature doit être empêché d’émettre (par exemple) 128 amendes distinctes couvrant 128 images de vidéo de capture d’infraction.

Pour éviter cela, le système intègre l’algorithme de suivi d’objet TRI en profondeur, qui ajoute un « ID d’incident » unique à chaque reconnaissance d’infraction et garantit que l’ID n’est pas dupliqué entre les images au sein d’une même séquence de capture.

Gestion de la surveillance nocturne

Pour les conditions nocturnes, les chercheurs optent par défaut pour la capture infrarouge, comme dans les précédents projets de recherche portant sur le même défi. Ils ont testé des longueurs d’onde IR de 850 et 730 nanomètres et ont découvert que les meilleurs détails étaient capturés avec 730 nm.

<img loading="lazy" decoding="async" class="alignnone wp-image-177522 size-full" src="https://ml8ygptwlcsq.i.optimole.com/fMKjlhs-a_qp1JyY/w:610/h:527/q:auto/https://www.unite.ai/wp-content/uploads/2021/09/infrared.jpg" alt="" width="610" height="527" />

Le document soutient qu’une enquête plus approfondie est nécessaire pour déterminer dans quelle mesure la capture infrarouge pourrait être utilisée pendant la journée.

Données

Pour la version en une seule étape plus économique du système, les chercheurs ont utilisé 2 235 images de plaques d’immatriculation du Ensemble de données Google Open Images, et 2150 images de téléphone mobile en stock et sur mesure. Puisqu’il était nécessaire d’inclure des images de téléphones détenus par des chauffeurs, 1 700 des images de téléphones ont été prises spécifiquement pour le projet.

Le système en deux étapes nécessitait l’annotation de 487 pare-brise, utilisés pour former la première étape du processus, en plus des données utilisées dans le processus en une étape.

Comme il n’y avait pas d’accès à l’infrastructure de surveillance routière officielle, toutes les images ont été prises par des bénévoles pour se rapprocher des conditions similaires.

Compromis

Les résultats finaux offrent une gamme de normes de précision qui devraient être comparées au coût de mise en œuvre, avec un équipement de capture supérieur et des résultats de traitement offrant la plus grande précision, et sans doute une précision « acceptable » pouvant être obtenue par une mise à niveau peu coûteuse de l’équipement de surveillance urbaine existant .

<img loading="lazy" decoding="async" aria-describedby="caption-attachment-177523" class="wp-image-177523 size-full" src="https://ml8ygptwlcsq.i.optimole.com/fMKjlhs-z0hALIFx/w:1200/h:563/q:auto/https://www.unite.ai/wp-content/uploads/2021/09/average-precision.jpg" alt="Le pipeline « en une seule étape » moins cher atteint une précision proche de 75 %, avec les coûts de mise en œuvre les plus bas (c.-à-d. appareil mobile détenu par le conducteur) atteint des taux de précision plus élevés, mais peut ne convenir qu'à une nouvelle infrastructure, en fonction du budget disponible." width="1200" height="563" />

Le pipeline « en une seule étape » moins cher atteint une précision proche de 75 %, avec les coûts de mise en œuvre les plus bas (c.-à-d. appareil mobile détenu par le conducteur) atteint des taux de précision plus élevés, mais peut ne convenir qu’à une nouvelle infrastructure, en fonction du budget disponible. Dans les deux cas, la qualité des équipements de capture est une variable supplémentaire.

Comme indiqué ci-dessus, la perception des chercheurs de la viabilité du projet semble être informée par l’hypothèse que le système devrait fonctionner de manière entièrement autonome – une exigence discutable.

Jetez un œil à la vidéo officielle du projet ci-dessous pour plus de détails sur la mise en œuvre et les approches utilisées.

Des chercheurs au Royaume-Uni ont proposé un système routier pour automatiser la détection de l’utilisation illégale de téléphones portables parmi les conducteurs, en utilisant des filtres photo-optiques classiques et une capture infrarouge. Selon la qualité de l’équipement de capture, le système a démontré un taux de précision allant jusqu’à 95,81 % lors d’essais en conditions réelles.

L’un des modèles des chercheurs en action. La zone du pare-brise est d’abord identifiée et isolée en tant que zone de chalandise pour une recherche assistée par IA d’images d’un téléphone mobile. Le système est conçu pour ignorer les téléphones portables montés et rechercher les appareils qui sont activement tenus par le conducteur. Source : https://www.youtube.com/watch?v=PErIUr3Cxvg

Les recherche est intitulé Identification des violations d’utilisation du téléphone par le conducteur via une détection d’objets à la pointe de la technologie avec suivi, et vient de la School of Computing de l’Université de Newcastle.

Surmonter la réflectivité des pare-brise

Les approches antérieures de la détection de l’utilisation des appareils mobiles chez les conducteurs ont été entravées par la haute réflectivité des pare-brise pendant les heures de lumière du jour, exacerbée lorsque les réflexions des groupes de gros nuages ​​obscurcissent davantage l’intérieur du véhicule. De tels cas ne peuvent pas être résolus de manière réaliste avec des sources de lumière infrarouge, car la quantité d’éclairage IR nécessaire pour pénétrer la lumière du jour naturelle serait gourmande en ressources.

C’est pourquoi les chercheurs de Newcastle proposent la plus ancienne astuce du livre (datant de à 1812) pour éliminer les reflets d’une surface de verre perçue – un bon marché, physique filtre polarisant qui pourraient être attachés à des caméras de surveillance routière, calibrées une fois, et permettre par la suite un regard clair sur l’intérieur des véhicules.

<img loading="lazy" decoding="async" aria-describedby="caption-attachment-177519" class="wp-image-177519 size-full" src="https://ml8ygptwlcsq.i.optimole.com/fMKjlhs-CVtJaqdE/w:727/h:628/q:auto/https://www.unite.ai/wp-content/uploads/2021/09/polarizing-filter.jpg" alt="Ci-dessus, une vue non filtrée d'un pare-brise de voiture. Ci-dessous, la même vue avec un filtre polarisant physique attaché à la caméra. Source : https://arxiv.org/pdf/2109.02119.pdf" width="727" height="628" />

Ci-dessus, une vue non filtrée d’un pare-brise de voiture. Ci-dessous, la même vue avec un filtre polarisant physique attaché à la caméra. Source : https://arxiv.org/pdf/2109.02119.pdf

Avec le passage populaire des caméras dédiées aux capteurs mobiles, la présence du filtre polarisant dans la culture populaire a été largement réduite à son inclusion dans des lunettes de soleil de qualité raisonnable, où le porteur peut observer ses propriétés antireflet en inclinant son point de vue ou en changeant son point de vue sur l’objet réfléchissant.

La lumière du soleil est diffusée par les molécules d’oxygène et d’azote, la lumière bleue étant plus largement diffusée que les autres longueurs d’onde, faisant du bleu la couleur native d’un ciel clair pendant la journée. La lumière bleue est polarisée et une linéaire ou circulaire La lentille polarisée peut éliminer efficacement cette lumière polarisée, éliminant ainsi les reflets.

Le journal reconnaît que des pare-brise fumés pourraient entraver ou même déjouer cette méthode de vision à l’intérieur de la voiture. Cependant, puisqu’il s’agit limité par la loi britannique, avec des règlements variant selon l’état aux États-Unis, le journal ne considère pas cela comme un obstacle principal.

YOLO

Le système proposé par le document est destiné à être intégré dans les infrastructures civiques, telles que les caméras de surveillance routière installées par le gouvernement. Conscients des obstacles possibles en matière de coût, les chercheurs ont testé diverses configurations de système de reconnaissance d’objets sur une variété de niveaux de qualité d’équipement de capture et proposent un scénario à coût minimal dans lequel des filtres polarisants bon marché pourraient être ajoutés aux caméras existantes, avec tous les autres aspects de la système à distance.

Quatre frameworks de reconnaissance d’objets ont été testés : You-Only-Look-Once (YOLO) versions 3 et 4 ; SSD réseau de base; R-CNN plus rapide; et CentreNet. Lors des tests, les résultats les plus précis ont été obtenus avec YOLO V3, en utilisant un flux de travail en deux étapes qui localise d’abord la zone du pare-brise, puis recherche un appareil mobile dans cet espace.

<img loading="lazy" decoding="async" class="alignnone wp-image-177520 size-full" src="https://ml8ygptwlcsq.i.optimole.com/fMKjlhs-B7rGxZmY/w:1200/h:288/q:auto/https://www.unite.ai/wp-content/uploads/2021/09/YOLO.jpg" alt="" width="1200" height="288" />

Cependant, la nécessité de diffuser la vidéo sur deux réseaux se traduit par une fréquence d’images moins qu’optimale de 13,15 ips, contre plus de 30 ips sur le système plus simple. La qualité des résultats dépend de l’équipement d’entrée, et les chercheurs ont découvert que lorsque l’entrée était divisée entre des caméras bas de gamme et des équipements de meilleure qualité, un taux de précision de près de 96% était possible sur le meilleur kit et de 74,35% sur le moins cher. appareils photo.

Limiter les infractions reconnues

En plus de rendre le système économiquement viable, les chercheurs sont soucieux de développer un système entièrement automatisé avec un minimum de surveillance humaine nécessaire, et le système a été conçu pour infliger automatiquement des amendes. Cependant, étant donné que les lois concernant l’utilisation du téléphone portable au volant deviennent plus sévères dans le monde, avec des sanctions pouvant dépasser de simples amendes ou déductions de points de permis (c’est-à-dire au Royaume-Uni), il semble probable qu’une vérification humaine occasionnelle resterait un facteur dans le déploiement de un tel système.

<img loading="lazy" decoding="async" class="alignnone wp-image-177521 size-full" src="https://ml8ygptwlcsq.i.optimole.com/fMKjlhs-KJs0Tew-/w:623/h:410/q:auto/https://www.unite.ai/wp-content/uploads/2021/09/mobile-device-recognition.jpg" alt="" width="623" height="410" />

Malgré l’utilisation du flux optique et d’autres méthodes pour prendre en compte l’intégralité du contenu vidéo, les algorithmes de reconnaissance d’objets tels que YOLO considèrent chaque image comme une « histoire complète », et l’image suivante comme un projet ultérieur. Par conséquent, un système de cette nature doit être empêché d’émettre (par exemple) 128 amendes distinctes couvrant 128 images de vidéo de capture d’infraction.

Pour éviter cela, le système intègre l’algorithme de suivi d’objet TRI en profondeur, qui ajoute un « ID d’incident » unique à chaque reconnaissance d’infraction et garantit que l’ID n’est pas dupliqué entre les images au sein d’une même séquence de capture.

Gestion de la surveillance nocturne

Pour les conditions nocturnes, les chercheurs optent par défaut pour la capture infrarouge, comme dans les précédents projets de recherche portant sur le même défi. Ils ont testé des longueurs d’onde IR de 850 et 730 nanomètres et ont découvert que les meilleurs détails étaient capturés avec 730 nm.

<img loading="lazy" decoding="async" class="alignnone wp-image-177522 size-full" src="https://ml8ygptwlcsq.i.optimole.com/fMKjlhs-a_qp1JyY/w:610/h:527/q:auto/https://www.unite.ai/wp-content/uploads/2021/09/infrared.jpg" alt="" width="610" height="527" />

Le document soutient qu’une enquête plus approfondie est nécessaire pour déterminer dans quelle mesure la capture infrarouge pourrait être utilisée pendant la journée.

Données

Pour la version en une seule étape plus économique du système, les chercheurs ont utilisé 2 235 images de plaques d’immatriculation du Ensemble de données Google Open Images, et 2150 images de téléphone mobile en stock et sur mesure. Puisqu’il était nécessaire d’inclure des images de téléphones détenus par des chauffeurs, 1 700 des images de téléphones ont été prises spécifiquement pour le projet.

Le système en deux étapes nécessitait l’annotation de 487 pare-brise, utilisés pour former la première étape du processus, en plus des données utilisées dans le processus en une étape.

Comme il n’y avait pas d’accès à l’infrastructure de surveillance routière officielle, toutes les images ont été prises par des bénévoles pour se rapprocher des conditions similaires.

Compromis

Les résultats finaux offrent une gamme de normes de précision qui devraient être comparées au coût de mise en œuvre, avec un équipement de capture supérieur et des résultats de traitement offrant la plus grande précision, et sans doute une précision « acceptable » pouvant être obtenue par une mise à niveau peu coûteuse de l’équipement de surveillance urbaine existant .

<img loading="lazy" decoding="async" aria-describedby="caption-attachment-177523" class="wp-image-177523 size-full" src="https://ml8ygptwlcsq.i.optimole.com/fMKjlhs-z0hALIFx/w:1200/h:563/q:auto/https://www.unite.ai/wp-content/uploads/2021/09/average-precision.jpg" alt="Le pipeline « en une seule étape » moins cher atteint une précision proche de 75 %, avec les coûts de mise en œuvre les plus bas (c.-à-d. appareil mobile détenu par le conducteur) atteint des taux de précision plus élevés, mais peut ne convenir qu'à une nouvelle infrastructure, en fonction du budget disponible." width="1200" height="563" />

Le pipeline « en une seule étape » moins cher atteint une précision proche de 75 %, avec les coûts de mise en œuvre les plus bas (c.-à-d. appareil mobile détenu par le conducteur) atteint des taux de précision plus élevés, mais peut ne convenir qu’à une nouvelle infrastructure, en fonction du budget disponible. Dans les deux cas, la qualité des équipements de capture est une variable supplémentaire.

Comme indiqué ci-dessus, la perception des chercheurs de la viabilité du projet semble être informée par l’hypothèse que le système devrait fonctionner de manière entièrement autonome – une exigence discutable.

Jetez un œil à la vidéo officielle du projet ci-dessous pour plus de détails sur la mise en œuvre et les approches utilisées.

— to www.unite.ai