Fluidifier le trafic avec le traitement automatique d’images vidéo

De plus en plus de voitures dans des espaces contraints et saturés

La démocratisation de l’automobile a progressivement fait de la voiture le moyen de transport individuel et quotidien d’une majorité de français : de 6,2 millions de voitures enregistrées en 1960, on en dénombre plus de 38 millions aujourd’hui.

Couplé au phénomène d’urbanisation grandissante, ce nombre croissant de voitures s’est de plus en plus concentré dans et autour des villes, dans des espaces déjà très contraints et limités. Si les pouvoirs publics ont accompagné ces mouvements en investissant massivement dans des infrastructures routières performantes et capables de drainer de plus en plus véhicules, les réseaux routiers ne peuvent s’étendre à l’infini et semblent aujourd’hui souvent saturés. En particulier dans les villes, l’espace disponible est rare et les municipalités ont au contraire tendance à mettre en place des politiques limitant l’accès des voitures dans les centres historiques.

Le trafic soulève des défis économiques et environnementaux importants

Les automobilistes sont alors confrontés à de plus en plus de bouchons, pendant et en dehors des heures de pointe. A Paris, les conducteurs passent 64 heures par an dans les bouchons, soit 11% de leur temps de conduite. À Marseille, Bordeaux et Lyon, les usagers perdent 28 heures par an dans les embouteillages.

Au niveau national, ce temps perdu constitue un manque à gagner estimé à 20 milliards d’euros par an pour les professionnels de tous secteurs : perte de productivité, perte de clients ou de fournisseurs, complexification des tournées et allongement des délais de livraison, surconsommation de carburant, etc.

Ce phénomène dégrade aussi significativement la qualité de vie en ville en générant du stress, de l’anxiété et surtout de la pollution, constituant ainsi un enjeu immense de santé publique et écologique. Plus un véhicule passe de temps dans la circulation, plus il consomme de carburant et plus il émet d’éléments polluants. La consommation d’essence au kilomètre est en effet multipliée par deux pour une même distance par rapport à un trafic fluide. De même, on estime que, sur un tronçon d’autoroute, un embouteillage génère seize fois plus d’émissions de gaz à effet de serre qu’un trafic fluide.

La vision par ordinateur, une technologie récente qui peut contribuer à réduire la congestion

L’augmentation de capacité des infrastructures étant souvent exclue ou impossible, les pouvoirs publics et les villes sont à la recherche de solutions innovantes permettant de réduire la congestion. Ils adoptent notamment de nouvelles approches dites « smart » qui placent le numérique et les nouvelles technologies au cœur de leurs démarches visant à améliorer la qualité de vie de leurs citoyens. Les « smart cities » déploient par exemple de plus en plus d’appareil connectés (IoT) pour mieux connaitre les usages de leurs habitants et des automobilistes. En particulier, les caméras couplées aux dernières technologies de vision par ordinateur, constituent une formidable opportunité pour mieux piloter et fluidifier le trafic automobile.

La vision par ordinateur est une discipline de l’intelligence artificielle qui consiste à analyser, traiter et comprendre automatiquement des images et vidéos. Jusqu’à très récemment, les avancées technologiques dans le domaine étaient limitées. Les algorithmes manquaient de flexibilité et étaient très sensibles aux variations (luminosité, angle de vue, distance). Les applications nécessitaient une ingénierie lourde et des algorithmes d’analyses de pixels sur-mesure. Par conséquent, seuls quelques cas d’usage étaient suffisamment robustes pour être utilisés à grande échelle dans les villes et sur les routes (par exemple la lecture automatique de plaque d’immatriculation). La grande majorité des images restait ainsi sous-exploitée du fait d’un déficit de ressources humaines et financières pour en tirer le plein potentiel.

Les récentes innovations algorithmiques, notamment le deep learning, conjuguées à une démocratisation des infrastructures de calcul (cartes graphiques) et des quantités de données gigantesques et facilement accessibles ont fait entrer la vision par ordinateur dans une nouvelle ère. Il devient désormais possible de l’utiliser à grande échelle, sur les centaines de milliers de caméras installées sur les routes, pour détecter, catégoriser, suivre et analyser automatiquement le comportement de véhicules sur des réseaux routiers, quelle que soit la luminosité, l’angle de vue et la qualité des images.

Des caméras pour mieux piloter les flux et penser des réseaux plus adaptés

Le premier apport de la vision par ordinateur est ainsi de pouvoir démocratiser et préciser la statistique routière. L’analyse automatique de vidéo permet de compter et suivre en temps réel de manière fiable et différenciée (piétons, vélos, véhicules légers, poids lourds, transports en commun, etc.) les flux sur un réseau, là où les dispositifs historiques (boucles de comptage) fournissent de l’information peu différenciée, de comptage simple (sans notion directionnelle), tombent souvent en panne et sont difficiles à entretenir.

Les gestionnaires de réseaux routiers disposent ainsi d’une information de meilleure qualité et disponible à grande échelle (milliers de caméras déjà installées) pour prendre des décisions éclairées quant à la gestion dynamique du réseau et aux travaux d’aménagement permettant de l’améliorer.

L’utilisation en temps différé de la statistique issue des caméras permet d’analyser les infrastructures sur longue période pour évaluer l’adéquation des usages avec les besoins des utilisateurs. S’il est compliqué d’agrandir les réseaux, il est possible de les adapter pour qu’ils correspondent davantage aux flux réels.

S’appuyer sur les caméras pour mettre en place la régulation dynamique de vitesse selon le taux d’occupation des voies

La statistique en temps réel fournie par les caméras permet de constater automatiquement et en direct les situations denses qui correspondent aux cas les plus sujets aux embouteillages : il suffit en effet qu’un automobiliste freine brusquement pour provoquer une réaction en chaine et d’importants bouchons. Pour l’éviter, il est alors possible d’utiliser cette information pour mettre en place la régulation dynamique de vitesse, qui consiste à imposer des limitations de vitesse variables en fonction de la densité de circulation observée. Il est en effet démontré que maîtriser un ralentissement en abaissant légèrement et ponctuellement la vitesse maximale autorisée permet d’éviter les coups de frein intempestifs et donc de fluidifier la circulation plutôt que de la bloquer.

Utiliser les statistiques issues des caméras pour synchroniser plus efficacement les feux tricolores

Connaitre en temps réel l’encombrement des axes grâce aux caméras peut aussi permettre de synchroniser de manière dynamique les feux tricolores pour fluidifier le trafic. Un tel système automatisé a été mis en place en 2013 à Los Angeles, alors considérée comme la ville la plus embouteillée des États-Unis. Le système recueille, en temps réel, des données concernant le trafic routier et les utilise pour adapter la durée des feux de signalisation et synchroniser les phases d’arrêt et de circulation (rouge/vert), ce qui permet de fluidifier la circulation, notamment en réduisant les temps d’arrêt et donc, directement, le temps de conduite et les émissions polluantes associées. La mesure s’avère efficace : les automobilistes ont réduit leur temps de parcours de 14%, leur temps d’arrêt de 31% et leurs retards de 21%.

Surtout, l’analyse vidéo, contrairement à un système de comptage classique, permet de prendre en compte les mobilités douces (vélos, trottinettes, etc.) et les piétons pour intégrer aussi les temps d’attente de ces populations dans les algorithmes de régulation des feux.

Détecter automatiquement les incidents de trafic et décourager les comportements dangereux

L’analyse de vidéo en temps réel permet aussi de détecter automatiquement des incidents de trafic, qui peuvent significativement impacter la fluidité du trafic : accident, véhicule à contre-sens, panne, etc. Avec l’émission d’alertes automatiques, les gestionnaires de réseaux sont prévenus instantanément et peuvent réagir plus rapidement pour normaliser le trafic.

La vision par ordinateur pourra aussi automatiser et généraliser la vidéo-verbalisation, constituant ainsi un outil majeur de dissuasion des comportements dangereux sur les axes routiers qui contribuent largement à la congestion (vitesses excessives, dépassements dangereux, etc.).

Orienter les automobilistes vers les places de stationnement disponibles

Enfin, les nouveaux algorithmes de vision par ordinateur sont aussi capables de détecter et compter automatiquement les places de stationnement disponibles dans la rue ou dans des parkings. En capitalisant sur les systèmes de vidéo-surveillance des rues qui offrent un maillage assez exhaustif et fins des villes, il est alors possible d’orienter intelligemment les automobilistes vers les emplacements libres. De telles solutions permettraient de réduire significativement la congestion urbaine : on estime en effet qu’à Paris, à tout instant, 2 à 3 véhicules sur 10 sont à la recherche d’une place de stationnement. Ce sont autant de véhicules qui encombrent la circulation et participent à la création d’embouteillages.