Manish Garg est co-fondateur et chef de produit chez Skan.ai, une plateforme d'intelligence de processus basée sur la vision par ordinateur.< /em>
La vision par ordinateur évoque pour beaucoup d'entre nous des idées de véhicules autonomes et de reconnaissance faciale. En effet, des milliards de dollars ont été consacrés à la recherche et au développement de tels systèmes. Pourtant, bien qu'il y ait des promesses et des progrès significatifs, les domaines sont également semés de défis techniques et de dilemmes moraux.
Cependant, la vision par ordinateur transcende ces cas d'utilisation très médiatisés et a des applications pratiques tout au long de la chaîne de valeur de l'entreprise. Les entreprises peuvent exploiter la puissance de la vision par ordinateur pour résoudre certains problèmes fondamentaux, à une échelle et une précision jusqu'ici insondées.
Qu'est-ce que la vision par ordinateur ?
La vision par ordinateur est une branche de l'intelligence artificielle qui traite de la façon dont les ordinateurs "voient et comprennent" les médias visuels numériques (images, vidéos, etc.). Alors que la vision par ordinateur a été un domaine d'étude dans les universités, les progrès de l'informatique ont considérablement accéléré le domaine ces dernières années.
Au cours des deux dernières décennies, les médias et formats visuels ont connu une croissance sans précédent, qu'il s'agisse de vidéos YouTube ou TikTok, de photos Instagram ou d'une multitude d'autres médias sociaux. Avec le volume, la vitesse et la variété des données visuelles, il n'est pas étonnant que le marché des applications de vision par ordinateur soit un domaine en pleine croissance.
PLUS DE FORBES ADVISORMeilleures compagnies d'assurance voyage
ParAmy DaniseEditorMeilleurs plans d'assurance voyage Covid-19
ParAmy DaniseEditorBien qu'il existe des moyens par lesquels la vision par ordinateur peut aider les entreprises dans leur quête de transformation numérique , il serait également utile de faire la distinction entre la vision par ordinateur et la vision par machine (même si les deux sont liées). La vision artificielle s'appuie sur des composants matériels pour faciliter les cas d'utilisation de l'ingénierie industrielle et de la fabrication. La vision par ordinateur est un domaine d'analyse et de compréhension d'images, qui est indépendant des méthodes d'entrée et repose principalement sur des logiciels pour catégoriser, classer, comprendre et incorporer diverses formes et formats de visuels dans le processus métier.
Il existe des centaines de cas d'utilisation potentiels pour la vision par ordinateur, mais voici quelques cas d'utilisation en entreprise pour vous aider à démarrer.
• Détection des défauts et conformité de la qualité. Les modèles assistés par ordinateur peuvent en savoir plus sur l'apparence des produits et signaler tout écart et anomalie afin qu'un opérateur humain puisse les examiner de plus près. Dans les environnements de fabrication au rythme rapide où les taux de défauts acceptables sont extrêmement faibles, la capacité des algorithmes de vision par ordinateur peut aider à élever le niveau de contrôle qualité.
• Identification et localisation de l'emplacement intérieur. Un référentiel d'instantanés existants peut devenir un point de référence pour identifier l'emplacement d'un individu et éventuellement le diriger vers d'autres endroits. Par exemple, un selfie peut aider l'acheteur à trouver le bon site dans un grand magasin, y compris un instantané de la marchandise. (Ou quelqu'un perdu dans un musée peut trouver son chemin en utilisant l'identification de l'emplacement.)
• Suivi de la chaîne d'approvisionnement en direct. Les capteurs, l'imagerie satellite et les algorithmes de vision par ordinateur peuvent aider les entreprises à suivre l'intégralité du cycle de vie de la logistique et du transport, permettant ainsi une planification des matériaux et un calendrier de production plus précis.
• Deepfakes. Les deepfakes et les informations fausses/trompeuses sont devenus un défi de taille. La vision par ordinateur peut aider à atténuer ce fléau en analysant les images au niveau du pixel et en effectuant une analyse contextuelle sur les origines et les distorsions potentielles.
• Surveillance des processus métier. Les travailleurs du savoir interagissent principalement avec les systèmes numériques pour effectuer des tâches professionnelles où les informations et les flux de travail d'un poste de travail à l'autre couvrent différentes zones géographiques et fuseaux horaires. La vision par ordinateur peut observer le travail en temps réel et tracer les processus métier de référence et les variations à travers la loi des grands nombres. Cette preuve visuelle du travail peut aider à optimiser et à transformer les processus métier.
Avant de se lancer dans des projets à grande échelle et des allocations budgétaires importantes, les entreprises doivent tenir compte des facteurs de réussite essentiels suivants.
• Choisir le problème. Parfois, les entreprises recherchent de nouvelles technologies brillantes, et dans de tels cas, cela se termine comme un cas d'une technologie à la recherche de cas d'utilisation commerciale. Il est essentiel de travailler sur des problèmes avec un besoin à long terme et un retour sur investissement mesurable. Les entreprises doivent limiter les expériences scientifiques à un centre d'incubation ou à un centre d'excellence avant de mettre en œuvre les modèles en production.
• Définir les résultats. Alors que la capacité d'un ordinateur à identifier un chat ou un chien est une réalisation monumentale, quel est le résultat commercial qui motive le cas d'utilisation de la vision par ordinateur ? À moins que votre entreprise ne soit un géant de la technologie faisant progresser le domaine de la vision par ordinateur, connaître les résultats et ce que le succès signifie pour l'entreprise est une condition préalable essentielle.
• Disponibilité des données. Les données (dans le cas de la vision par ordinateur, les données visuelles) sont au cœur du problème et de la solution. Outre la disponibilité, la qualité des données et le niveau de catégorisation et d'annotations sont des déterminants essentiels du succès.
• Disponibilité de modèles pré-entraînés. L'apprentissage par transfert à partir de modèles commerciaux ou open source pré-entraînés peut réduire le temps de recherche et de développement. À moins que votre entreprise n'ait les ressources et n'ait besoin de développer des modèles à partir de zéro, la voie de la moindre résistance consiste à tirer parti des modèles pré-entraînés et de l'apprentissage par transfert qui en résulte.
• Capacités et capacités. Il y a une pénurie de talents dans les domaines de l'intelligence artificielle, et à cause de cela, il y a une concurrence féroce pour attirer et retenir des talents de haut calibre. Avant d'importants projets de vision par ordinateur, il est primordial de faire le point sur le quotient de talents, puis de développer les capacités, le calibre et la capacité de gérer avec succès les projets de vision par ordinateur.
Alors que le contenu et les connaissances du monde deviennent de plus en plus visuels, attendez-vous à ce que les cas d'utilisation de la vision par ordinateur augmentent de manière exponentielle. Cela sera vrai à mesure que les technologies de vision par ordinateur, y compris celles en périphérie, deviendront plus puissantes.
Forbes Technology Council est une communauté sur invitation uniquement pour les DSI, les CTO et les cadres technologiques de classe mondiale. Suis-je éligible ?