Sur le site Web de l'un des plus grands records électroniques électroniques grand public, une recherche de «refroidisseur de bière» renvoie une prime de plus de 500 résultats pertinents, mais une recherche de «refroidisseur de bière» n'offre même pas une.Tapez «quelque chose à refroidir la bière» et le seul résultat que vous obtenez est un ensemble LEGO.
Effectuez le même exercice sur Google ou Bing et l'expérience est assez différente.Les deux moteurs les plus populaires semblent comprendre que «plus frais» et «refroidisseur» sont synonymes, et il fonctionne même assez bien sur le test «quelque chose à refroidir».
Que savent les géants du moteur de recherche que les sites de commerce électronique ne le font pas?La différence est la «recherche de vecteurs», une technologie ancrée dans la recherche de l'intelligence artificielle qui représente l'information comme des nombres plutôt que du texte.
Une fois que le contenu est converti en facteurs de recherche (qui sont essentiellement des chaînes de nombres), les algorithmes d'apprentissage automatique peuvent trouver du contenu similaire en comparant les distances entre les vecteurs pour comprendre comment les différents mots sont liés les uns aux autres.Ils peuvent également analyser le contenu environnant pour comprendre le contexte des requêtes de recherche, afin que «Songs bad Company» rende les résultats sur les airs du supergroupe des années 1980 et non sur les plats des invités indésirables.Si vous souhaitez approfondir la technologie de la recherche vectorielle, ce post sur le blog Google Cloud devrait satisfaire votre geek intérieur.
Lorsque la recherche a besoin d'une touche humaine
Ce n'est pas ainsi que la plupart des moteurs de recherche de commerce électronique fonctionnent aujourd'hui."Great Search est en fait un jeu de données et d'apprentissage automatique, mais aucune des principales technologies de recherche disponibles aujourd'hui ne le fait directement", a déclaré Hamish Ogilvy, PDG de Search.io, qui fabrique un moteur de recherche pour les vendeurs électroniques en fonction de la technologie vectorielle.Le résultat est que «la qualité de la recherche est fondamentalement motivée par la compétence des humains pour configurer et se connecter à d'autres systèmes».
En d'autres termes, les moteurs de recherche sur la plupart des sites commerciaux ne sont aussi bons que les êtres humains derrière eux.Des géants comme Amazon.com ont été en mesure d'externaliser les hacks nécessaires pour fournir des résultats pertinents aux équipes de la science des données sur une période d'années, mais la plupart des détaillants sont coincés avec tout ce qui est le moteur de recherche par défaut du fournisseur de services qu'ils utilisent.
La plupart ne sont pas bien servis par cela.Une récente enquête sur les performances de recherche des 50 sites de commerce électronique approfondis aux États-Unis par le Baymard Institute a déclaré que l'état de recherche de commerce électronique était «brisé», notant que seulement 34% des sites pourraient gérer les requêtes qui utilisent des thèmes,caractéristiques ou symptômes plutôt que de noms de produits spécifiques."Un énorme 70% des moteurs de recherche ne sont pas en mesure de retourner les résultats pertinents pour les synonymes de type de produit - requiant les utilisateurs à rechercher en utilisant exactement le même jargon que le site", a affirmé la société.
Cela coûte beaucoup d'argent aux vendeurs.Un récent rapport de Google a estimé que les entreprises de commerce électronique perdent 300 milliards de dollars par an aux États-Unis seulement parce que les visiteurs ne trouvent pas ce qu'ils recherchent.
Ajustement et conséquences involontaires
La recherche traditionnelle repose sur les chaînes de texte correspondantes, a expliqué Ogilvy.En conséquence, une recherche sur les «Crewnecks» ne renverra aucun résultat lié aux t-shirts à moins que la relation ne soit définie par des règles qui sont codées en dur dans l'index.Pour gérer une recherche d'un ordinateur mobile, par exemple, le moteur doit être informé que les mots «portables», «ordinateur portable», «cahier» et «MacBook» sont fonctionnellement les mêmes.L'effort manuel de codage de ces relations multiplié par des milliers de produits qui peuvent chacun être mentionnés de plusieurs manières est presque inimaginablement complexe.
Et le codage à la main crée ses propres problèmes à mesure que le nombre de règles s'accumule.Ogilvy cite l'exemple d'une entreprise qui avait programmé une solution de contournement qui reformate les recherches pour «USB C» dans «USB-C», qui était la syntaxe qu'elle a utilisée dans son catalogue.Le résultat involontaire était que lorsque les visiteurs ont recherché le «câble USB», le trait d'union a été automatiquement ajouté à la chaîne de texte et à la requête résultante - «USB-Cable» - est venue vide.
"Il est très difficile d'écrire des milliers de ces choses et de ne pas causer de problèmes", a déclaré Ogilvy.
Ces limitations avaient incité la plupart des opérateurs de sites de commerce électronique à optimiser les requêtes le plus élevés et à abandonner efficacement les 70% des demandes qui constituent la «longue queue» des termes de recherche rarement utilisés.
La bonne nouvelle est que la situation s'améliorera dans un avenir pas trop lointain.Les fabricants de moteurs de recherche de commerce électronique "se précipitent tous vers Vector", a déclaré Ogilvy.«C'est ainsi que la recherche sera effectuée à l'avenir.»
La question n'est pas de savoir si la recherche vectorielle ira courant mais quand."Je m'attends à ce que tout le monde ira dans cette direction", a-t-il déclaré.La transition ne sera pas nécessairement fluide.Au fur et à mesure que les opérateurs de sites Web échangent leurs services publics de recherche fortement corrigés, de nombreuses règles devront être éliminées et certains ont changé, car l'apprentissage automatique n'est pas magique et ne peut pas anticiper les nuances de chaque cas d'utilisation.Cependant, à long terme, tout le monde sera mieux.Je parierai un cas de bière froide dessus.
Ensuite, lisez ceci: