A visão computacional ajuda a automatizar muitas tarefas essenciais na loja, mas para que isso funcione, é necessário dar prioridade a uma elevada precisão de reconhecimento de imagem como primeira linha de diferenciação.

No mercado de retalho atual, acelerado e hipercompetitivo, a maioria dos fabricantes e retalhistas não dispõe de visibilidade precisa e atempada nas prateleiras ou de informações acionáveis sobre a sua realidade de retalho na loja. As auditorias manuais efectuadas pelo pessoal de vendas que documenta as condições das prateleiras num dispositivo portátil são lentas, dispendiosas, inconsistentes e resultam em dados subjectivos.

As soluções de Visão por Computador (CV) estão a mudar a forma como as marcas e os retalhistas vêem as prateleiras. Esta tecnologia fornece aos fabricantes informações sobre as condições nas prateleiras dos retalhistas sob a forma de uma imagem digital e dá orientações ao pessoal no terreno, quase em tempo real, sobre a forma de obter maior valor.

Mas para que isto funcione, é necessário dar prioridade a uma elevada precisão de reconhecimento de imagem como primeira linha de diferenciação. Neste artigo, iremos aos bastidores para ver o que é necessário para fornecer um reconhecimento exato ao nível da unidade de manutenção de stock (SKU) com velocidade e escala.

Porque é que a exatidão é importante

Numa mercearia típica, podem existir mais de 30.000 SKUs e, em média, 30% delas podem mudar ao longo do ano com a entrada de novos produtos e a reformulação das embalagens. Para além de lidar com o enorme volume de produtos, uma plataforma de reconhecimento automático também tem de ultrapassar outros obstáculos à precisão no ambiente de retalho, tais como

  • Produtos quase idênticos
  • Embalagens obscuras e reflectoras, e ângulos deficiente
  • Más condições visuais, como pouca luz
  • Produtos parcialmente obstruídos
  • Alterações no ciclo de vida do produto, como novas variantes de design

Se não forem tidos em conta, podem resultar em dados incorrectos - por exemplo, o cálculo incorreto da quota de prateleira de uma marca devido a produtos parcialmente obstruídos. Quando estes dados não fiáveis são utilizados para orientar as decisões de venda, as perdas monetárias podem aumentar rapidamente ao longo do tempo.

Uma abordagem em quatro vertentes para garantir a exatidão

Na Trax, estes obstáculos são ultrapassados através de uma abordagem rigorosa de controlo da qualidade dos dados, baseada nas seguintes medidas:

  1. Enorme repositório de dados de formação

A visão computacional utiliza redes neuronais avançadas e técnicas de aprendizagem profunda para tarefas como a deteção de objectos. É modelado no córtex visual humano, o que significa que, tal como o cérebro humano, quanto mais se vê, melhor se aprende.

Com um repositório de imagens suficientemente grande, os algoritmos avançados de aprendizagem profunda superam os desafios das condições da loja, como a fraca iluminação e as obstruções. Os sistemas mais precisos são os que detetam o contexto das prateleiras e detetam rapidamente não só os produtos, mas também os espaços vazios nas prateleiras.

 

  1. Imagens de alta qualidade

Durante a captura, uma ferramenta de prevenção de desfocagem assegura que a imagem produzida é nítida, enquanto uma ferramenta de instantâneos alerta o utilizador se a orientação for diferente de uma imagem anterior. Para compensar a falta de luz, o flash da câmara é ativado automaticamente e uma ferramenta de nivelamento incorporada ajuda a alertar o utilizador para orientar os seus dispositivos no ângulo e distância perfeitos da prateleira.

  1. Validação em vários níveis

Um motor de aprendizagem ativa garante que os produtos são automaticamente reconhecidos a partir de imagens. As amostras de imagens em que é mais difícil reconhecer ou distinguir produtos passam por uma camada adicional de validação com um processo conhecido como votação. Aqui, peritos qualificados do domínio validam os dados recolhidos para verificar se correspondem exatamente ao que está realmente na imagem. Isto significa que o sistema estabelece sempre níveis extremamente elevados de "confiança" na sua precisão de reconhecimento, mesmo no caso de produtos idênticos ou de novos designs.

 

 

  1. Medição da exatidão do reconhecimento

A precisão está no centro dos sistemas de aprendizagem profunda de última geração. Isto significa que os algoritmos devolvem resultados substancialmente mais relevantes do que os irrelevantes. Ao mesmo tempo, deve devolver a maioria dos resultados relevantes. Digamos que há 100 produtos numa prateleira. Um algoritmo pode reconhecer 80 deles, dos quais 77 são reconhecidos com exatidão. Isto significa que a precisão do reconhecimento é de 96%.

O Trax garante a transparência dos dados, fornecendo aos utilizadores painéis de controlo na Web que descrevem a precisão do desempenho do reconhecimento, a confiança, os produtos não identificados e outras métricas.

Veja este vídeo da plataforma Trax Computer Vision em ação para ver como convertemos imagens em insight com precisão.