/mlai9002

Azure Vision Studio

GNU General Public License v3.0GPL-3.0

Azure Vision Studio

Ao abrir o Azure Vision Studio no link https://portal.vision.cognitive.azure.com/ somos apresentados à tela de boas vindas com os modelos prontos para serem testados.

Portal Vision Studio
Best Model

Rodei uma série de testes com os modelos disponíveis no Vision Studio e os resultados são bem impressionantes, mas, ainda há dificuldade em detetar poster de animação com fotografia de um humano ou desenho animado. Levanta algumas questões preocupantes de segurança se você for usar algum desses modelos em produção, mas dá para brincar :)

Além do mais, você pode treinar um modelo novo, ou customizar os modelos já existentes, para saber mais https://learn.microsoft.com/en-us/azure/ai-services/computer-vision/how-to/model-customization?tabs=studio.

Banco de Imagens de Entrada

Descrição breve das imagens usadas nos testes.

Todas as imagens estão disponíveis na pasta inputs.

avengers-ca.jpg randy-qquant.jpeg (me) avengers.jpg mib.jpg bob-marley.jpg
Avengers Anime Randy Qquant (Me) Avengers MIB Bob Marley

Resultados Obtidos no Vision Studio

Imagem avengers-ca

Observe os serviços de Add captions to images e Add dense captions to images para descrição das imagens. O modelo identifica a imagem como fotografia de pessoas reais, bastante hilário. Mas isso pode ser facilmente explicado, porque o modelo identifica o rosto através de coordenadas descritas como pontos de referência facial, veja mais detalhes em https://learn.microsoft.com/pt-br/azure/ai-services/computer-vision/concept-face-detection.

Add captions to images Add dense captions to images 1 Add dense captions to images 2
Avengers Anime Randy Qquant (Me) Avengers

Imagem randy-qquant

Rodei os serviços Extract common tags from images e Add dense captions to images no print de uma matéria que fizeram sobre a minha startup. Uma imagem contendo texto em formato de post de instagram. O objetivo aqui era avaliar a capacidade do serviço em sugerir uma descrição para a postagem tendo como input uma imagem. Talvez o uso para copywrite não seja a forma ideal de usar essa tecnologia, mas possui grande potencial como melhoria na acessibilidade em sites na descrição de imagens, é impressionante.

Extract common tags from images Add dense captions to images 1
Randy Qquant Randy Qquant (Me)

Imagem avengers

Esse resultado foi agradavelmente surpreendente, porque o serviço identificou claramente que era um poster de filme. O Thanos não foi identificado como face humana, curioso 😵, já que o modelo identificou o avengers-ca como faces humanas 👀.

Add dense captions to images
Avengers Anime

Imagem mib

Os resultados aqui são interessantes devido à IA responsável, porque os modelos apresentavam uma dificuldade em reconhecer a diversidade, observamos que os modelos dos serviços da Azure usam uma descrição neutra.

Add captions to images Detect faces in an image
Avengers Anime Randy Qquant (Me)

Imagem bob-marley

Serviços usados foram Extract text from images e Detect faces in an image com resultados já esperados para extração de texto e deteção de faces numa imagem.

Extract text from images Detect faces in an image
Avengers Anime Randy Qquant (Me)