Google premia pesquisas em inteligência artificial da Unicamp

Docentes e estudantes de computação do IC e da Feec conquistaram bolsas de estudo pelos trabalhos acadêmicos com diagnósticos automáticos por imagem de melanoma e retinopatia diabética

Pelo segundo ano consecutivo, dois grupos de pesquisa na área de inteligência artificial da Universidade Estadual de Campinas (Unicamp) foram premiados pelo Google Research Awards for Latin America. Na edição 2017 do prêmio foram distribuídos US$ 600 mil entre os 27 projetos selecionados e, na Unicamp, os trabalhos campeões são do Instituto de Computação (IC) e da Faculdade de Engenharia Elétrica e de Computação (Feec) (ver serviço).

Os dois sistemas da Unicamp propõem diagnosticar, de modo automático, por meio da análise de imagens, doenças como o melanoma (câncer de pele) e a retinopatia diabética, uma das causas da cegueira em muitos pacientes. A finalidade deles é projetar para o futuro ferramentas e equipamentos capazes de otimizar e auxiliar o trabalho de profissionais da área da saúde, médicos e enfermeiros, por exemplo.

Criado em 2013, o programa anual do Google concede bolsas de pesquisa de um ano para docentes e estudantes de pós-graduação em áreas específicas da Ciência da Computação. De acordo com o regulamento do concurso da multinacional norte-americana da área de tecnologia, aluno do mestrado pode concorrer por dois anos seguidos e, do doutorado, por três anos ininterruptos.

Laureados

Na Unicamp, os alunos de doutorado premiados neste ano são Michel Fornaciali (Feec) e Ramon Pires (IC). Os do mestrado são Júlia Tavares e Afonso Menegola, da Feec. O grupo de docentes campeão inclui Jacques Wainer, Siome Goldenstein e Sandra Avila, do IC; Flávia Vasques Bittencourt (da Universidade Federal de Minas Gerais); Herbert Jelinek (da Charles Sturt University – Austrália); e Lin Tzy Li (da Samsung).

Além do Google, os trabalhos da Unicamp na área de inteligência artificial receberam apoios, em diferentes fases, da Fundação de Amparo à Pesquisa do Estado (Fapesp), do Conselho Nacional de Desenvolvimento Científico e Tecnológico (CNPq), da Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (Capes) e das multinacionais de tecnologia Microsoft e Samsung.

Precisão

De acordo com o professor Eduardo Valle, cientista da computação da Feec e responsável pelo projeto com o melanoma, as bolsas concedidas pelo Google têm sido muito importantes para a evolução do trabalho acadêmico no Brasil em um momento de dificuldade econômica. Segundo ele, a pesquisa a partir do desenvolvimento de algoritmos capazes de treinar o computador para reconhecer imagens específicas foi iniciada em 2013, e a triagem automática conseguiu alcançar 87% de precisão.

“As lesões de pele são bastante difíceis de diagnosticar. Os formatos e as cores variam muito e há diferenças sutis entre pintas, manchas, etc.”, explica. “Os próximos passos agora são ampliar a eficácia dessa tecnologia para atingir, por exemplo, o patamar de 95% de acerto já obtido pelo sistema do IC projetado para identificar imagens de pacientes de retinopatia diabética”, informa Valle, comentando sobre a outra pesquisa da Unicamp premiada pelo Google, iniciada em 2009 e coordenada pelo professor Anderson Rocha.

Homem x máquina

Atualmente, o projeto da retinopatia diabética aguarda parecer do Comitê de Ética da Unicamp para iniciar os testes conjuntos com a equipe de oftalmologia do Hospital das Clínicas (HC) da universidade. Quando essa avaliação for autorizada, os pacientes do HC continuarão sendo atendidos normalmente pelos médicos, mas serão avaliados também pelo sistema de informática desenvolvido, porém, apenas de modo simulado.

Depois de encerrado o prazo experimental, será averiguado se os dados apurados pelas ferramentas eletrônicas coincidem com as informações identificadas nos diagnósticos dos médicos. “Nessa etapa, um dos objetivos é demonstrar aos médicos a confiabilidade dos sistemas, além de trocar experiências com eles para ampliar ainda mais a precisão dos diagnósticos eletrônicos,” explica Valle.

“Outro propósito agora”, salienta, “é buscar atrair empresas, como fabricantes de equipamentos médicos, para serem parceiras no projeto e fazerem investimentos em soluções comerciais inéditas com equipamentos com base nos sistemas de inteligência artificial desenvolvidos. “Eventuais interessados devem procurar o Laboratório de Pesquisa Reasoning for Complex Data (Recod) da Unicamp”, informa (ver serviço).

Serviço

Recod Unicamp
Blog do Google com os premiados em 2017

Rogério Mascia Silveira
Imprensa Oficial – Conteúdo Editorial

Reportagem publicada originalmente na página II do Poder Executivo I e II do Diário Oficial do Estado de SP do dia 27/09/2017. (PDF)

Tecnologia identifica até 97% de conteúdo indesejado em sites e vídeos

Desenvolvido por pesquisadores do Instituto de Computação da Unicamp, aplicativo rastreia e bloqueia exibição de pornografia em celulares, tablets e televisores; inovação foi patenteada em copropriedade entre a universidade e a sul-coreana Samsung

Em busca de uma solução capaz de impedir o acesso indevido a conteúdos adultos em seus aparelhos eletrônicos, a multinacional sul-coreana Samsung, por meio de sua filial brasileira, a Samsung Research Institute Brazil, procurou, no ano de 2013, os pesquisadores do Laboratório de Pesquisa Reasoning for Complex Data (Recod), do Instituto de Computação da Universidade Estadual de Campinas (IC-Unicamp), com o objetivo de desenvolver um meio de impedir que crianças visualizem sites pornográficos em seus celulares, tablets e televisores.

Em novembro do mesmo ano, foi firmada a parceria entre a universidade e a empresa, a qual financiou o projeto, por meio da concessão de bolsas de estudo e a cessão de equipamentos. O trabalho teve também o apoio da Fundação de Amparo à Pesquisa do Estado de São Paulo (Fapesp).

O mês de janeiro de 2016 foi estabelecido em contrato como o prazo de encerramento do trabalho; no entanto, um ano antes, a equipe do IC-Unicamp, coordenada pelo professor Anderson Rocha, apresentou à Samsung diversas possibilidades de uso do software desenvolvido, batizado de Análise de Mídias Sensíveis.

Aprendizado

Também cientista da computação e integrante da equipe do professor Anderson, a pesquisadora Sandra Avila sublinha o fato de a solução desenvolvida no IC-Unicamp ser capaz de identificar mais de 97% do conteúdo pornográfico, porcentual de detecção superior às ferramentas disponíveis no mercado.

O trabalho teve ainda a participação dos cientistas Daniel Moraes, Daniel Moreira, Mauricio Perez e Siome Goldenstein, do IC-Unicamp, Eduardo Valle, da Faculdade de Engenharia Elétrica e de Computação (FEEC-Unicamp); e Miguel Lizarraga e Vanessa Testoni, da Samsung Research Institute Brazil.

“Usamos abordagens recentes de inteligência artificial, como o chamado deep learning. Essa técnica de aprendizado de máquina permite localizar com precisão padrões distintos em meio a um volume imenso de dados. Assim, ao analisar em tempo real um conjunto de imagens estáticas e em movimento, o sistema aprende a compreender o que é um conteúdo sensível, isto é, algo legítimo para o acesso de um adulto, porém, impróprio para uma criança”, explica Sandra.

Patente

A tecnologia desenvolvida no IC-Unicamp é tema de artigo publicado na revista científica Neurocomputing (Volume 230, 22-3-2017, páginas 279–293), com o título “Video pornography detection through deep learning techniques and motion information” (ver serviço). O trabalho rendeu dois pedidos de depósito de patente no ano passado.

O primeiro deles, de âmbito nacional, teve seu encaminhamento feito ao Instituto Nacional da Propriedade Industrial (Inpi) em abril; o segundo, de abrangência internacional, foi protocolado em junho, no órgão do governo dos Estados Unidos responsável por patentes e marcas comerciais, o United States Patent and Trademark Office (USPTO).

“Por se tratar de informação confidencial, a Samsung não divulga como atualmente emprega a tecnologia desenvolvida”, diz Sandra. Ela destaca o fato de a linha de pesquisa prosseguir atualmente no IC-Unicamp com outros estudos de pós-graduação. Segundo ela, diversos estudantes estão trabalhando no aprimoramento da inovação para detectar outros conteúdos sensíveis em sequências de imagens com pessoas, como, por exemplo, revelar adultos e crianças em situações de pedofilia ou ainda identificar atitudes suspeitas ou violentas de pessoas em multidões.

Metodologia

No início, os programas de computador usados para detectar pornografia buscavam primeiro tentar achar cenas de nudez para depois definir um limite de exposição física aceitável e, finalmente, classificar esse conteúdo como pornográfico ou não. Eram usadas como parâmetros algumas características da pele humana, como a cor e a textura, além de dados da geometria dos corpos. No entanto, os resultados obtidos mostravam-se insatisfatórios, filtravam menos do que o necessário ou bloqueavam indevidamente conteúdos sem sexo explícito, como lutas de vale-tudo e pessoas nadando.

Para diminuir a ambiguidade, a saída encontrada foi incorporar outro elemento de classificação: informações de movimento extraídas ao longo do tempo. Assim, quando o usuário clica em algum e-mail contendo link para um vídeo ou, ainda, caso acesse Tecnologia identifica até 97% de conteúdo indesejado em sites e vídeos algum site com janela para um vídeo, antes de sua execução o programa faz a análise por meio da extração prévia de um quadro por segundo. São, então, verificados os quadros com as imagens aplicando-se neles o método de classificação de descrições do que é tolerado e do que é pornográfico.

Abrangência

Paralelamente, o conjunto de quadros analisados fornece os elementos para sequenciar os movimentos dos objetos e pessoas presentes na cena. Dependendo do tipo de movimento, o vídeo é bloqueado. Segundo os pesquisadores, o método foi testado com sucesso por cerca de 140 horas com mil vídeos pornográficos e em outros mil não pornográficos cuja duração variava de 6 segundos a 33 minutos.

As sequências com cenas de sexo explícito tinham a participação de atores de etnias diversas e também foram considerados desenhos animados. Entre os vídeos não pornográficos havia cenas de banhistas na praia e em clubes ou combates de lutas. Foi utilizando essa metodologia que a equipe do IC-Unicamp conseguiu elevar o nível de filtragem de pornografia e chegar aos 97%.

Serviço

O artigo publicado na revista científica Neurocomputing está disponível em goo.gl/2Vpq4S

Rogério Mascia Silveira
Imprensa Oficial – Conteúdo Editorial

Reportagem publicada originalmente na página IV do Poder Executivo I e II do Diário Oficial do Estado de SP do dia 14/04/2017. (PDF)