Unicamp avança na detecção automática de melanoma

Em sua estreia na Competição Internacional de Análise de Lesões de Pele, equipe do Laboratório de Pesquisa Reasoning for Complex Data obteve o 1º lugar em uma das provas de identificação de imagens por computador

Um grupo de pesquisadores do Laboratório de Pesquisa Reasoning for Complex Data (Recod), equipe vinculada ao Instituto de Computação e à Faculdade de Engenharia Elétrica e de Computação da Universidade Estadual de Campinas (FEEC-Unicamp), classificou-se em 1º lugar em uma das três categorias da 2ª edição da Competição Internacional de Análise de Lesões de Pele.

Disputada a distância, a prova organizada pela Colaboração Internacional para Imagens de Lesões de Pele (ISIC) propõe determinar o sistema de informática capaz de reconhecer com mais precisão e maior velocidade se a fotografia de uma pinta no corpo humano é ou não melanoma – um tipo de câncer de pele. De acordo com o professor da FEEC-Unicamp e líder da equipe do Recod-Unicamp, Eduardo Valle, na competição foram avaliadas três tarefas.

A primeira, denominada segmentação, consistia em aferir a capacidade de reconhecer a borda da lesão. A segunda propunha identificar algumas características clínicas da lesão. A última verificava se o diagnóstico conferido era exato, isto é, se a pinta foi corretamente classificada como saudável, melanoma (câncer de pele) ou queratose seborreica – tipo de lesão benigna passível de ser confundida com melanoma, por ser esteticamente parecida.

Ranking

Estreante no desafio, o Recod-Unicamp participou das provas de segmentação e de classificação. Na competição, a disputa global começa com o fornecimento on-line, pelos organizadores, de um conjunto de imagens mostrando diversos tipos de pintas na pele e, em todas elas, são informados os diagnósticos médicos corretos.

Assim, tomando por base essas referências, cada equipe desenvolve seus sistemas e algoritmos, incorporando neles técnicas como o Deep Learning, o aprendizado de máquina por comparação de padrões repetitivos e a inteligência artificial com base em estatística, entre outras técnicas.

Na etapa seguinte, a comissão avaliadora fornece novo lote de imagens e pede aos concorrentes que façam diagnósticos exatos das pintas exibidas nas fotos. De acordo com o total de respostas corretas, o júri avalia qual sistema estruturado foi o mais preciso e divulga, em site exclusivo da competição, o ranking dos participantes mais bem-colocados (ver serviço).

“Conseguimos o 1º lugar na identificação de melanomas e o 3º na identificação das pintas com queratose seborreica. Na média geral, terminamos na 3ª colocação”, destaca o docente.

A equipe do Recod-Unicamp é integrada pela professora do Instituto de Computação (IC-Unicamp), Sandra Avila, a pós-doutoranda Lin Tzy Li, o doutorando Michel Fornaciali e os mestrandos Afonso Menegola e Julia Tavares – todos da FEEC-Unicamp. “Não vamos descansar com esse primeiro resultado, bastante satisfatório e animador. Queremos uma classificação ainda melhor em 2018”, diz Valle.

Cooperação

A Competição Internacional de Análise de Lesões de Pele foi realizada entre dezembro e março com a participação on-line de 22 instituições. A promotora do evento, a ISIC, reúne mais de 50 profissionais da área acadêmica e de diferentes segmentos industriais, incluindo médicos, engenheiros e profissionais da computação.

As ações desenvolvidas pelo grupo integram uma cooperação científica mundial organizada pela Sociedade Internacional para Imagens Digitais de Pele (ISDIS), com o objetivo de recolher e compartilhar informações sobre lesões de melanoma, para diminuir a mortalidade mundial pela doença. “O diagnóstico automático das lesões, feito por computador, continua sendo um grande desafio científico. Há ainda um longo caminho a ser percorrido”, avalia o professor Valle (ver serviço).

Prevenção

De acordo com o Instituto Nacional de Câncer (Inca), o melanoma incide sobretudo em pessoas adultas, brancas e origina-se nas células da pele produtoras de melanina, substância responsável por determinar a cor da pele. Trata-se do tumor mais frequente no Brasil, responsável por 30% dos casos malignos registrados, entretanto, representa apenas 3% das neoplasias malignas, apesar de ser o mais grave por sua alta probabilidade de metástase.

Os melanomas podem ocorrer em qualquer parte da pele. A prevenção é feita com o uso de protetor solar, além de evitar exposição prolongada aos raios ultravioleta. Os sintomas podem ser nódulos anormais ou mudanças em pintas existentes, denotando assimetria, irregularidade de borda, mudança de cor da verruga ou pinta com diâmetro maior. Mesmo passado um mês, as feridas não cicatrizam e podem coçar, arder, descamar ou sangrar.

O diagnóstico do melanoma é realizado por biópsia e, quando a identificação ocorre nos estágios iniciais, há grande probabilidade de recuperação. O tratamento inclui cirurgia, radioterapia, medicamentos e, em alguns casos, quimioterapia. Dados do ano passado do Inca estimam em 150 mil o número de casos de melanoma no País; e a cada ano surgem 5,7 mil ocorrências no Brasil, sendo 3 mil em homens e o restante em mulheres.

Serviço

Recod-Unicamp
ISDIS
Ranking da edição 2017 da ISDIS
Inca
Folheto do Inca sobre o câncer de pele

Rogério Mascia Silveira
Imprensa Oficial – Conteúdo Editorial

Reportagem publicada originalmente na página III do Poder Executivo I e II do Diário Oficial do Estado de SP do dia 17/05/2017. (PDF)

Tecnologia identifica até 97% de conteúdo indesejado em sites e vídeos

Desenvolvido por pesquisadores do Instituto de Computação da Unicamp, aplicativo rastreia e bloqueia exibição de pornografia em celulares, tablets e televisores; inovação foi patenteada em copropriedade entre a universidade e a sul-coreana Samsung

Em busca de uma solução capaz de impedir o acesso indevido a conteúdos adultos em seus aparelhos eletrônicos, a multinacional sul-coreana Samsung, por meio de sua filial brasileira, a Samsung Research Institute Brazil, procurou, no ano de 2013, os pesquisadores do Laboratório de Pesquisa Reasoning for Complex Data (Recod), do Instituto de Computação da Universidade Estadual de Campinas (IC-Unicamp), com o objetivo de desenvolver um meio de impedir que crianças visualizem sites pornográficos em seus celulares, tablets e televisores.

Em novembro do mesmo ano, foi firmada a parceria entre a universidade e a empresa, a qual financiou o projeto, por meio da concessão de bolsas de estudo e a cessão de equipamentos. O trabalho teve também o apoio da Fundação de Amparo à Pesquisa do Estado de São Paulo (Fapesp).

O mês de janeiro de 2016 foi estabelecido em contrato como o prazo de encerramento do trabalho; no entanto, um ano antes, a equipe do IC-Unicamp, coordenada pelo professor Anderson Rocha, apresentou à Samsung diversas possibilidades de uso do software desenvolvido, batizado de Análise de Mídias Sensíveis.

Aprendizado

Também cientista da computação e integrante da equipe do professor Anderson, a pesquisadora Sandra Avila sublinha o fato de a solução desenvolvida no IC-Unicamp ser capaz de identificar mais de 97% do conteúdo pornográfico, porcentual de detecção superior às ferramentas disponíveis no mercado.

O trabalho teve ainda a participação dos cientistas Daniel Moraes, Daniel Moreira, Mauricio Perez e Siome Goldenstein, do IC-Unicamp, Eduardo Valle, da Faculdade de Engenharia Elétrica e de Computação (FEEC-Unicamp); e Miguel Lizarraga e Vanessa Testoni, da Samsung Research Institute Brazil.

“Usamos abordagens recentes de inteligência artificial, como o chamado deep learning. Essa técnica de aprendizado de máquina permite localizar com precisão padrões distintos em meio a um volume imenso de dados. Assim, ao analisar em tempo real um conjunto de imagens estáticas e em movimento, o sistema aprende a compreender o que é um conteúdo sensível, isto é, algo legítimo para o acesso de um adulto, porém, impróprio para uma criança”, explica Sandra.

Patente

A tecnologia desenvolvida no IC-Unicamp é tema de artigo publicado na revista científica Neurocomputing (Volume 230, 22-3-2017, páginas 279–293), com o título “Video pornography detection through deep learning techniques and motion information” (ver serviço). O trabalho rendeu dois pedidos de depósito de patente no ano passado.

O primeiro deles, de âmbito nacional, teve seu encaminhamento feito ao Instituto Nacional da Propriedade Industrial (Inpi) em abril; o segundo, de abrangência internacional, foi protocolado em junho, no órgão do governo dos Estados Unidos responsável por patentes e marcas comerciais, o United States Patent and Trademark Office (USPTO).

“Por se tratar de informação confidencial, a Samsung não divulga como atualmente emprega a tecnologia desenvolvida”, diz Sandra. Ela destaca o fato de a linha de pesquisa prosseguir atualmente no IC-Unicamp com outros estudos de pós-graduação. Segundo ela, diversos estudantes estão trabalhando no aprimoramento da inovação para detectar outros conteúdos sensíveis em sequências de imagens com pessoas, como, por exemplo, revelar adultos e crianças em situações de pedofilia ou ainda identificar atitudes suspeitas ou violentas de pessoas em multidões.

Metodologia

No início, os programas de computador usados para detectar pornografia buscavam primeiro tentar achar cenas de nudez para depois definir um limite de exposição física aceitável e, finalmente, classificar esse conteúdo como pornográfico ou não. Eram usadas como parâmetros algumas características da pele humana, como a cor e a textura, além de dados da geometria dos corpos. No entanto, os resultados obtidos mostravam-se insatisfatórios, filtravam menos do que o necessário ou bloqueavam indevidamente conteúdos sem sexo explícito, como lutas de vale-tudo e pessoas nadando.

Para diminuir a ambiguidade, a saída encontrada foi incorporar outro elemento de classificação: informações de movimento extraídas ao longo do tempo. Assim, quando o usuário clica em algum e-mail contendo link para um vídeo ou, ainda, caso acesse Tecnologia identifica até 97% de conteúdo indesejado em sites e vídeos algum site com janela para um vídeo, antes de sua execução o programa faz a análise por meio da extração prévia de um quadro por segundo. São, então, verificados os quadros com as imagens aplicando-se neles o método de classificação de descrições do que é tolerado e do que é pornográfico.

Abrangência

Paralelamente, o conjunto de quadros analisados fornece os elementos para sequenciar os movimentos dos objetos e pessoas presentes na cena. Dependendo do tipo de movimento, o vídeo é bloqueado. Segundo os pesquisadores, o método foi testado com sucesso por cerca de 140 horas com mil vídeos pornográficos e em outros mil não pornográficos cuja duração variava de 6 segundos a 33 minutos.

As sequências com cenas de sexo explícito tinham a participação de atores de etnias diversas e também foram considerados desenhos animados. Entre os vídeos não pornográficos havia cenas de banhistas na praia e em clubes ou combates de lutas. Foi utilizando essa metodologia que a equipe do IC-Unicamp conseguiu elevar o nível de filtragem de pornografia e chegar aos 97%.

Serviço

O artigo publicado na revista científica Neurocomputing está disponível em goo.gl/2Vpq4S

Rogério Mascia Silveira
Imprensa Oficial – Conteúdo Editorial

Reportagem publicada originalmente na página IV do Poder Executivo I e II do Diário Oficial do Estado de SP do dia 14/04/2017. (PDF)

Fatec de Pompeia utiliza drones no curso de Big Data no Agronegócio

Única da América Latina a oferecer essa graduação, instituição acaba de adquirir seis veículos aéreos não tripulados; proposta é formar profissional capaz de diminuir perdas e aumentar produtividade no campo

A compra de seis veículos aéreos não tripulados (Vants) é a mais recente novidade do curso de Big Data no Agronegócio, o primeiro do gênero na América Latina e oferecido no Brasil apenas na Faculdade de Tecnologia do Estado (Fatec) Shunji Nishimura, de Pompeia, região de Marília, interior do Estado.

Do modelo DJI Phantom 3 Advanced, os drones foram adquiridos pela Fundação Shunji Nishimura de Tecnologia por R$ 36 mil e estão sendo utilizados pelos alunos para documentar locais de plantação, em sobrevoos domésticos de até 300 metros de altura.

O objetivo dos voos radiocontrolados é gerar imagens aéreas de zonas de cultivo e, depois, usando softwares específicos, extrair informações desse material. Assim, será possível identificar em uma fotografia o total de mudas em determinada área ou, ainda, as falhas e linhas de plantio, entre outras possibilidades.

Um dos exemplos mais recentes do uso de drones na Fatec Pompeia é o projeto em andamento, em campos de soja, no município de Lucas do Rio Verde (MT), para rastrear exemplares atacados por nematoides, parasitas microscópicos.

Morador de Pompeia e calouro da primeira turma de Big Data no Agronegócio, Elton Fernandes, de 26 anos, explica que o drone voa, em média, a 100 metros de altura, e sua câmera de 12 megapixels produz sequências de milhares de fotografias com altíssima definição.

Do total de imagens, são selecionadas entre 50 e cem para compor o chamado ortomosaico, isto é, um mapa juntando todas e identificando as áreas atacadas pelos nematoides. “Como os parasitas enfraquecem e secam as plantas, é possível diferenciar as sadias das doentes observando tamanho e cor”, explica o estudante.

Pioneirismo

Vespertina e com três anos de duração, a graduação tecnológica em Big Data no Agronegócio oferece 40 vagas a cada semestre. No último Vestibular da Fatec, realizado em janeiro, a procura foi de 2,85 candidatos disputando cada uma das vagas.

A primeira turma iniciou as aulas em fevereiro; e o conteúdo acadêmico dos seis semestres foi elaborado por professores do Centro Paula Souza em parceria com a Fundação Shunji Nishimura de Tecnologia.

O curso é mais uma ação conjunta das duas instituições na área do agronegócio. Em fevereiro de 2010, criaram, juntas, o curso de Mecanização em Agricultura de Precisão, outra formação superior oferecida na Fatec Pompeia.

Segundo o professor Luís Hilário Tobler Garcia, doutor em engenharia mecânica pela Escola de Engenharia de São Carlos da Universidade de São Paulo (EESC-USP) e coordenador do curso recém-iniciado, a chamada Big Data é uma área nova no campo da tecnologia da informação.

“Sua proposta é aproveitar a atual capacidade computacional para processar grandes volumes de dados e encontrar correlações entre eles, de modo a extrair pontos específicos e possibilitar a tomada de decisões estratégicas no agronegócio, hoje a principal fonte de riquezas brasileiras”, observa.

Metodologia

Responsável pelas disciplinas de Lógica de Programação e de Projeto Integrador de Lógica de Programação, o professor Garcia sublinha que o curso pretende formar profissionais capazes de diminuir as perdas existentes no trajeto entre o campo e a mesa dos cidadãos, hoje estimadas em 6% do Produto Interno Bruto (PIB) mundial, cerca de US$ 15,4 trilhões. “O intuito é combater esse desperdício e aumentar a produtividade do agronegócio, em especial o brasileiro, o mais competitivo do mundo”, explica.

De acordo com o professor Tsen Chung Kang, um dos idealizadores do curso, uma das estratégias adotadas é o Profound Learning (aprendizado profundo). Originária do Canadá e adaptada à realidade brasileira, essa metodologia de ensino consiste em propor ao aluno desafios que lhe permitam compreender quais áreas de conhecimento têm maior relevância e como resolver, em equipe, um problema.

Serviço

Fatec Shunji Nishimura (Pompeia)
Telefone (14) 3452-1294
E-mail f259dir@cps.sp.gov.br

Vestibular da Fatec

Rogério Mascia Silveira
Imprensa Oficial – Conteúdo Editorial

Reportagem publicada originalmente na página III do Poder Executivo I e II do Diário Oficial do Estado de SP do dia 12/04/2017. (PDF)