Tecnologia identifica até 97% de conteúdo indesejado em sites e vídeos

Desenvolvido por pesquisadores do Instituto de Computação da Unicamp, aplicativo rastreia e bloqueia exibição de pornografia em celulares, tablets e televisores; inovação foi patenteada em copropriedade entre a universidade e a sul-coreana Samsung

Em busca de uma solução capaz de impedir o acesso indevido a conteúdos adultos em seus aparelhos eletrônicos, a multinacional sul-coreana Samsung, por meio de sua filial brasileira, a Samsung Research Institute Brazil, procurou, no ano de 2013, os pesquisadores do Laboratório de Pesquisa Reasoning for Complex Data (Recod), do Instituto de Computação da Universidade Estadual de Campinas (IC-Unicamp), com o objetivo de desenvolver um meio de impedir que crianças visualizem sites pornográficos em seus celulares, tablets e televisores.

Em novembro do mesmo ano, foi firmada a parceria entre a universidade e a empresa, a qual financiou o projeto, por meio da concessão de bolsas de estudo e a cessão de equipamentos. O trabalho teve também o apoio da Fundação de Amparo à Pesquisa do Estado de São Paulo (Fapesp).

O mês de janeiro de 2016 foi estabelecido em contrato como o prazo de encerramento do trabalho; no entanto, um ano antes, a equipe do IC-Unicamp, coordenada pelo professor Anderson Rocha, apresentou à Samsung diversas possibilidades de uso do software desenvolvido, batizado de Análise de Mídias Sensíveis.

Aprendizado

Também cientista da computação e integrante da equipe do professor Anderson, a pesquisadora Sandra Avila sublinha o fato de a solução desenvolvida no IC-Unicamp ser capaz de identificar mais de 97% do conteúdo pornográfico, porcentual de detecção superior às ferramentas disponíveis no mercado.

O trabalho teve ainda a participação dos cientistas Daniel Moraes, Daniel Moreira, Mauricio Perez e Siome Goldenstein, do IC-Unicamp, Eduardo Valle, da Faculdade de Engenharia Elétrica e de Computação (FEEC-Unicamp); e Miguel Lizarraga e Vanessa Testoni, da Samsung Research Institute Brazil.

“Usamos abordagens recentes de inteligência artificial, como o chamado deep learning. Essa técnica de aprendizado de máquina permite localizar com precisão padrões distintos em meio a um volume imenso de dados. Assim, ao analisar em tempo real um conjunto de imagens estáticas e em movimento, o sistema aprende a compreender o que é um conteúdo sensível, isto é, algo legítimo para o acesso de um adulto, porém, impróprio para uma criança”, explica Sandra.

Patente

A tecnologia desenvolvida no IC-Unicamp é tema de artigo publicado na revista científica Neurocomputing (Volume 230, 22-3-2017, páginas 279–293), com o título “Video pornography detection through deep learning techniques and motion information” (ver serviço). O trabalho rendeu dois pedidos de depósito de patente no ano passado.

O primeiro deles, de âmbito nacional, teve seu encaminhamento feito ao Instituto Nacional da Propriedade Industrial (Inpi) em abril; o segundo, de abrangência internacional, foi protocolado em junho, no órgão do governo dos Estados Unidos responsável por patentes e marcas comerciais, o United States Patent and Trademark Office (USPTO).

“Por se tratar de informação confidencial, a Samsung não divulga como atualmente emprega a tecnologia desenvolvida”, diz Sandra. Ela destaca o fato de a linha de pesquisa prosseguir atualmente no IC-Unicamp com outros estudos de pós-graduação. Segundo ela, diversos estudantes estão trabalhando no aprimoramento da inovação para detectar outros conteúdos sensíveis em sequências de imagens com pessoas, como, por exemplo, revelar adultos e crianças em situações de pedofilia ou ainda identificar atitudes suspeitas ou violentas de pessoas em multidões.

Metodologia

No início, os programas de computador usados para detectar pornografia buscavam primeiro tentar achar cenas de nudez para depois definir um limite de exposição física aceitável e, finalmente, classificar esse conteúdo como pornográfico ou não. Eram usadas como parâmetros algumas características da pele humana, como a cor e a textura, além de dados da geometria dos corpos. No entanto, os resultados obtidos mostravam-se insatisfatórios, filtravam menos do que o necessário ou bloqueavam indevidamente conteúdos sem sexo explícito, como lutas de vale-tudo e pessoas nadando.

Para diminuir a ambiguidade, a saída encontrada foi incorporar outro elemento de classificação: informações de movimento extraídas ao longo do tempo. Assim, quando o usuário clica em algum e-mail contendo link para um vídeo ou, ainda, caso acesse Tecnologia identifica até 97% de conteúdo indesejado em sites e vídeos algum site com janela para um vídeo, antes de sua execução o programa faz a análise por meio da extração prévia de um quadro por segundo. São, então, verificados os quadros com as imagens aplicando-se neles o método de classificação de descrições do que é tolerado e do que é pornográfico.

Abrangência

Paralelamente, o conjunto de quadros analisados fornece os elementos para sequenciar os movimentos dos objetos e pessoas presentes na cena. Dependendo do tipo de movimento, o vídeo é bloqueado. Segundo os pesquisadores, o método foi testado com sucesso por cerca de 140 horas com mil vídeos pornográficos e em outros mil não pornográficos cuja duração variava de 6 segundos a 33 minutos.

As sequências com cenas de sexo explícito tinham a participação de atores de etnias diversas e também foram considerados desenhos animados. Entre os vídeos não pornográficos havia cenas de banhistas na praia e em clubes ou combates de lutas. Foi utilizando essa metodologia que a equipe do IC-Unicamp conseguiu elevar o nível de filtragem de pornografia e chegar aos 97%.

Serviço

O artigo publicado na revista científica Neurocomputing está disponível em goo.gl/2Vpq4S

Rogério Mascia Silveira
Imprensa Oficial – Conteúdo Editorial

Reportagem publicada originalmente na página IV do Poder Executivo I e II do Diário Oficial do Estado de SP do dia 14/04/2017. (PDF)

Fatec de Pompeia utiliza drones no curso de Big Data no Agronegócio

Única da América Latina a oferecer essa graduação, instituição acaba de adquirir seis veículos aéreos não tripulados; proposta é formar profissional capaz de diminuir perdas e aumentar produtividade no campo

A compra de seis veículos aéreos não tripulados (Vants) é a mais recente novidade do curso de Big Data no Agronegócio, o primeiro do gênero na América Latina e oferecido no Brasil apenas na Faculdade de Tecnologia do Estado (Fatec) Shunji Nishimura, de Pompeia, região de Marília, interior do Estado.

Do modelo DJI Phantom 3 Advanced, os drones foram adquiridos pela Fundação Shunji Nishimura de Tecnologia por R$ 36 mil e estão sendo utilizados pelos alunos para documentar locais de plantação, em sobrevoos domésticos de até 300 metros de altura.

O objetivo dos voos radiocontrolados é gerar imagens aéreas de zonas de cultivo e, depois, usando softwares específicos, extrair informações desse material. Assim, será possível identificar em uma fotografia o total de mudas em determinada área ou, ainda, as falhas e linhas de plantio, entre outras possibilidades.

Um dos exemplos mais recentes do uso de drones na Fatec Pompeia é o projeto em andamento, em campos de soja, no município de Lucas do Rio Verde (MT), para rastrear exemplares atacados por nematoides, parasitas microscópicos.

Morador de Pompeia e calouro da primeira turma de Big Data no Agronegócio, Elton Fernandes, de 26 anos, explica que o drone voa, em média, a 100 metros de altura, e sua câmera de 12 megapixels produz sequências de milhares de fotografias com altíssima definição.

Do total de imagens, são selecionadas entre 50 e cem para compor o chamado ortomosaico, isto é, um mapa juntando todas e identificando as áreas atacadas pelos nematoides. “Como os parasitas enfraquecem e secam as plantas, é possível diferenciar as sadias das doentes observando tamanho e cor”, explica o estudante.

Pioneirismo

Vespertina e com três anos de duração, a graduação tecnológica em Big Data no Agronegócio oferece 40 vagas a cada semestre. No último Vestibular da Fatec, realizado em janeiro, a procura foi de 2,85 candidatos disputando cada uma das vagas.

A primeira turma iniciou as aulas em fevereiro; e o conteúdo acadêmico dos seis semestres foi elaborado por professores do Centro Paula Souza em parceria com a Fundação Shunji Nishimura de Tecnologia.

O curso é mais uma ação conjunta das duas instituições na área do agronegócio. Em fevereiro de 2010, criaram, juntas, o curso de Mecanização em Agricultura de Precisão, outra formação superior oferecida na Fatec Pompeia.

Segundo o professor Luís Hilário Tobler Garcia, doutor em engenharia mecânica pela Escola de Engenharia de São Carlos da Universidade de São Paulo (EESC-USP) e coordenador do curso recém-iniciado, a chamada Big Data é uma área nova no campo da tecnologia da informação.

“Sua proposta é aproveitar a atual capacidade computacional para processar grandes volumes de dados e encontrar correlações entre eles, de modo a extrair pontos específicos e possibilitar a tomada de decisões estratégicas no agronegócio, hoje a principal fonte de riquezas brasileiras”, observa.

Metodologia

Responsável pelas disciplinas de Lógica de Programação e de Projeto Integrador de Lógica de Programação, o professor Garcia sublinha que o curso pretende formar profissionais capazes de diminuir as perdas existentes no trajeto entre o campo e a mesa dos cidadãos, hoje estimadas em 6% do Produto Interno Bruto (PIB) mundial, cerca de US$ 15,4 trilhões. “O intuito é combater esse desperdício e aumentar a produtividade do agronegócio, em especial o brasileiro, o mais competitivo do mundo”, explica.

De acordo com o professor Tsen Chung Kang, um dos idealizadores do curso, uma das estratégias adotadas é o Profound Learning (aprendizado profundo). Originária do Canadá e adaptada à realidade brasileira, essa metodologia de ensino consiste em propor ao aluno desafios que lhe permitam compreender quais áreas de conhecimento têm maior relevância e como resolver, em equipe, um problema.

Serviço

Fatec Shunji Nishimura (Pompeia)
Telefone (14) 3452-1294
E-mail f259dir@cps.sp.gov.br

Vestibular da Fatec

Rogério Mascia Silveira
Imprensa Oficial – Conteúdo Editorial

Reportagem publicada originalmente na página III do Poder Executivo I e II do Diário Oficial do Estado de SP do dia 12/04/2017. (PDF)