Resistência cotidiana

Um índex para chamar de seu

DCC lança plataforma com informações sobre artigos publicados em conferências de computação

A produção brasileira em Computação pode ser consultada na plataforma CSIndex, que disponibiliza informações sobre os artigos publicados nos últimos cinco anos em um amplo conjunto de conferências internacionais. Os dados, organizados em 15 sub-áreas de pesquisa, incluem autores e suas instituições de origem. Desenvolvido pelo professor Marco Túlio Valente, do Departamento de Ciência da Computação (DCC) da UFMG, o sistema pode contribuir para que pesquisadores conheçam as publicações de grupos similares em outras universidades e para conectar futuros alunos de mestrado e doutorado com departamentos e grupos específicos.

“O objetivo não é fomentar rankings de departamentos nem competição, mas prover informações significativas sobre essa produção no país”, explica Valente, que contou com a colaboração do doutorando Klérisson Paixão, da Universidade Federal de Uberlândia (UFU). Ele comenta que bibliotecas digitais e sistemas de currículos como a Plataforma Lattes favorecem acesso rápido à produção de determinado pesquisador, mas não foram projetados para informar a produção científica total de um departamento em determinada área ou sub-área do conhecimento.

Uma das etapas prévias na organização da plataforma foi a definição das principais conferências que seriam monitoradas em cada uma das 15 sub-áreas, bem como de critérios para destacar as mais relevantes. No total dos 154 eventos mundiais que o CSIndex  monitora, 34 são considerados top-conferences, que têm como característica o reduzido número de artigos aceitos. “É bastante difícil publicar nelas”, afirma o professor, que coordena o Grupo de Engenharia de Software Aplicada (ASERG) do DCC.

Valente informa que as conferências são indexadas no sistema mesmo que não se tenha publicado artigos recentes de autores brasileiros. Considerando a produção em computação no Brasil no período de 2013 a março de 2018, cerca de 700 pesquisadores de diversas universidades brasileiras (públicas, privadas, estaduais e institutos federais) têm sua produção científica registrada pelo CSIndex. A plataforma coleta dados no site DBLP, hospedado na Universidade de Trier (Alemanha), que indexa mais de 3 milhões de artigos, de 1,7 milhão de autores (dados de abril deste ano), com informações bibliográficas de artigos publicados em Ciência da Computação.

As 15 sub-áreas acompanhadas pelo CSIndex são: Engenharia de software, Linguagens de programação, Sistemas de informação, Interação humano-computador, Redes de computadores, Computação móvel, Sistemas distribuídos, Arquitetura de computadores e Processamento de alto desempenho, Bancos de dados, Recuperação de informações e Web, Mineração de dados e aprendizado de máquina, Inteligência artificial, Algoritmos e complexidade, Segurança e criptografia e Visão computacional.

“Nessa primeira versão do sistema, priorizamos as conferências, que são tradicionais veículos de publicação em Ciência da Computação, aceitam artigos completos e mantêm taxas de aceitação mais rigorosas do que diversas revistas”, comenta o professor. A indexação de artigos publicados em revistas é uma meta de médio prazo do projeto.

Valente: cerca de 700 pesquisadores têm produção indexada
Valente: cerca de 700 pesquisadores têm produção indexada Foca Lisboa/UFMG

Para cada departamento/instituição citada, o CSIndex calcula um score – valor que combina o número de artigos em top-conferences e o de artigos nas demais conferências monitoradas. Ele também informa quantos professores de cada departamento publicam nas áreas monitoradas e oferece informações detalhadas sobre as conferências, como número de artigos submetidos e aceitos. Essas métricas – coletadas manualmente – dão ao usuário uma noção sobre a relevância desses eventos.

Com relação à atualização do CSIndex, o professor Marco Túlio explica que o código-fonte do sistema e os dados dos artigos coletados estão disponíveis publicamente. Assim, solicitações para inclusão de pesquisadores e conferências podem ser enviadas por meio do GitHub, principal plataforma mundial para construção de sistemas de código aberto.

Segundo o professor do DCC, a atualização é um desafio importante, embora o sistema já tenha sido projetado de forma que as informações cheguem automaticamente, via DBLP. “O maior trabalho foi definir critérios e montar o banco de dados”, observa Valente. “A saída de pessoas, por aposentadoria, por exemplo, não é problema. Se elas param de publicar, simplesmente deixam de aparecer no sistema.” No caso dos recém-contratados, é desejável que eles façam contato com a plataforma, via GitHub, para que sejam incluídos. O CSIndex é atualizado mensalmente – artigos de março deste ano já estão disponíveis.

Ana Rita Araújo