Entre os dias 4 e 7 de fevereiro, cerca de 400 pesquisadores, estudantes e profissionais de TI participaram do Summer School on Big Data, uma Escola de Verão promovida pelo Instituto Tércio Pacitti de Aplicações e Pesquisas Computacionais da Universidade Federal do Rio de Janeiro (NCE/UFRJ) com apoio da EMC. O programa de estudo focou temas relacionados ao Big Data, que é o processamento e a análise preditiva de grandes e diversificados volumes de dados. O objetivo principal da iniciativa foi auxiliar a formação de cientistas de dados no Brasil.
Com forte formação na área de Ciências Exatas, como Ciência da Computação, Estatística e Matemática, o cientista de dados é o profissional que atua com Big Data. Ele é o especialista responsável por identificar padrões de análise, os quais permitem extrair dados relevantes e fazer predições com base na tecnologia de Big Data. A análise preditiva das informações agrega valor inestimável aos dados de uma organização, permitindo apresentar às empresas, aos órgãos do Governo e à sociedade em geral os melhores caminhos na condução de seus interesses. A profissão de cientista de dados é promissora em particular devido ao crescimento no volume de dados gerados a cada dia por pessoas e máquinas. Estima-se que, até 2020, o volume de informações disponíveis será 50 vezes maior que na atualidade.
Além de ser gratuito, o Summer School on Big Data contemplou 45 estudantes de fora da cidade do Rio de Janeiro e da América Latina com bolsa de estudo para auxílio à viagem. Durante os quatro dias, o curso reuniu especialistas nacionais e internacionais, apresentando tópicos como Sistemas de Arquivos Paralelos (Hadoop); Processamento Massivamente Paralelo em Bancos de Dados; Análise Preditiva com base em Big Data; Mineração de Dados e Aprendizado de Máquina a partir de Big Data; Armazenamento de Grandes Massas de Dados; as relações entre diversas áreas como Computação em Nuvem e Workflows Científicos com Big Data; e o uso de tecnologia de Big Data em diferentes domínios tais como Mídias Sociais, tratamento de vídeos, Astronomia e Óleo e Gás.
Além das apresentações técnicas e de aplicações práticas em Big Data, a Escola de Verão realizou sessões de Hands-on (quando os participantes aprendem a utilizar artefatos de software em conjunto com especialistas). Foram realizadas sessões de Hands-on na utilização do sistema de arquivos paralelos Hadoop, com Milind Bhandarkar – especialista mundial em Hadoop e cientista chefe da Machine Learning Platform na Greenplum, divisão da EMC –, processamento paralelo em Banco de Dados e análise preditiva baseada em Big Data, com Hamid Djam, arquiteto de Big Data Analytics e Data Warehousing Solutions Architect da EMC nos EUA, e Ana Oliveira, líder de pesquisa na área de Analytics do Centro de Pesquisa e Desenvolvimento em Big Data da EMC no Brasil.
De acordo com Claudia Motta, chair da Summer School on Big Data e diretora do NCE/UFRJ , a Escola de Verão demonstrou a importância da sinergia entre o meio acadêmico e a iniciativa privada para a formação de novos profissionais do país. “Com iniciativas deste perfil, fomentamos o desenvolvimento de profissões no mercado de TI que ainda não existem no país, como a de cientista de dados, além de nos ajudar a formatar novos cursos de pós-graduação para atender à demanda do mercado brasileiro”, ressalta.
Já Angelo E.M. Ciarlini, Program chair da Summer School on Big Data e gerente de Pesquisa do Centro de Pesquisa e Desenvolvimento (P&D) em Big Data da EMC, comenta que uma das grandes preocupações eram as diferentes audiências existentes no evento, mas o retorno dos participantes foi positivo devido junção do conteúdo teórico e prático. Outra questão é o posicionamento da EMC. “Por meio do evento, foi possível apresentar as iniciativas da EMC em Big Data, principalmente, relacionadas à pesquisa e desenvolvimento na análise de grandes volumes de dados. Precisamos formar cientistas de dados no Brasil porque os projetos locais da EMC visam diferenciais de pesquisa em busca de resultados inéditos e inovadores no mercado mundial. Desta forma, queremos atrair o que temos de melhor localmente”, afirma.
O doutorando da Pontifícia Universidade Católica do Rio de Janeiro (PUC-Rio), Augusto Cesar Espindola Baffa, que participou da Summer School on Big Data, avalia que o evento teve nível internacional tanto por conta dos especialistas que ministraram as palestras quanto do conteúdo compartilhado. Segundo Baffa, como parte do seu projeto de doutorado está relacionado à análise de dados, a Escola de Verão o auxiliou por trazer novidades em Big Data. Hoje, ele trabalha em um projeto “Interactive storytelling", o qual visa que o telespectador de TV Digital decida o que pode acontecer na história durante sua exibição e inclusive influenciar o final.
Sobre o Centro de P&D em Big Data da EMC
Em 2011, a EMC anunciou planos de abrir um Centro de Pesquisa e Desenvolvimento (P&D) focado em Big Data para indústria de petróleo e gás, como parte do seu investimento de US$ 100 milhões em cinco anos no Brasil. O prédio do Centro de P&D, que será finalizado no início de 2014, está localizado no Parque Tecnológico do Rio. Além das atividades de pesquisa aplicada, o Centro abrigará laboratórios para o desenvolvimento de soluções e um Executive Briefing Center. A previsão é de que 50 colaboradores atuem no Centro, sendo que 40 serão pesquisadores.
Até o fim das obras, as operações do Centro de P&D estão sendo realizadas em escritório no Centro do Rio de Janeiro. Atualmente, o Centro da EMC trabalha em projetos que visam a geração de inovação e o registro de patentes. Diversas parcerias para o desenvolvimento de pesquisa vêm sendo estabelecidas com companhias locais, com a UFRJ e outras universidades no Brasil, e com órgãos governamentais. O Centro de P&D da EMC é um dos quatro centros de pesquisas no Brasil que participa do Programa Estratégico de Software e Serviços de TI (TI Maior), do Ministério da Ciência e Tecnologia e Inovação (MCTI).