Cientistas de Dados | Quem são e o que fazem

Com certeza você já ouviu falar dessa profissão e, assim como você, muitas outras pessoas têm as mesmas dúvidas sobre esta área de atuação, onde mais crescem as oportunidades no mercado de trabalho, trazendo uma nova geração de especialistas. Então, vamos explicar os pontos principais para você conhecer.

Para início de conversa, a profissão de Cientista de Dados nem é tão nova assim. Apesar dela circular no mundo técnico há alguns anos, a profissão só começou a estar em evidência com o crescimento do termo Big Data em 2011. É importante destacar também que o número de oportunidades para o cargo ainda é superior ao número de profissionais prontos para ocupá-las.

Dê aquela “Googlada” e veja o crescimento dos principais termos relacionados à ciência de dados

O Google Trends é uma ferramenta que mostra a pontuação em relação à quantidade de buscas de um determinado termo no Google.

O termo Ciência de Dados começou a crescer em junho de 2011(Figura 1) e alcançou 100 pontos em abril de 2019(Figura 2). O Termo Big Data começou a aumentar a pontuação nas buscas em Junho de 2011(Figura 3) e alcançou 100 pontos em outubro de 2018(Figura 4). Ou seja os termos cresceram juntos a partir de junho de 2011 quando as grande empresas como Microsoft, Google, Amazon e IBM e começaram a disponibilizar soluções em nuvem para Big Data e IA, com serviços a um menor custo.

Figura 1

Figura 2

Figura 3

Figura 4

Você pode fazer suas buscas para entender melhor esse comportamento, direto no site, altere os filtros e acesse para saber mais: https://trends.google.com.

Mas voltando ao assunto principal, o aumento exponencial da coleta de dados estruturados e não estruturados deu origem ao Big Data. A demanda de trabalhos para pessoas Cientista de Dados assim como para outras profissões agregadas (Engenheiria de Dados, Engenharia de Machine Learn, Especialista em Inteligência Artificial, Especialista em Business Intelligence, Analista de Dados, profissionais de Matemática e Estatística ) aumentam a cada dia.

O mercado quer extrair conhecimento a partir de suas fontes de dados, aprender com eles e a partir disso prever os caminhos de sucesso para seu negócio. É possível fazer isso?

Qual a tarefa de cada pessoa relacionada à Ciência de Dados?

Estatística – A  Estatística é um conjunto de métodos especialmente apropriados à coleta, à apresentação, à organização, resumo, análise,  descrição e interpretação de dados com objetivo de compreender uma realidade específica para a tomada da decisão. Geralmente essa pessoa desenvolve seus próprios modelos sem o uso de fórmulas de linguagens de exploração de dados. A Ciência de Dados utiliza o modelo de estudo através de População e Amostras, pois é impossível obter os dados da População(Todo os dados) , considera-se para estudo uma amostra da população(grupo) para a partir daí obter os resultados.

A pessoa de estatística se preocupa com:
– A coleta(pesquisa ou obtenção), organização e apresentação de dados;
– A medição da variação, correlação e distribuição dos dados;
– A estimativa dos parâmetros da população ;
– A determinação da precisão das estimativas;
– A aplicação dos testes de hipótese em relação aos parâmetros;

Dessa forma conseguimos explicar os dados com a estatística descritiva. A estatística é a parte do trabalho da pessoa cientista de dados que explica o passado, o  que já aconteceu.

Matemática – A pessoa de matemática domina os cálculos e consegue enxergar o comportamento e as tendências dos dados a partir de gráficos e fórmulas. Nem sempre há um algoritmo pronto para resolver  todos os problemas, eu mesma já me deparei com uma situação em que foi necessário aplicar um calculo de derivativa financeira e esse estudo foi facilitado por um matemático.

Engenharia de Dados – O trabalho de uma pessoa profissional de Engenharia de Dados é desenhar a arquitetura de toda a infraestrutura, desenhar a engenharia de comunicação entre os  sistemas e programas, entender e planejar todo  o processo  de coleta de dados, armazenamento ,utilização e disponibilização dessas informações para o uso da pessoa Cientista de Dados e do usuário final através de sistemas de Extração de Relatórios e Dashboards para Visualização Analítica.

Analista de Dados – Extrai ou recebe os dados, faz o trabalho de ETL(Extração, Tratamento e Carregamento) dos dados transformando-os em informação. Os dados extraídos dos sistemas legado de ERP e CRM possuem tabelas que em sua visão bruta não dizem muita coisa, o trabalho da pessoa Analista de Dados é transformar esses dados em informação para que haja um entendimento possibilitando seu estudo e análise.

Especialista em Inteligência Artificial – Resumidamente a pessoa especializada em IA conhece os recursos e serviços de inteligência artificial, redes neurais, deep learning, visão computacional, reconhecimento de imagem, chatbots, enfim, ele trabalha com desenvolvimento de tecnologias ou utilizando serviços de Inteligência Artificial em nuvem, quem aprende essas tecnologias garante sua permanência nas profissões do futuro. Trabalhar com Inteligência Artificial é uma das atribuições da pessoa Cientista de Dados.

Engenharia de Machine Learning – A pessoa Engenheira de Machine Learning domina o conhecimento dos algoritmos de aprendizado de máquina e predição de dados. Há pouco falamos que o profissional de estatística explica os dados passados, certo? Já a pessoa Engenheira de Machine Learning explica a tendência dos dados futuros. Essa também é uma atribuição da pessoa Cientista de Dados.

Analista de BI (Business Intelligence) – O trabalho da pessoa Analista de BI é apresentar a história que os dados querem nos contar, é disponibilizar gráficos apropriados para que o cliente faça o entendimento e acompanhamento e visualização dos KPIs(Métricas de desempenho).

Cientista de Dados – O trabalho da pessoa Cientista de Dados é fazer o entendimento de negócio, saber qual  informação o usuário deseja saber desses dados, extrair dos dados as informações mais relevantes para serem utilizadas no modelo, projetar e aplicar os algoritmos que tragam o conhecimento  esperado pelo usuário. Ou seja é essa pessoa que transforma a Informação em Conhecimento para apoiar a tomada de decisão estratégica nas empresas.
Ela geralmente acaba realizando a atividade de todos os outros profissionais. Além disso, precisa entender de Banco de Dados e Linguagens de Programação. Não é à toa que o nome da profissão tem o título de “Cientista”, pois esse profissional está sempre estudando e agregando novos conhecimentos para aperfeiçoar seus projetos e fazer uma entrega de valor ao mercado.

Então quais são os cursos que você pode buscar para se tornar Cientista de Dados? Veja na Figura 5 abaixo.

habilidadesFigura 5

Em que área a pessoa Cientista de Dados pode atuar e de que forma?

Na Logística:
– Redução de perda em estoque
– Otimização das rotas e cargas

No Marketing:
– Geração de Leads de novos clientes
– Redução da taxa de churn(perda de clientes)
– Análise de sentimentos  gerados por uma campanha através de coleta em redes sociais

Na Área comercial:
– Aumento do ticket médio das vendas com a recomendação de produtos
– Recomendação de produtos que invariavelmente seriam comprados pelo cliente

Na área de Cobrança:
– Antecipação de clientes com mais probabilidade de pagamento das dívidas.

Na área Financeira:
– Detecção de fraude

Na área de Negócios:
– Classificação agrupamentos de dados não estruturados

Há muitas outras soluções, colocamos aqui apenas algumas para que voê tenha uma idéia.

Ual… tudo isso? Mas o Cientista de Dados realmente sabe fazer isso tudo?

É desejável que a pessoa Cientista de Dados tenha todo esse conhecimento, na prática isso quase não acontece, ninguém faz um curso e se torna cientista de dados, embora muitas vezes tenha uma especialização na área e o nome registrado em carteira, é uma carreira que se constrói aos poucos e os conhecimentos vão se aperfeiçoando a cada projeto.

Puxa! Adorei essa profissão, quero atuar como Cientista de Dados! Como posso começar?

Falaremos sobre isso no próximo artigo! Aguarde 🙂 

Andréa Longarini