Jump to content

Glossário Data Science - B


Larisse Santos

Postagens Recomendadas

B

 

Batch data também conhecido como “janela de dados”, refere-se a um lote de pontos de dados agrupados em um intervalo de tempo específico. O processamento de dados em batch é utilizado para grandes volumes de dados ou fontes de dados de sistemas legados, em que não é possível entregar dados em fluxos.

 

Bias também chamado de viés, é a diferença entre o valor real e o predito por um modelo. Para alterarmos o bias de um modelo necessitamos alterar o algoritmo deste modelo (médias das predições). É diferente de variância que é a variabilidade das predições.
O nome Bias deriva do nome do filósofo e sábio grego do século VI a.C. “Bias de Priene” que julgava assuntos litigiosos derivados de distorções no modo de agir ou pensar dos indivíduos.

 

Big Data é um grande conjunto de dados gerados constantemente que precisa ser processado e armazenado.

O Big Data possui 5 características: volume, variedade, velocidade, veracidade e valor. Volume diz respeito à quantidade de dados que são produzidos e coletados pelas organizações.  As organizações coletam dados de diversas fontes, implicando a variedade dos tipos e dos formatos dos dados coletados. Velocidade diz respeito ao quão rápido os dados estão sendo produzidos e quão rápido os dados devem ser tratados para atender à demanda da organização. A veracidade é a confiabilidade dos dados, ou seja, eles devem expressar a realidade e ser consistentes. O valor diz respeito à utilidade dos dados ao negócio, ou seja, como agregam valor.

 

 

Link to comment
Compartilhe em outros sites

Crie uma conta ou entre para comentar 😀

Você precisa ser um membro para deixar um comentário.

Crie a sua conta

Participe da nossa comunidade, crie sua conta.
É bem rápido!

Criar minha conta agora

Entrar

Você já tem uma conta?
Faça o login agora.

Entrar agora


×
×
  • Create New...