Comentários

0%

Não pode faltar

QUAIS FATORES PODEM INTERFERIR EM UMA ANÁLISE

Amanda Soares de Melo

Fonte: Shutterstock.

Deseja ouvir este material?

Áudio disponível no material digital.

Praticar para aprender

Caro estudante,

Você já deve ter notado que muitas vezes tratamos dados como sinônimo de informação e informação como sinônimo de conhecimento, mas essas são associações enganosas. Os dados necessitam da interpretação e, portanto, da informação para que tenham significado. A informação, por sua vez, é construída por um arranjo de dados visando um objetivo específico. Não há realmente informação desinteressada, desconectada de um sujeito que realiza a organização dos dados. Por essa razão, como os dados precisam ser interpretados e analisados, é bem possível – na verdade, muito provável – que sejam interpretados incorretamente, em algum momento.

No desenvolvimento de uma pesquisa científica, é crucial que o pesquisador tenha noção de seus próprios vieses cognitivos a fim de minimizar a interpretação incorreta dos dados. Muitas vezes, nós ficamos cegos dos nossos próprios vieses e apenas um observador externo consegue nos indicar esses problemas. Nesta seção, convido você a compreender a dimensão de responsabilidade e cuidado exigidas no tratamento de qualquer tipo de dados. Reconhecer o papel do sujeito na interpretação e no tratamento de dados é fundamental ao desenvolvimento de um pensamento mais criterioso na busca pela informação e pelo conhecimento.

Uma indústria automobilística está preocupada com os defeitos que um de seus produtos vem apresentando. A fim de sanar o problema na escala de produção, a empresa contrata você, pesquisador da área, para a composição de um levantamento detalhado da produção desse item. Ao iniciar a investigação, você elabora uma tabela com os tipos de problemas encontrados e a frequência com que eles têm ocorrido após cada item produzido ser analisado.

Tabela | Problemas e frequência na produção
Problemas  Frequência Problemas  Frequência
A   10
B 15
C 25
  1. Defeito na tampa plástica.
  2. Defeito na placa de processamento.
  3. Soldas soltas.

Considerando o contexto apresentado, indique se os dados apresentados com a variável “Problemas” são nominais, ordinais, contínuos ou discretos. Além disso, justifique sua resposta.

Os números não falam por si próprios. Nós falamos por eles. Nós os imbuímos de significado. – Nate Silver. 

Conceito-chave

Informações, dados e conhecimento

Nos dias atuais, temos um grande volume de informação disponível a nós apenas por um clique. Antigamente, reis e rainhas eram privilegiados por possuírem uma, duas ou três centenas de livros. Atualmente, qualquer pessoa pode ter facilmente essa quantidade de livros, principalmente em formatos digitais. Com tanta informação disponível, é comum nós assimilarmos inteligência com quantidade de informação, mas essa conexão pode ser bastante enganosa.

Tratar a informação e o conhecimento como sinônimos é uma crença bastante comum nos nossos tempos. Nós lidamos com dados, informações e conhecimento diariamente, todavia muitas vezes os tomamos como sinônimos e cabe saber diferenciá-los.

Dados podem ser definidos como a matéria-prima da informação, eles representam significados que isoladamente não transmite nenhuma mensagem ou conhecimento. Em uma pesquisa de opinião sobre a qualidade de um produto, por exemplo, a coleta da opinião de cada pessoa só poderá produzir alguma informação significativa sobre a satisfação com o produto depois de ser tratada e agregada às demais.

As informações, por sua vez, são os dados tratados. A informação é resultado do processamento dos dados coletados que interessam ao pesquisador. Como elas possuem significado, auxiliam no processo de tomadas de decisão.

No exemplo anterior, a informação expressaria os níveis de satisfação das pessoas entrevistadas com o produto, revelando se a imagem que elas possuem é positiva ou negativa. Frequentemente, se utiliza ferramentas estatísticas como indicadores para tratar os dados e obter alguma informação que antes não poderia ser vista.

O conhecimento está além da informação porque tem tanto significado como aplicação. O conhecimento envolve nossa faculdade de abstração, em que se é capaz de produzir novas ideias a partir das informações que temos em dado momento. Ele exige que um sujeito seja capaz de processar as informações identificando o que ali é importante e as direcione para algum fim. Nesse sentido, a informação é como se fosse a matéria-prima do conhecimento.

Assimile

Os dados são observações simples sobre do mundo, facilmente estruturados e que podem ser obtidos por meio de maquinários. São quantificáveis e transferíveis.

As informações são dados tratados em termos de relevância e propósito. Necessariamente, exige a intervenção humana, pois também exige um consenso acerca de seu significado.

O conhecimento é a informação tratada em termos de reflexão, síntese e contexto. Sua estruturação é difícil, também não é fácil de ser construído por máquinas e frequentemente é difícil de ser transferível.

Há ainda uma quarta diferenciação possível: a diferença entre sabedoria e conhecimento. Segundo Ackoff (1999), sabedoria é um processo extrapolativo e não determinístico que invoca os outros níveis de conhecimento, informação, dados e também princípios valorativos como códigos morais, éticos, etc. Ao contrário dos níveis anteriores, a sabedoria é essencialmente filosófica, pois coloca perguntas para as quais não há uma resposta fácil, em alguns casos, pode não haver uma resposta. Sabedoria envolve um processo pelo qual discernimos o que é o certo e o errado, o bom e o mau. Por ser um estado exclusivamente humano, os computadores ainda não têm (e talvez nunca tenham) a capacidade de possuir a sabedoria.

Para que você consiga compreender plenamente, o Quadro 4.1 demonstra com exemplos as diferenças que podemos encontrar entre os assuntos trabalhados anteriormente.

Quadro 4.1 | Diferenças entre dados, informação, conhecimento e sabedoria
Lorem ipsum Column 4
Dados

Os dados representam um fato ou uma declaração de evento sem relação com outras coisas.

Exemplo: Está chovendo.

Informação

A informação incorpora a compreensão de uma relação de algum tipo, possivelmente causa e efeito.

Exemplo: A temperatura caiu 15 graus e começou a chover.

Conhecimento

O conhecimento representa um padrão que conecta e geralmente fornece um alto nível de previsibilidade, como o que é descrito ou o que vai acontecer a seguir.

Exemplo: Se a umidade for muito alta e a temperatura cair substancialmente, é improvável que a atmosfera seja capaz de reter a umidade, então chove.

Sabedoria

A sabedoria incorpora mais uma compreensão dos princípios fundamentais incorporados no conhecimento que são essencialmente a base para o conhecimento ser o que é. A sabedoria é essencialmente sistêmica.

Exemplo: O fenômeno chuva ocorre porque engloba uma compreensão de todas as interações que acontecem entre chuva, evaporação, correntes de ar, mudanças de temperatura, etc.

Fonte: Elaborado pela autora.

Dados isolados

Os dados, como vimos, constituem a matéria-prima da informação. Dados isolados são dados que não têm nenhum significado ou nenhum sentido objetivo. Por exemplo, queremos saber se uma empresa está sendo bem sucedida em determinado ramo. Sabe-se que a empresa teve um faturamento no 2° semestre do ano passado de meio milhão de reais. O que isso significa? O que se diz da empresa a partir disso? É possível dizer que é uma empresa de sucesso ou não? Provavelmente você acha que não, porque não podemos aferir essa informação apenas com esse dado isolado. Para fazer avaliações como essas é necessário cruzar, organizar e alinhar dados isolados. Esse tratamento pode ser feito por meio de ferramentas estatísticas, gráficos, tabelas, figuras. Quando fazemos isso, nós transformamos os dados em informações que serão úteis para qualquer análise que se almeje fazer.

Quando temos um histórico de faturamento crescente no semestre, informação que obtemos a partir do alinhamento dos dados isolados de faturamento de cada mês, podemos afirmar o que está ocorrendo com a empresa, por exemplo. Somente por meio do processamento desses dados, obtemos respostas para a nossa investigação. Os dados podem ser classificados em duas grandes categorias:

Há, ainda, uma classificação mais específica. Os dados qualitativos apresentam sempre uma característica de atributo ou qualidade do objeto de pesquisa. Tais dados podem ser divididos em dois tipos gerais: nominal e ordinal. O dado nominal é o dado que não exige nenhuma ordenação para a interpretação de seus resultados. Exemplos podem ser: tipo sanguíneo, sexo etc. Já o dado ordinal, ao contrário, exige uma ordem para a interpretação de seus resultados, como de pequeno a grande, bom a mau etc. Exemplos podem ser: grau de instrução (fundamental, médio, superior), ordem de chegada (primeiro, segundo, terceiro).

Os dados quantitativos, por sua vez, podem ser divididos em contínuos e discretos. Dados contínuos são medidos e não contados, são dados em que todos os valores são possíveis. Por exemplo, a medição da altura de uma pessoa é um dado contínuo e pode ser dada em metros, centímetros, milímetros etc. Assim como a definição da idade de uma pessoa em anos, meses ou dias. Já os dados discretos são utilizados com números que contam e não medem. São utilizados números inteiros apenas. Por exemplo, a quantidade de alunos em uma sala sempre será um número inteiro.

Informações contextualizadas

A informação é uma espécie de conjunto de dados contextualizados. Isto é, os dados brutos ou isolados só ganham significado ou se transformam em informações a partir da experiência do pesquisador e do que ele almeja obter nesse processo. Sendo assim, a partir dos objetivos da pesquisa definidos pelo pesquisador, os dados são organizados de forma a constituírem informações.

A informação, por exemplo, é fabricada a partir da experiência dos indivíduos e de acordo com suas preferências. Muitas vezes ela aparece atrelada a um contexto de aplicação. Nesse sentido, o olhar do pesquisador sobre os dados definirá a aplicabilidade das informações. Por exemplo, pode ser que em uma pesquisa sobre a obesidade, a coleta de dados sobre a cor dos olhos do público analisado não seja relevante, assim, para essa pesquisa o dado “cor dos olhos” não terá nenhuma significação e será descartado. Por outro lado, os dados sobre as idades ou gênero do público podem ser úteis quando cruzados com outras informações.

Já o conhecimento provém de uma sábia utilização das informações. Essa tarefa também é influenciada da experiência e perspectiva do pesquisador, muitas vezes pessoas diferentes produzem conhecimentos diferentes. Dado, informação e conhecimento são muito valiosos para nossa compreensão de mundo.

Reflita 

Você já se deparou com a percepção de que quanto mais nos aprofundamos em um assunto, muitas vezes as coisas se tornam cada vez mais abstratas e deslocadas da realidade? Ao refletirmos sobre o papel do pesquisador e as metodologias científicas, vemos, entretanto, que por mais abstrata que a pesquisa possa parecer, ela tem a função de interpretar a realidade que vivemos a partir de nossas necessidades. Além disso, a todo momento o pesquisador é convocado a tomar decisões que refletem sua experiência e bagagem profissional. Em sua visão, a investigação científica pode ser considerada uma prática social de conhecimento?

Indicadores ponderados

Frequentemente, os dados coletados de pesquisas não são exatamente representativos da população-alvo. A ponderação é uma técnica estatística que pode ser usada para corrigir quaisquer desequilíbrios nos perfis de amostra após a coleta de dados. Imagine que temos uma população-alvo dividida igualmente por gênero. Se entrevistarmos uma amostra de 400 pessoas nessa população, dos quais 300 são homens e 100 mulheres, saberemos que nossa amostra representa mais homens. Ponderar os dados resultantes pode nos ajudar a corrigir esse desequilíbrio.

As proporções desejadas para homens e mulheres são 50%. A proporção de homens, portanto, precisaria ser “reduzida” de 75% (300 em 400 entrevistas) para 50%, enquanto a proporção de mulheres precisaria ser “ponderada” de 25% para 50%. Nesse caso, a ponderação multiplicaria as entrevistas com as mulheres por 2, de modo que a resposta feminina fosse ampliada nos dados. Por exemplo, na questão de gênero, temos 100 pessoas respondendo do sexo feminino, mas após a ponderação, isso se torna 200, pois os dados "feminino" são contados duas vezes.

As entrevistas com homens precisam ser correspondentemente reduzidas. Nesse caso, precisamos obter 300 respostas para contar efetivamente como 200, portanto, multiplicamos as respostas masculinas por dois terços. Antes de ponderar, tínhamos 300 homens codificados na questão de gênero. A multiplicação por dois terços nos dá 200 homens, igualando o número de respostas femininas após a ponderação.

Os números usados para multiplicar as respostas de cada proporção da amostra são chamados de fatores de ponderação. Normalmente, a ponderação é usada para combinar o perfil da população em mais de uma variável para obter uma amostra mais representativa possível. Por exemplo, para obter uma amostra representativa da população de um país, podemos ponderar uma série de variáveis demográficas, como sexo, idade, região e nível social.

A ponderação pode alterar a estrutura de seus dados de maneira negativa, portanto, é necessário cautela ao aplicá-la. Não é aconselhável, por exemplo, aumentar o peso de pequenos grupos de entrevistados para que representem uma proporção significativa da amostra total, pois isso significa que os resultados da pesquisa são desproporcionalmente afetados por uma pequena minoria de entrevistados.

Há inúmeros recursos estatísticos de ponderação. A média ponderada é um dos indicadores de ponderação. Nos cálculos em que se utiliza a média aritmética simples, todos os valores têm o mesmo peso ou importância. Ponderar significa pesar, então, na média ponderada, multiplicamos cada valor por um peso que expressa sua importância relativa. Em geral, calcula-se a média aritmética ponderada da seguinte maneira: soma-se os produtos dos valores  pelos seus pesos (p1,  p2,  p3,...,pn) e depois divide-se esse resultado pela soma dos pesos.

x¯p=p1x1+p2x2+p3x3+....+pnxnp1+p2+p3+....+pn

Exemplificando

Suponha que você tenha prestado um concurso em que as disciplinas da prova detinham pesos diferentes. As disciplinas eram Português, Matemática, Informática e Direito Administrativo, cada disciplina tinha o respectivo peso 3, 3, 2 e 2. Ao olhar o resultado preliminar, você constata que acertou 8 em Português, 7 em Matemática, 5 em Informática e 4 em Direito Administrativo.

Dessa maneira, o cálculo da sua nota é a média ponderada desses valores. Sendo assim, no numerador temos: . No denominador temos os pesos: 3 + 3 + 2 + 2 = 10. Assim, a divisão de 63/10 dá 6,3 como sua média ponderada e nota final.

Nesta seção, você aprendeu a diferenciar informação, dados e conhecimento. Aprendeu também as diferentes classificações dos dados e soube da importância de saber aplicá-los à sua pesquisa. O tratamento dos dados é uma das partes mais importantes na apresentação dos resultados da pesquisa, pois ainda que sua pesquisa possa trazer avanços significativos, um tratamento deficiente dos dados pode colocar tudo a perder. 

Faça a valer a pena

Questão 1

Existe uma diferença entre dados e informações. Dados são os fatos ou detalhes dos quais as informações são derivadas. Dados individuais raramente são úteis sozinhos.

Para que os dados se mostrem úteis, eles precisam passar pelo processo de:

Correto!

Para que os dados se tornem significativos, eles precisam ser contextualizados pelo sujeito pesquisador por meio do tratamento e organização desses dados. A partir disso, os dados são transformados em informações.

Tente novamente...

Esta alternativa está incorreta, leia novamente a questão e reflita sobre o conteúdo para tentar outra vez.

Tente novamente...

Esta alternativa está incorreta, leia novamente a questão e reflita sobre o conteúdo para tentar outra vez.

Tente novamente...

Esta alternativa está incorreta, leia novamente a questão e reflita sobre o conteúdo para tentar outra vez.

Tente novamente...

Esta alternativa está incorreta, leia novamente a questão e reflita sobre o conteúdo para tentar outra vez.

Questão 2

Dados são fatos brutos e desorganizados que precisam ser processados. Os dados podem ser algo simples, aparentemente aleatório e inútil até que sejam organizados.

Os dados podem ser classificados de diferentes maneiras. Assinale a alternativa que apresenta uma forma correta de classificação de dados qualitativos.

Tente novamente...

Esta alternativa está incorreta, leia novamente a questão e reflita sobre o conteúdo para tentar outra vez.

Tente novamente...

Esta alternativa está incorreta, leia novamente a questão e reflita sobre o conteúdo para tentar outra vez.

Correto!

Os dados qualitativos podem ser classificados em nominais e ordinais. Os dados nominais não possuem uma ordem ou uma hierarquia em seus resultados, podem se referir, por exemplo, ao sexo, feminino ou masculino.

Tente novamente...

Esta alternativa está incorreta, leia novamente a questão e reflita sobre o conteúdo para tentar outra vez.

Tente novamente...

Esta alternativa está incorreta, leia novamente a questão e reflita sobre o conteúdo para tentar outra vez.

Questão 3

Esses dados assumem valores em um intervalo constante de números. Em geral, este tipo de dado é proveniente de medições de uma característica da qualidade de uma peça ou produto. Os possíveis valores incluem "todos" os números do intervalo de variação da característica medida.

Assinale a alternativa que apresenta o tipo correto de dado que o texto se refere.

Correto!

Os dados quantitativos contínuos podem expressar um conjunto infinito de valores numa escala contínua, não precisam ser inteiros (como os discretos). Representam mensurações como peso, diâmetro etc. 

Tente novamente...

Esta alternativa está incorreta, leia novamente a questão e reflita sobre o conteúdo para tentar outra vez.

Tente novamente...

Esta alternativa está incorreta, leia novamente a questão e reflita sobre o conteúdo para tentar outra vez.

Tente novamente...

Esta alternativa está incorreta, leia novamente a questão e reflita sobre o conteúdo para tentar outra vez.

Tente novamente...

Esta alternativa está incorreta, leia novamente a questão e reflita sobre o conteúdo para tentar outra vez.

Referências

ACKOFF, R. L. Ackoff’s Best. John Wiley & Sons, New York, 1999, p. 170-172.

BURCH, S. Sociedade da informação/sociedade do conhecimento. In: AMBROSI, A.; PEUGEOT, V.; PIMENTA, D. Desafios das palavras. Paris: C&F Editions, 2005. Disponível em: https://bit.ly/3kJgJXr. Acesso em: 28 jan. 2021.

BUSSAB, W. O.; MORETIN, P. A. Estatística básica. 4. ed. São Paulo: Atual Editora, 1987.. Acesso em: 28 jan. 2021.

MAGALHÃES, M. N.; LIMA, C. P. Noções de probabilidade e estatística. 3. ed. São Paulo: EDUSP, 2001.

Bons estudos!

AVALIE ESTE MATERIAL

OBRIGADO PELO SEU FEEDBACK!