Bioestatística

A Bioestatística é uma área das estatísticas . Ele lida com questões que surgem na pesquisa médica - portanto, também conhecidas como estatísticas médicas - e outras áreas de pesquisa que lidam com seres vivos (por exemplo, em experimentos agrícolas, genética estatística).

Suas tarefas incluem o planejamento e execução de estudos, bem como a análise dos dados obtidos com o auxílio de métodos estatísticos. O termo geralmente é Biometria, também usado como sinônimo de Bioestatística.

Bioestatística moderna

Recentemente, observou-se um aumento da importância da estatística nas ciências da vida . Isto é devido à existência e surgimento de vários métodos de alto rendimento (como sequenciamento de próxima geração , microarranjos no nível de RNA / DNA (ou seja, gene) e espectrometria de massa no nível de proteína). As modalidades técnicas mencionadas geram enormes quantidades de dados brutos que só podem ser analisados ​​por meio de métodos bioestatísticos. Essa nova abordagem também é conhecida como biologia de sistemas .

Os métodos usados ​​para avaliar esses dados são bastante complexos. Do lado metodológico, são usados ​​os seguintes, entre outras coisas: Aprendizado de máquina estatístico por ex. B. Redes Neurais Artificiais , Máquinas de Vetores de Suporte e Análise de Componentes Principais . É claro que os conceitos estatísticos clássicos, como regressão ou correlação, também desempenham um papel como base desses métodos. Estatísticas robustas são necessárias para avaliar esses dados. Esses são métodos estatísticos que não são suscetíveis a outliers (são valores medidos muito altos ou muito baixos devido a ocorrências aleatórias). Há um grande número de outliers nos dados de expressão gênica. Para fazer isso, você só precisa ter em mente que mesmo uma partícula de poeira em um microarray pode ter um efeito sério nas medições.

O método Random Forest ("random forest method") de Leo Breiman é sempre importante, especialmente porque, ao contrário, por exemplo, das máquinas de vetores de suporte, uma interpretabilidade muito boa é dada aqui. O fato é que com este método são geradas árvores de decisão aleatórias e podem ser claramente interpretadas. Por exemplo, você pode proteger e apoiar estatisticamente as decisões clínicas. Além disso, pode-se comprovar a correção das decisões clínicas com rigor matemático. O método também é usado em sistemas de suporte à decisão clínica. Outra vantagem (além da interpretabilidade) das florestas aleatórias em contraste com os SVMs é a menor velocidade de computação. O tempo de treinamento em uma floresta aleatória aumenta linearmente com o número de árvores. Um exemplo de teste é avaliado individualmente em cada árvore e, portanto, pode ser paralelizado.

Basicamente, pode-se dizer que os enormes conjuntos de dados biológicos são altamente dimensionais e redundantes. Isso significa que muitas das informações coletadas não são relevantes para a classificação (de, por exemplo, indivíduos doentes e não doentes). Também pode ser o caso de que, devido à presença de multicolinearidade, a informação de um preditor esteja contida em outro preditor. Os dois preditores podem ter uma alta correlação. Aqui, a fim de reduzir o conjunto de dados sem perder informações essenciais, as chamadas técnicas de redução de dimensão (por exemplo, a análise de componente principal acima mencionada) são usadas.

Métodos estatísticos clássicos, como regressão linear ou logística e análise discriminante linear , muitas vezes não são adequados para sua aplicação a dados de alta dimensão (ou seja, dados em que o número de observações é menor do que o número de preditores :) . Esses métodos estatísticos foram desenvolvidos para dados dimensionais baixos ( ). Freqüentemente, pode até ser o caso de que a aplicação de uma regressão linear a um conjunto de dados de alta dimensão com todos os preditores produza um coeficiente de determinação muito alto , embora não seja um modelo estatístico com grande poder preditivo. Deve-se ter cuidado aqui ao interpretar isso.

Recentemente, também foram feitas tentativas para incorporar o conhecimento das redes regulatórias de genes e cascatas de sinais bioquímicos na análise (análise de enriquecimento de conjuntos de genes). Existem várias ferramentas bioinformáticas para isso (incluindo GSEA - Gene Set Enrichment Analysis do Broad Institute). A ideia é que muitas vezes é mais sensato considerar a perturbação de conjuntos inteiros de genes (por exemplo, cascatas de sinal, como o caminho do sinal Jak-Stat ) em conjunto do que examinar a perturbação de genes individuais. Além disso, faz-se uso do trabalho de pesquisa em cascatas de sinais biológicos. Isso também torna a análise mais robusta: porque é mais provável encontrar um único gene falso positivo do que toda uma cascata de sinal falso positivo. Existe também a possibilidade de que a perturbação de uma cascata de sinais encontrada já tenha sido descrita na literatura.

A randomização Mendeliana é uma abordagem não experimental para determinar relações causais usando sequências de DNA .

Estudos clínicos

A bioestatística também é usada em estudos clínicos . Em tais estudos, a eficácia de certos medicamentos, dispositivos médicos ou métodos de tratamento é examinada no âmbito da medicina baseada em evidências. A bioestatística já ajuda no planejamento de estudo ideal, ou seja, logo no início de um estudo clínico. Por exemplo, o número de tentativas deve ser calculado. Além disso, o estudo é idealmente duplo-cego (ou seja, o experimentador e o paciente não sabem se contêm placebo ou medicamento). Com a ajuda de métodos estatísticos modernos, pode-se determinar qual paciente se beneficiará particularmente de qual terapia ou se uma terapia faz algum sentido. Usando a técnica de correspondência estatística , um estudo quase aleatório pode ser desenvolvido a partir de dados de observação não aleatórios.

Pesquisa nutricional

Métodos bioestatísticos também são usados ​​na pesquisa nutricional para pesquisar os efeitos de certos alimentos na saúde. Perguntas como “Um determinado alimento está relacionado ao desenvolvimento de uma determinada doença?” Ou “O consumo de um determinado alimento tem um efeito positivo sobre uma determinada doença?” Desempenhe um papel. Na Alemanha, o Instituto Alemão de Pesquisa Nutricional conduz pesquisas nessa área.

Medicina preventiva

A medicina preventiva é um ramo da medicina que trata da prevenção de doenças antes que elas apareçam. Aqui, também, a bioestatística é usada para descobrir como as doenças podem ser prevenidas.

literatura

  • Wolfgang Köhler , Gabriel Schachtel, Peter Voleske: Bioestatística. Uma introdução para biólogos e agrônomos , 3ª atualizada e exp. Edição Springer, Berlin 2002, ISBN 978-3540429470 .
  • Christel Weiß: Basic knowledge of medical statistics , 5ª edição Springer, Berlin 2010, ISBN 978-3-642-11336-9 .
  • Hedderich, Sachs: Applied Statistics , 14ª edição, Springer, Berlin

Links da web