diff --git a/Aulas/BE-testes-2medias-cap23-25.pdf b/Aulas/BE-testes-2medias-cap23-25.pdf index 0928c22..b29f714 100644 Binary files a/Aulas/BE-testes-2medias-cap23-25.pdf and b/Aulas/BE-testes-2medias-cap23-25.pdf differ diff --git a/Aulas/BE-testes-2medias-cap23-25.tex b/Aulas/BE-testes-2medias-cap23-25.tex index 52104c1..98af8d9 100644 --- a/Aulas/BE-testes-2medias-cap23-25.tex +++ b/Aulas/BE-testes-2medias-cap23-25.tex @@ -174,11 +174,12 @@ \subsection{Revisão} \end{center} \bigskip - \small + \footnotesize O objetivo do estudo é providenciar evidências suficientes para rejeitar esta hipótese, ``provando'' assim a eficácia do tratamento. \end{block} + \bigskip \begin{exampleblock}{Exemplo} - \footnotesize + \scriptsize {\bf Hipótese do estudo:} um certo tratamento de fisioterapia diminui o tempo de recuperação após uma artroplastia total do joelho. \bigskip @@ -188,11 +189,15 @@ \subsection{Revisão} \begin{frame}{\scriptsize Revisão: p-valor} \begin{block}{Conceito do p-valor} + \footnotesize Assumindo que não há efeito real (hipótese nula), e você observou uma aparente diferença... \bigskip \begin{block}{} - ... qual é a probabilidade de você ter observado essa diferença ao acaso? + \footnotesize + ... qual é a probabilidade de você ter observado essa diferença + + {\bf ao acaso}? \end{block} \end{block} \end{frame} @@ -200,7 +205,7 @@ \subsection{Revisão} \begin{frame}{\scriptsize Revisão: p-valor} \begin{block}{Interpretação do p-valor} \begin{itemize} - \footnotesize + \scriptsize \item Um valor pequeno para o p-valor (tipicamente $p \le 0.05$) representa forte evidência para rejeitar a hipótese nula, então deve-se rejeitá-la. @@ -215,8 +220,9 @@ \subsection{Revisão} \begin{block}{} \small \begin{center} - Sempre apresente seu p-valor para que o leitor possa tirar suas - próprias conclusões. + Sempre apresente seu p-valor para que o leitor possa + + tirar suas próprias conclusões. \end{center} \end{block} \end{block} @@ -224,49 +230,94 @@ \subsection{Revisão} {\hfill \scriptsize Fonte: Rumsey, D. (Statistics for Dummies, 2nd ed.)} \end{frame} -\begin{frame}{\scriptsize Revisão: Roteiro} +\begin{frame}{\scriptsize Roteiro} \begin{enumerate} - \footnotesize + \scriptsize \item Cada teste usa uma distribuição de probabilidades - \medskip + \bigskip \item A região crítica é escolhida (bilateral ou unilateral?) - \medskip + \bigskip \item As estatísticas sumárias são calculadas a partir da amostra - \medskip - \item Estas são usadas para calcular uma estatística de teste - \medskip - \item A estatística de teste é o critério de decisão: - \begin{itemize} + \bigskip + \item Estas são usadas para calcular uma {estatística de teste} + \bigskip + \end{enumerate} + \begin{block}{\scriptsize Estatística de teste = critério de decisão} + \begin{center} \footnotesize + Comparada com um valor crítico da distribuição do teste + \medskip - \item Ela é comparada com um valor crítico da distribuição do teste - \begin{center} - OU - \end{center} - \item {\bf Ela é usada para o cálculo do p-valor} - \end{itemize} - \end{enumerate} + OU + + \medskip + {\bf Usada para o cálculo do p-valor} + \end{center} + \end{block} +\end{frame} + +\begin{frame}{\scriptsize Estatística crítica vs estatística de teste} + \begin{itemize} + \footnotesize + \item A estatística crítica: quão extremo o valor observado é? + + \smallskip + {\tiny Determinada pela formulação das hipóteses nula e alternativa} + + \bigskip + \item A estatística de teste: qual é o valor observado a ser testado? + + \smallskip + {\tiny Determinada pela amostra de estudo} + \end{itemize} +\end{frame} + +\begin{frame}{\scriptsize Região crítica} + \begin{center} + \includegraphics[width=.8\textwidth]{Cap23-25/s-3-1_ex_two_tail} + \end{center} + % https://onlinecourses.science.psu.edu/statprogram/book/export/html/528 + + \begin{itemize} + \tiny +% \item $\alpha = 0.05$ (dividido em cada cauda da distribuição) + \item t crítico: $t^{*} = \pm 2.14479$ (bicaudal) + \item região crítica: $t < -2.14479$ ou $t > 2.14479$ + % \item definidos pelas hipóteses nula e alternativa + \end{itemize} \end{frame} \section{Testes paramétricos para médias} \begin{frame}{\scriptsize Testes paramétricos} \begin{itemize} - \footnotesize - \item Existe uma infinidade de testes estatísticos (cada qual com sua hipótese nula) + \scriptsize + \item Existe uma infinidade de testes estatísticos + + {\tiny (cada qual com sua hipótese nula)} \item São divididos em dois grandes grupos: paramétricos e não paramétricos - \item Os testes paramétricos assumem que a amostra vem de uma \alert{distribuição Normal} - \item Os testes não-paramétricos não presumem nenhuma forma para a distribuição dos dados + \bigskip + \item Os testes paramétricos assumem que a amostra + + vem de uma \alert{distribuição Normal} + \item Os testes não-paramétricos não presumem nenhuma forma + + para a distribuição dos dados \end{itemize} + \bigskip \begin{block}{Atenção} - Esta é uma escolha metodológica fundamental na análise, como veremos no futuro. + \footnotesize + Esta é uma escolha metodológica fundamental para a análise, + + como veremos mais adiante. \end{block} \end{frame} \begin{frame}{\scriptsize Testes paramétricos} \begin{itemize} \footnotesize - \item Os testes paramétricos assumem que a amostra vem de uma \alert{distribuição Normal} \footnote{nunca é demais frisar} + \item Os testes paramétricos assumem que a amostra vem de uma \alert{distribuição Normal} \footnote{\tiny nunca é demais frisar} + \bigskip \item Hoje veremos o {\bf teste t} (de Student), aplicado em duas formas/contextos % \item Ele pode ser usado para um ou dois grupos de medições. \end{itemize} @@ -295,6 +346,7 @@ \section{Testes paramétricos para médias} \large Já vimos o teste t para uma amostra. + \bigskip \bigskip Hoje veremos como usá-lo para duas amostras. @@ -305,11 +357,14 @@ \subsection{Dois grupos independentes} \begin{frame}{\scriptsize Premissas} \begin{itemize} - \footnotesize - \item Os dois grupos foram coletados independentemente (inter-grupo) - \item Todas as observações em cada grupo são independentes entre si (intra-grupo) + \scriptsize + \item Os dois grupos foram coletados independentemente (intergrupo) + \bigskip + \item Todas as observações em cada grupo são independentes entre si (intragrupo) + \bigskip \item Todos os dados foram amostrados de populações Normalmente distribuídas (aprox.) - \item O DP das duas populações são idênticos \footnote{uma violação desta premissa não é grave - buscar aproximação de Welch.} + \bigskip + \item O DP das duas populações são idênticos \footnote{\tiny uma violação desta premissa não é grave -- buscar aproximação de Welch.} \end{itemize} \end{frame} @@ -321,19 +376,18 @@ \subsection{Dois grupos independentes} \begin{frame}{\scriptsize Exemplo 1} \begin{exampleblock}{Exemplo 23.2} - \footnotesize + \scriptsize Motulsky, {\em et al.} (1983) investigaram se pessoas com hipertensão tem alteração nos níveis de receptores adrenérgicos $\alpha_2$ em suas plaquetas. \bigskip - {\footnotesize - Selecionaram 18 homens hipertensos, e 17 controles da mesma faixa etária. - Os resultados estão descritos como média $\pm$ SEM. - } + Selecionaram 18 homens hipertensos, e 17 controles da mesma faixa etária. + Os resultados estão descritos como média $\pm$ SEM. \begin{exampleblock}{} \footnotesize As plaquetas dos hipertensos tiveram 257 $\pm$ 14 receptores por plaqueta. + \smallskip As plaquetas dos controles tiveram 263 $\pm$ 21 receptores por plaqueta. \end{exampleblock} \bigskip @@ -343,7 +397,7 @@ \subsection{Dois grupos independentes} \begin{frame}[fragile]{\scriptsize Saída típica de um programa} \begin{exampleblock}{Teste t, amostras independentes} - \scriptsize + \tiny \begin{verbatim} P value and statistical significance: The two-tailed P value equals 0.8116 @@ -375,6 +429,7 @@ \subsection{Dois grupos independentes} \begin{itemize} \footnotesize \item Grupo Hipertensos: contínua (mensuração) + \smallskip \item Grupo Controle: contínua (mensuração) \end{itemize} \end{block} @@ -388,6 +443,7 @@ \subsection{Dois grupos independentes} \begin{itemize} \footnotesize \item Dependente: níveis de receptores (contínua) + \smallskip \item Independente: grupo (categórica binária) \end{itemize} \vfill @@ -431,7 +487,7 @@ \subsection{Dois grupos pareados} \begin{itemize} \footnotesize \item Os pares amostrados aleatoriamente de uma mesma população (ou representativa) - \item Os participantes são pareados - o primeiro do grupo A com o primeiro do grupo B, etc. + \item Os participantes são pareados -- o primeiro do grupo A com o primeiro do grupo B, etc. \item Cada par é independente de todos os outros \item A distribuição das diferenças, na população, é Normalmente distribuída (aprox.) \end{itemize} @@ -447,7 +503,7 @@ \subsection{Dois grupos pareados} \begin{frame}[fragile]{\scriptsize Saída típica de um programa} \begin{exampleblock}{Teste t, amostras pareadas} - \scriptsize + \tiny \begin{verbatim} Paired t-test @@ -506,9 +562,9 @@ \subsection{Exercício} \hfill {\footnotesize Fonte: Khan Academy} \end{frame} -\begin{frame}[fragile]{\scriptsize Tabulação dos dados\footnote{Organizar os dados desta forma, permite usar os filtros do Excel.}} +\begin{frame}[fragile]{\scriptsize Tabulação dos dados\footnote{\tiny Organizar os dados desta forma, permite usar os filtros do Excel.}} \begin{block}{Tabela de dados brutos} - \scriptsize + \tiny \begin{verbatim} Grupo Perda 1: Grupo1 12.184783 @@ -550,7 +606,7 @@ \subsection{Exercício} \end{enumerate} \end{frame} -\begin{frame}{\scriptsize EDA\footnote{\scriptsize \url{https://en.wikipedia.org/wiki/Exploratory_data_analysis}}} +\begin{frame}{\scriptsize EDA\footnote{\tiny \url{https://en.wikipedia.org/wiki/Exploratory_data_analysis}}} \begin{block}{Análise Exploratória de Dados (EDA)} \footnotesize Precisamos decidir a melhor metodologia a partir da análise descritiva. @@ -607,8 +663,8 @@ \subsection{Exercício} \begin{frame}[fragile, label=t-indep]{\scriptsize Saída típica de um programa} \begin{block}{Teste t, amostras independentes} - \scriptsize - \begin{verbatim} + \tiny +\begin{verbatim} Two Sample t-test data: Perda by Grupo @@ -626,7 +682,7 @@ \subsection{Exercício} \begin{frame}[fragile]{\scriptsize Saída típica de um programa} \begin{block}{Teste t, amostras pareadas} - \scriptsize + \tiny \begin{verbatim} Paired t-test @@ -682,7 +738,7 @@ \subsection{Exercício} \begin{frame}[fragile]{\scriptsize Saída típica de um programa} \begin{block}{Teste t, amostras independentes, com correção de Welch} - \scriptsize + \tiny \begin{verbatim} Welch Two Sample t-test @@ -730,9 +786,9 @@ \subsection{Resumo} \begin{itemize} \footnotesize \item Testes paramétricos ({\footnotesize requer dados Normalmente distribuídos}) - \item Para dois grupos independentes assume independência inter- e intra-grupo, e DPs semelhantes + \item Para dois grupos independentes assume independência inter e intragrupo, e DPs semelhantes \item Para dois grupos pareados assume independência entre os pares - \item Esta decisão \alert{não deve} ser tomada após a coleta dos dados\footnote{\scriptsize As comparações dos testes que fizemos aqui foram meramente didáticas. A EDA real terminaria nas visualizações e tabelas.}. + \item Esta decisão \alert{não deve} ser tomada após a coleta dos dados\footnote{\tiny As comparações dos testes que fizemos aqui foram meramente didáticas. A EDA real terminaria nas visualizações e tabelas.}. \item Variáveis: \begin{itemize} \scriptsize diff --git a/Aulas/BE-testes-2medias-cap23-25_4em1.pdf b/Aulas/BE-testes-2medias-cap23-25_4em1.pdf index b97c917..47d630c 100644 Binary files a/Aulas/BE-testes-2medias-cap23-25_4em1.pdf and b/Aulas/BE-testes-2medias-cap23-25_4em1.pdf differ diff --git a/Aulas/BE-testes-2prop-cap26-27.pdf b/Aulas/BE-testes-2prop-cap26-27.pdf index 26a877b..9b8c00a 100644 Binary files a/Aulas/BE-testes-2prop-cap26-27.pdf and b/Aulas/BE-testes-2prop-cap26-27.pdf differ diff --git a/Aulas/BE-testes-2prop-cap26-27.tex b/Aulas/BE-testes-2prop-cap26-27.tex index a9782e3..373b6e7 100644 --- a/Aulas/BE-testes-2prop-cap26-27.tex +++ b/Aulas/BE-testes-2prop-cap26-27.tex @@ -163,29 +163,31 @@ \end{block} \end{frame} -\section[1 amostra]{Observação x expectativa (1 amostra)} +\section[1 amostra]{Observação x expectativa (1 proporção)} \subsection{Objetivo da aula} -\begin{frame}{\scriptsize Dados categóricos} - \begin{itemize} - \footnotesize - \item Vamos analisar contagens de dados categóricos (ou nominais) - \item Para estas variáveis qualitativas não existe ordenação interente - \item Observamos apenas as contagens e frequências destes dados em - uma amostra. - \end{itemize} - \begin{exampleblock}{Exemplo} - \footnotesize - doente/sadio, fumante/não fumante, masculino/feminino, olhos - castanhos/olhos azuis/olhos verdes, etc. - \end{exampleblock} -\end{frame} +% \begin{frame}{\scriptsize Dados categóricos} +% \begin{itemize} +% \footnotesize +% \item Vamos analisar contagens de dados categóricos (ou nominais) +% \item Para estas variáveis qualitativas não existe ordenação interente +% \item Observamos apenas as contagens e frequências destes dados em +% uma amostra. +% \end{itemize} +% \begin{exampleblock}{Exemplo} +% \footnotesize +% doente/sadio, fumante/não fumante, masculino/feminino, olhos +% castanhos/olhos azuis/olhos verdes, etc. +% \end{exampleblock} +% \end{frame} -\begin{frame}{\scriptsize Objetivo} - \small - Considere a seguinte tabela: - \begin{exampleblock}{Exemplo} +\begin{frame}{\scriptsize Objetivo da aula} + \footnotesize + Considere a seguinte tabela de contingência: + + \bigskip + \begin{block}{} \footnotesize \begin{tabular}{c|c|c} & Lesão & Não tem lesão\\ @@ -196,15 +198,20 @@ \subsection{Objetivo da aula} \end{tabular} \bigskip - {\hfill \scriptsize (Fonte: Larson \& Farber 2013)} - \end{exampleblock} + {\hfill \tiny Fonte: Larson \& Farber 2013} + \end{block} + \begin{itemize} + \tiny + \item 4\% dos que se alongaram tiveram lesão + \item 48\% dos que não se alongaram tiveram lesão + \end{itemize} \vfill \begin{block}{Pergunta} Como determinar se existe alguma relação entre as variáveis? \bigskip \small - Isto é: o desfecho é independente da exposição? + Isto é: {\bf o desfecho é independente da exposição?} \end{block} \end{frame} @@ -228,25 +235,21 @@ \subsection{Objetivo da aula} \end{center} \end{frame} -\subsection{Analisando dados de contagens} +\subsection{Teste qui-quadrado para 1 proporção} -\begin{frame}{\scriptsize Exemplo} - \begin{exampleblock}{Exemplo} +\begin{frame}{\scriptsize Exemplo 1} + \begin{exampleblock}{Exemplo 1} \footnotesize Considere que 10\% dos pacientes morrem após uma operação arriscada. Em uma amostra de 75 pacientes, observou-se que 16 pacientes morreram após a operação. + \bigskip Como comparar o número de óbitos osbervado e o número esperado? - Fonte: Motulsky, 1995 + \bigskip + {\hfill \tiny Fonte: Motulsky, 1995} \end{exampleblock} - \begin{itemize} - \footnotesize - \item O número observado de óbitos em 75 pacientes foi 16. - \item O número esperado seria $75 \times 10\% = 7.5$ - \item A discrepância nos óbitos foi $16-7.5 = 8.5$ - \end{itemize} \end{frame} \begin{frame}{\scriptsize Quais são as variáveis?} @@ -263,6 +266,43 @@ \subsection{Analisando dados de contagens} \end{block} \end{frame} +\begin{frame}{Exemplo 1} + \begin{exampleblock}{Exemplo 1} + \footnotesize + + Considere que 10\% dos pacientes morrem após uma operação + arriscada. + + Em uma amostra de 75 pacientes, observou-se que 16 pacientes + morreram após a operação. + \end{exampleblock} + \bigskip + \begin{itemize} + \footnotesize + \item<1-> O número observado de óbitos em 75 pacientes foi 16. + \item<2-> O número esperado seria $75 \times 10\% = 7.5$ + \item<3-> A discrepância nos óbitos foi $16-7.5 = 8.5$ + \end{itemize} +\end{frame} + +\begin{frame}{\small Expectativa x Realidade} + \begin{block}{Observação} + \scriptsize + Se as frequências observadas forem iguais: + \bigskip + \begin{itemize} + \footnotesize + \item diferença entre ambas (discrepância) $= 0$ + \item% diferença $^2$ = 0 + \item% $\chi^2 = 0$ + \end{itemize} + \bigskip + \uncover<0>{\begin{block}{} + Quanto maior o valor de de $\chi^2$, maior a discrepância + \end{block}} + \end{block} +\end{frame} + \begin{frame}{\scriptsize Questões} \begin{itemize} \footnotesize @@ -293,8 +333,33 @@ \subsection{Analisando dados de contagens} \end{block} \end{frame} +\begin{frame}{\small Expectativa x Realidade} + \begin{center} + \small + A razão $\frac{\text{observado}}{\text{esperado}}$ é um princípio {\bf central} na Estatística\footnote{\scriptsize Usada para comparação de valores quadráticos, incluindo variâncias} + \end{center} +\end{frame} + +\begin{frame}{\small Expectativa x Realidade} + \begin{block}{Observação} + \scriptsize + Se as frequências observadas forem iguais: + \bigskip + \begin{itemize} + \footnotesize + \item diferença entre ambas (discrepância) $= 0$ + \item diferença $^2$ = 0 + \item $\chi^2 = 0$ + \end{itemize} + \bigskip + \uncover<2>{\begin{block}{} + Quanto maior o valor de de $\chi^2$, maior a discrepância + \end{block}} + \end{block} +\end{frame} + \begin{frame}{\scriptsize Tabela de frequências} - \begin{exampleblock}{Exemplo} + \begin{exampleblock}{Exemplo 1} \footnotesize \begin{tabular}{c|c|c} & Observado & Esperado\\ @@ -307,7 +372,8 @@ \subsection{Analisando dados de contagens} \end{tabular} \end{exampleblock} -Estatística de teste: + Estatística de teste: + \small \begin{displaymath} \chi^2 = \frac{(16 - 7.5)^2}{7.5} + \frac{(59 - 67.5)^2}{67.5} = \end{displaymath} @@ -325,34 +391,42 @@ \subsection{Analisando dados de contagens} % \item Como $p=0.0011 < 0.05$, decidimos \alert{rejeitar} $H_0$. \end{itemize} \bigskip - \begin{block}{Resultado} + \begin{exampleblock}{Resultado} \small (...) a mortalidade observada foi diferente de 10\% ($p=0.0011$). - \end{block} + \end{exampleblock} \end{frame} -\section[2 amostras]{Testes para 2 amostras} +\section[2 amostras]{Testes de independência para 2 proporções} \subsection{Tabelas 2x2} \begin{frame}{\scriptsize Tabelas de Contingência} \begin{block}{Definição} + \footnotesize Uma \alert{tabela de contingência} mostra as frequências observadas para duas variáveis categóricas. \end{block} + \bigskip \begin{itemize} \footnotesize - \item Podemos calcular as frequências esperadas, baseado no tamanho - das amostras - \item Comparamos assim a frequência observada com a frequência - esperada - \item Obs: a tabela do exemplo anterior (óbitos) \alert{não é} uma - tabela de contingência! (Por que?) + \item Podemos calcular as frequências esperadas, baseado + \begin{itemize} + \scriptsize + \item no tamanho das amostras + \item na $H_0$ + \end{itemize} + \item Comparação: frequência observada $\times$ frequência esperada \end{itemize} + \bigskip + \begin{block}{} + \footnotesize + A tabela do exemplo 1 (óbitos) \alert{não é} uma tabela de contingência! (Por que?) + \end{block} \end{frame} -\begin{frame}[label=exemplo8.1]{\scriptsize Tabelas de Contingência 2x2} - \begin{exampleblock}{Exemplo} +\begin{frame}[label=exemplo8.1]{\scriptsize Exemplo 2 (8.1)} + \begin{exampleblock}{Exemplo 8.1} \footnotesize Frequências observadas: \begin{tabular}{c|c|c} @@ -363,6 +437,7 @@ \subsection{Tabelas 2x2} Placebo & 129 & 332 \\ \end{tabular} \end{exampleblock} + \vfill \begin{itemize} \footnotesize \item Existe relação entre o uso do AZT e a progressão da doença? @@ -385,7 +460,7 @@ \subsection{Tabelas 2x2} \end{block} \end{frame} -\begin{frame}{\scriptsize Tabelas de contingência 2x2} +\begin{frame}{\scriptsize Exemplo 8.1} \begin{itemize} \footnotesize \item $H_0$: o AZT não é mais eficaz que o placebo @@ -403,7 +478,7 @@ \subsection{Tabelas 2x2} \end{frame} \begin{frame}{\scriptsize Tabelas de contingência 2x2} - \begin{exampleblock}{Exemplo} + \begin{exampleblock}{Exemplo 8.1} \footnotesize Frequências observadas: \begin{tabular}{c|c|c|c} @@ -447,7 +522,7 @@ \subsection{Tabelas 2x2} \end{frame} \begin{frame}{\scriptsize Tabelas de contingência 2x2} - \begin{exampleblock}{Exemplo} + \begin{exampleblock}{Exemplo 8.1} \footnotesize Frequências observadas: \begin{tabular}{c|c|c|c} @@ -470,9 +545,9 @@ \subsection{Tabelas 2x2} \end{itemize} \end{frame} -\begin{frame}{\scriptsize Tabelas de contingência 2x2} +\begin{frame}{\scriptsize Observação} Colocando os valores em uma tabela semelhante: - \begin{exampleblock}{Exemplo} + \begin{exampleblock}{Exemplo 8.1} \footnotesize Frequências esperadas: \begin{tabular}{c|c|c|c} @@ -485,6 +560,8 @@ \subsection{Tabelas 2x2} total & 205.0 & 731.0 & 936.0\\ \end{tabular} \end{exampleblock} + \vfill + \small Observe que os totais esperados devem ser iguais aos observados! \end{frame} @@ -508,8 +585,7 @@ \subsection{Tabelas 2x2} \end{frame} \begin{frame}{\scriptsize Teste de Hipótese} - \begin{exampleblock}{Exemplo} - \footnotesize + \begin{exampleblock}{Exemplo 8.1} \begin{itemize} \scriptsize \item AZT + P = $\frac{(76 - 104.0)^2}{104.0} = \frac{28^2}{104.0} @@ -549,10 +625,10 @@ \subsection{Tabelas 2x2} observados e os esperados. \item Resultado: devemos \alert{rejeitar} a $H_0$ \end{itemize} - \begin{block}{Interpretação} + \begin{exampleblock}{Interpretação} Rejeitamos a hipótese de que o AZT não é mais eficiente que o placebo. - \end{block} + \end{exampleblock} \end{frame} \begin{frame}{\scriptsize O teste Qui-Quadrado} @@ -581,6 +657,8 @@ \subsection{Tabelas 2x2} \item Quanto se tem amostras de tamanho moderado, e se tiver uma ferramenta computacional disponível \end{enumerate} + \bigskip + \bigskip \item Se sua amostra for enorme (milhares de dados), prefira o teste $\chi^2$, pois: \begin{enumerate} @@ -591,9 +669,78 @@ \subsection{Tabelas 2x2} \end{itemize} \end{frame} +\subsection{Na prática} + +\againframe{exemplo8.1} + +\begin{frame}[fragile]{\scriptsize Saída típica de um programa} + \begin{exampleblock}{Teste Qui-quadrado} + \scriptsize +\begin{verbatim} + Pearson's Chi-squared test with Yates' + continuity correction + +data: exemplo8.1 +X-squared = 18.944, df = 1, + p-value = 1.346e-05 +\end{verbatim} + \end{exampleblock} +\end{frame} + +\begin{frame}[fragile]{\scriptsize Saída típica de um programa} + \begin{exampleblock}{Teste exato de Fisher} + \scriptsize +\begin{verbatim} + Fisher's Exact Test for Count Data + +data: exemplo8.1 +p-value = 9.24e-06 +alternative hypothesis: true odds ratio + is not equal to 1 +95 percent confidence interval: + 0.3512693 0.6818650 +sample estimates: +odds ratio + 0.4905877 +\end{verbatim} + \end{exampleblock} +\end{frame} + +\begin{frame}{\scriptsize Visualização - gráfico de barra} + \begin{center} + \includegraphics[height=\textheight]{Cap26-27/barplot} + \end{center} +\end{frame} + +\begin{frame}{\scriptsize Visualização - pizza} + \begin{block}{Atenção} + NÃO use gráfico de pizza! + \end{block} + \begin{itemize} + \scriptsize + \item É uma visualização ineficiente + \item Nosso olho é ``bom'' para julgar distâncias/comprimentos + \item Nosso olho é ruim para julgar áreas + \item Indicado {\bf apenas} quando as categorias são muito discrepantes + \end{itemize} + \begin{block}{Cleveland (1985)} + \scriptsize + {\em ``Data that can be shown by pie charts always can be shown by a dot chart. + + \bigskip + This means that judgements of position along a common scale can be made instead of the less accurate angle judgements.''} + \end{block} +\end{frame} + \subsection{Tabelas maiores} -\begin{frame}{\scriptsize Tabelas de Contingência maiores} +\begin{frame}{\scriptsize Tabelas de contingência maiores} + \begin{center} + E quando temos mais do que duas categorias? + \end{center} +\end{frame} + +\begin{frame}{\scriptsize Tabelas de contingência maiores} \small \begin{itemize} \footnotesize @@ -625,7 +772,7 @@ \subsection{Tabelas maiores} % Não melhora & 12 & 13 & 45\\ % \end{tabular} -% (Fonte: Larson \& Farber 2013) +% {\hfill \tiny Fonte: Larson \& Farber 2013} % \end{exampleblock} % \begin{itemize} % \item Graus de liberdade: @@ -636,16 +783,15 @@ \subsection{Tabelas maiores} % \end{itemize} % \end{frame} -\begin{frame}{\scriptsize Tabelas de Contingência maiores} - \begin{exampleblock}{Exemplo} - \footnotesize +\begin{frame}{\scriptsize Tabelas de contingência maiores} + \begin{exampleblock}{Exemplo 3} + \scriptsize Em dois hospitais, os resultados de 575 autópsias foram comparados com as causas de morte listadas nos atestados. Um dos hospitais que participou do estudo era comunitário (A); o outro era universitário (B). \bigskip - \scriptsize % \begin{tabular}{c|c{5cm}|c{5cm}|c{5cm}}%{\textwidth}{@{} Y c c c c @{}} \begin{tabular}{c|p{2cm}|p{2cm}|p{2cm}} Hospital & Precisão confirmada & Falta de informações & @@ -655,31 +801,16 @@ \subsection{Tabelas maiores} \hline B & 268 & 44 & 34 \\ \end{tabular} - \small - \bigskip + \bigskip Os resultados sugerem práticas diferentes no preenchimento de atestados de óbito nos dois hospitais? \end{exampleblock} \vfill - {\hfill \footnotesize Fonte: Aula Hacker \& Simões (2008 - Fiocruz)} -\end{frame} - -\begin{frame}{\scriptsize Quais são as variáveis?} - \begin{itemize} - \footnotesize - \item Dependente: qualidade do preenchimento (categórica) - \item Independente: hospital (categórica) - \end{itemize} - \vfill - \begin{block}{Esta relação pode ser expressa como} - \begin{displaymath} - \text{preenchimento} \sim \text{hospital} - \end{displaymath} - \end{block} + {\hfill \tiny Fonte: Aula Hacker \& Simões (2008 - Fiocruz)} \end{frame} -\begin{frame}{\scriptsize Tabelas de Contingência maiores} +\begin{frame}{\scriptsize Tabelas de contingência maiores} \begin{itemize} \footnotesize \item $H_0$: Dentro de cada categoria do status do atestado, as @@ -694,80 +825,130 @@ \subsection{Tabelas maiores} \end{itemize} \end{frame} -\begin{frame}{\scriptsize Tabelas de contingência maiores} - Preenchendo os totais por linha e coluna: - \begin{exampleblock}{Exemplo} +\begin{frame}{\scriptsize Quais são as variáveis?} + \begin{itemize} \footnotesize - \begin{tabular}{c|c|c|c|c} - Hospital & Confirmada & Incompleta & - Incorreta & total\\ - \hline - A & 157 & 18 & 54 & 229\\ - \hline - B & 268 & 44 & 34 & 346\\ - \hline - total & 425 & 62 & 88 & 575\\ - \end{tabular} - \end{exampleblock} + \item Dependente: qualidade do preenchimento (categórica) + \item Independente: hospital (categórica) + \end{itemize} + \vfill + \begin{block}{Esta relação pode ser expressa como} + \begin{displaymath} + \text{preenchimento} \sim \text{hospital} + \end{displaymath} + \end{block} \end{frame} -\begin{frame}{\scriptsize Tabelas de contingência maiores} - Incluindo os valores esperados em parênteses temos: - \begin{exampleblock}{Exemplo} - \footnotesize - \begin{tabular}{c|c|c|c|c} - Hospital & Confirmada & Incompleta & - Incorreta & total\\ - \hline - A & 157 (169.3) & 18 (24.7) & 54 (35.0) & 229\\ - \hline - B & 268 (255.7) & 44 (37.3) & 34 (53.0) & 346\\ - \hline - total & 425 & 62 & 88 & 575\\ - \end{tabular} - \end{exampleblock} -\end{frame} +\begin{frame}[fragile]{\scriptsize Tabelas de contingência maiores} + \begin{exampleblock}{Teste exato de Fisher} + \scriptsize +\begin{verbatim} + Fisher's Exact Test for Count Data -\begin{frame}{\scriptsize Tabelas de Contingência maiores} - \small - Calculando a estatística de teste $\chi^2$: +data: exemplo3 +p-value = 2.575e-05 +alternative hypothesis: two.sided +\end{verbatim} - \bigskip - \begin{exampleblock}{Exemplo} - \footnotesize - \begin{tabular}{c|c|c|c|c} - \footnotesize - Hospital & Confirmada & Incompleta & - Incorreta & total\\ - \hline - A & 157 (169.3) & 18 (24.7) & 54 (35.0) & 229\\ - \hline - B & 268 (255.7) & 44 (37.3) & 34 (53.0) & 346\\ - \hline - total & 425 & 62 & 88 & 575\\ - \end{tabular} \end{exampleblock} - \begin{itemize} + \begin{exampleblock}{Teste Qui-quadrado} \scriptsize - \item $\chi^2 = \frac{(157 - 169.3)^2}{169.3} + \frac{(18-24.7)^2}{24.7} + \ldots$ - \bigskip - \small - \item $\chi^2 = 21.62,\ p<0.001$ - \end{itemize} +\begin{verbatim} + Pearson's Chi-squared test + +data: exemplo3 +X-squared = 21.523, df = 2, p-value = 2.12e-05 +\end{verbatim} + \end{exampleblock} \end{frame} -\begin{frame}{\scriptsize Tabelas de Contingência maiores} +% \begin{frame}{\scriptsize Tabelas de contingência maiores} +% \footnotesize +% Preenchendo os totais por linha e coluna: + +% \bigskip +% \begin{exampleblock}{Exemplo 3} +% \footnotesize +% \begin{tabular}{c|c|c|c|c} +% Hospital & Confirmada & Incompleta & +% Incorreta & total\\ +% \hline +% A & 157 & 18 & 54 & 229\\ +% \hline +% B & 268 & 44 & 34 & 346\\ +% \hline +% total & 425 & 62 & 88 & 575\\ +% \end{tabular} +% \end{exampleblock} +% \end{frame} + +% \begin{frame}{\scriptsize Tabelas de contingência maiores} +% \footnotesize +% Incluindo os valores esperados em parênteses temos: + +% \bigskip +% \begin{exampleblock}{Exemplo 3} +% \footnotesize +% \begin{tabular}{c|c|c|c|c} +% Hospital & Confirmada & Incompleta & +% Incorreta & total\\ +% \hline +% A & 157 (169.3) & 18 (24.7) & 54 (35.0) & 229\\ +% \hline +% B & 268 (255.7) & 44 (37.3) & 34 (53.0) & 346\\ +% \hline +% total & 425 & 62 & 88 & 575\\ +% \end{tabular} +% \end{exampleblock} +% \end{frame} + +% \begin{frame}{\scriptsize Tabelas de contingência maiores} +% \footnotesize +% Calculando a estatística de teste $\chi^2$: + +% \bigskip +% \begin{exampleblock}{Exemplo 3} +% \footnotesize +% \begin{tabular}{c|c|c|c|c} +% \footnotesize +% Hospital & Confirmada & Incompleta & +% Incorreta & total\\ +% \hline +% A & 157 (169.3) & 18 (24.7) & 54 (35.0) & 229\\ +% \hline +% B & 268 (255.7) & 44 (37.3) & 34 (53.0) & 346\\ +% \hline +% total & 425 & 62 & 88 & 575\\ +% \end{tabular} +% \end{exampleblock} +% \begin{itemize} +% \scriptsize +% \item $\chi^2 = \frac{(157 - 169.3)^2}{169.3} + \frac{(18-24.7)^2}{24.7} + \ldots$ +% \bigskip +% \small +% \item $\chi^2 = 21.52,\ p<0.001$ +% \end{itemize} +% \end{frame} + +\begin{frame}{\scriptsize Tabelas de contingência maiores} \begin{itemize} - \footnotesize - \item Calculamos a estatística de teste $\chi^2 = 21.62$ - \item Encontramos um p-valor $p<0.001$ (valor fora da tabela) + \scriptsize + \item Estatística de teste $\chi^2 = 21.52$ + \item p-valor: $p<0.001$ %(valor fora da tabela) \item Rejeitamos $H_0$ ao nível de significância de $\alpha = 0.05$. - \item Conclusão: Há associação entre o hospital e o status do atestado. - \item Parece que o hospital A tem maior proporção de atestados incorretos. \end{itemize} + \bigskip + \begin{exampleblock}{Resultado} + \footnotesize + Há associação entre o hospital e o status do atestado. + \end{exampleblock} + \begin{exampleblock}{Conclusão} + \footnotesize + Parece que o hospital A tem maior proporção de atestados incorretos. + \end{exampleblock} \end{frame} -% \begin{frame}{\scriptsize Tabelas de Contingência maiores} +% \begin{frame}{\scriptsize Tabelas de contingência maiores} % \begin{exampleblock}{Exemplo} % Comparação entre tratamentos com medicamento de marca, medicamento % genérico e placebo. @@ -790,75 +971,13 @@ \subsection{Tabelas maiores} % \end{itemize} % \end{frame} -\subsection{Na prática} - -\againframe{exemplo8.1} - -\begin{frame}[fragile]{\scriptsize Saída típica de um programa} - \begin{block}{Teste Qui-quadrado} - \scriptsize -\begin{verbatim} - Pearson's Chi-squared test with Yates' - continuity correction - -data: exemplo8.1 -X-squared = 18.944, df = 1, - p-value = 1.346e-05 -\end{verbatim} - \end{block} -\end{frame} - -\begin{frame}[fragile]{\scriptsize Saída típica de um programa} - \begin{block}{Teste exato de Fisher} - \scriptsize -\begin{verbatim} - Fisher's Exact Test for Count Data - -data: exemplo8.1 -p-value = 9.24e-06 -alternative hypothesis: true odds ratio - is not equal to 1 -95 percent confidence interval: - 0.3512693 0.6818650 -sample estimates: -odds ratio - 0.4905877 -\end{verbatim} - \end{block} -\end{frame} - -\begin{frame}{\scriptsize Visualização - gráfico de barra} - \begin{center} - \includegraphics[height=\textheight]{Cap26-27/barplot} - \end{center} -\end{frame} - -\begin{frame}{\scriptsize Visualização - pizza} - \begin{block}{Atenção} - NÃO use gráfico de pizza! - \end{block} - \begin{itemize} - \footnotesize - \item É uma visualização ineficiente - \item Nosso olho é ``bom'' para julgar distâncias/comprimentos - \item Nosso olho é ruim para julgar áreas - \item Indicado {\bf apenas} quando as categorias são muito discrepantes - \end{itemize} - \begin{block}{Cleveland (1985)} - \small - {\em ``Data that can be shown by pie charts always can be shown by a dot chart. - - \bigskip - This means that judgements of position along a common scale can be made instead of the less accurate angle judgements.''} - \end{block} -\end{frame} - \subsection{Resumo} \begin{frame}{\scriptsize Resumo} \begin{itemize} \footnotesize - \item O teste exato de fisher é um teste de independência entre os grupos + \item O teste de Fisher é um teste de independência entre os grupos + \bigskip \item O teste Qui-quadrado é uma boa aproximação, para N grande \end{itemize} \end{frame} diff --git a/Aulas/BE-testes-2prop-cap26-27_4em1.pdf b/Aulas/BE-testes-2prop-cap26-27_4em1.pdf index 1e22783..07b8946 100644 Binary files a/Aulas/BE-testes-2prop-cap26-27_4em1.pdf and b/Aulas/BE-testes-2prop-cap26-27_4em1.pdf differ diff --git a/Aulas/Cap23-25/s-3-1_ex_two_tail.png b/Aulas/Cap23-25/s-3-1_ex_two_tail.png new file mode 100644 index 0000000..84e4b71 Binary files /dev/null and b/Aulas/Cap23-25/s-3-1_ex_two_tail.png differ diff --git a/Aulas/Cap26-27/pizza1.png b/Aulas/Cap26-27/pizza1.png new file mode 100644 index 0000000..5fa4f0c Binary files /dev/null and b/Aulas/Cap26-27/pizza1.png differ diff --git a/Aulas/Cap26-27/pizza2.png b/Aulas/Cap26-27/pizza2.png new file mode 100644 index 0000000..9cf5dca Binary files /dev/null and b/Aulas/Cap26-27/pizza2.png differ diff --git a/Aulas/Cap26-27/tc.R b/Aulas/Cap26-27/tc.R index 9e4fd1f..86abbae 100644 --- a/Aulas/Cap26-27/tc.R +++ b/Aulas/Cap26-27/tc.R @@ -7,3 +7,7 @@ colnames(exemplo8.1) <- c("Progrediu", "Não progrediu") png("Aulas/Teste_qui2/barplot.png") barplot(exemplo8.1, beside = T, ylim = c(0,500), legend.text = T) dev.off() + +exemplo3 <- matrix(c(157, 18, 54, 268, 44, 34), byrow = T, nrow = 2) +colnames(exemplo3) <- c("confirmado", "incompleto", "incorreto") +rownames(exemplo3) <- c("A", "B")