Modelos probabilísticos discretos e Dados\n",
+ "___\n",
+ "\n",
+ "## Aula 11\n",
+ "\n",
+ "**Objetivo da aula:** Ao final desta aula, o aluno deve ser capaz de especificar as distribuições de probabilidades adequadas para variáveis aleatórias discretas considerando modelos probabilísticos discretos já bem definidos na literatura estatística.\n"
+ ]
+ },
+ {
+ "cell_type": "markdown",
+ "metadata": {},
+ "source": [
+ "___\n",
+ "\n",
+ "\n",
+ "## Índice\n",
+ "\n",
+ "- [Teoria: Distribuição Binomial](#teoria)\n",
+ " - [Esperança e Variância](#esperanca-variancia)\n",
+ "- [DETRAN](#detran)\n",
+ " - [Modelo teórico](#modelo-teorico)\n",
+ " - [Exercício 1](#ex1)\n",
+ " - [Exercício 2](#ex2)\n",
+ " - [Resultados empíricos](#resultados-empiricos)\n",
+ " - [Exercício 3](#ex3)\n",
+ " - [Exercício 4](#ex4)\n",
+ " - [Comparação: resultados empíricos X modelo teórico](#comparacao)\n",
+ " - [Opção 1: Frequências relativas X Probabilidades teóricas](#opcao1)\n",
+ " - [Opção 2: Frequência relativa acumulada X Probabilidade acumulada](#opcao2)\n",
+ " - [Exercício 5](#ex5)\n",
+ " - [Exercício 6](#ex6)\n",
+ " - [Exercício 7](#ex7)\n",
+ "- [Lista de comandos utilizados neste notebook](#comandos)"
+ ]
+ },
+ {
+ "cell_type": "code",
+ "execution_count": 86,
+ "metadata": {},
+ "outputs": [],
+ "source": [
+ "%matplotlib inline\n",
+ "import pandas as pd\n",
+ "import matplotlib.pyplot as plt\n",
+ "import numpy as np\n",
+ "\n",
+ "from scipy import stats #importa apenas as funções de estatísticas da biblioteca SciPy."
+ ]
+ },
+ {
+ "cell_type": "markdown",
+ "metadata": {},
+ "source": [
+ "\n",
+ "\n",
+ "# DETRAN \n",
+ "\n",
+ "Esse exercício irá explorar uma modelagem de dados reais.\n",
+ "\n",
+ "> **Confira alguns itens obrigatórios verificados durante a vistoria do Detran**\n",
+ ">\n",
+ "> *Todos os veículos, novos ou velhos, precisam passar por uma vistoria todos os anos. (...) O motorista precisa estar atento a alguns itens obrigatórios. Tudo deve funcionar perfeitamente, apresentar bom estado de conservação e estar dentro do prazo de validade.*\n",
+ ">\n",
+ "> Fonte: http://extra.globo.com/noticias/brasil/transito-seguro/confira-alguns-itens-obrigatorios-verificados-durante-vistoria-do-detran-10190355.html\n",
+ "\n",
+ "Essa matéria lista 14 itens que são inspecionados pelo Detran, dentre os quais têm-se: extintor de incêndio deve estar dentro do prazo de validade; pneus devem estar em bom estado de conservação; buzina deve funcionar perfeitamente; e cintos de segurança para todos os ocupantes do carro. \n",
+ "\n",
+ "Se, ao final da inspeção, todos os 14 itens estiverem funcionando perfeitamente, o motorista irá feliz para casa assegurado de que seu carro está sem problemas com a vistoria."
+ ]
+ },
+ {
+ "cell_type": "markdown",
+ "metadata": {},
+ "source": [
+ "\n",
+ "\n",
+ "## Modelo teórico"
+ ]
+ },
+ {
+ "cell_type": "markdown",
+ "metadata": {},
+ "source": [
+ "___\n",
+ "\n",
+ "\n",
+ "\n",
+ "## Teoria: Distribuição Binomial\n",
+ "\n",
+ "A distribuição binomial modela a número de sucessos (o evento de interesse) em uma determinada quantidade de tentativas. Mais formalmente, dizemos que uma variável aleatória $Y$ segue uma distribuição binomial utilizando a seguinte notação: $Y$~$Bin(n,p)$. Essa notação pode ser lida como: $Y$ segue uma distribuição binomial com $n$ tentativas e $p$ como probabilidade de sucesso em cada evento independente.\n",
+ "\n",
+ "A função de probabilidade (lembrando: que associa uma probabilidade a cada valor possível de $Y$) é dada por:\n",
+ "\n",
+ "$$P(Y=y)=\\left(\n",
+ "\\begin{array}{c}\n",
+ " n \\\\\n",
+ " y\n",
+ "\\end{array}\\right) p^y (1-p)^{(n-y)}$$\n",
+ "\n",
+ "Para que um experimento possa ser modelado por uma distribuição binomial, ele precisa ter as seguintes propriedades:\n",
+ "\n",
+ "- ser uma contagem de $n$ repetições (ou tentativas, ou ensaios) idênticas;\n",
+ "- cada repetição tem apenas 2 resultados possíveis: um é denominado sucesso (o resultado de interesse, que não necessariamente é positivo) e o outro, fracasso;\n",
+ "- a probabilidade de sucesso para cada ensaio é denominada $p$ e será constante em cada repetição. Consequentemente, a probabilidade de fracasso $(1-p)$ também não varia de tentativa para tentativa;\n",
+ "- as tentativas são independentes."
+ ]
+ },
+ {
+ "cell_type": "markdown",
+ "metadata": {},
+ "source": [
+ "\n",
+ "\n",
+ "### Esperança e Variância\n",
+ "\n",
+ "Se $Y$~$Bin(n,p)$, o valor esperado $E(Y)$ e a variância $Var(Y)$ são dados por:\n",
+ "\n",
+ "$\\qquad\\qquad E(Y) = np$\n",
+ "\n",
+ "$\\qquad\\qquad Var(Y) = np(1-p)$\n",
+ "\n",
+ "___"
+ ]
+ },
+ {
+ "cell_type": "markdown",
+ "metadata": {},
+ "source": [
+ "\n",
+ "\n",
+ "### EXERCÍCIO 1\n",
+ "\n",
+ "Assuma que a variável **Quantidade de itens vistoriados em não conformidade em 14 itens vistoriados** possa ser ajustada pelo modelo binomial com parâmetros $n=14$ e $p=0,10$. Interprete esses parâmetros para o problema em questão e, ainda, discuta se as propriedades da distribuição binomial estão satisfeitas para o problema aqui me questão."
+ ]
+ },
+ {
+ "cell_type": "raw",
+ "metadata": {},
+ "source": [
+ "PREENCHA COM AS SUAS RESPOSTAS:\n",
+ " \n",
+ "- n = 14: SUBSTITUA ESTE TEXTO PELA SUA INTERPRETAÇÃO DESTE PARÂMETRO\n",
+ "- p = 0,10: SUBSTITUA ESTE TEXTO PELA SUA INTERPRETAÇÃO DESTE PARÂMETRO\n",
+ "\n",
+ "As propriedades da distribuição binomial [estão satisfeitas/não estão satisfeitas] para o problema em questão?\n",
+ "Verifique as propriedades de um ensaio Binomial: \n",
+ "[COMPLETE COM A SUA RESPOSTA]"
+ ]
+ },
+ {
+ "cell_type": "markdown",
+ "metadata": {},
+ "source": [
+ "**Independente da sua resposta anterior, considere que a distribuição binomial seja adequada para modelar a variável de interesse nos próximos exercícios!**\n",
+ "\n",
+ "\n",
+ "\n",
+ "### EXERCÍCIO 2\n",
+ "\n",
+ "\n",
+ "\n",
+ "1. Consulte a [documentação do método `stats.binom.pmf`](https://docs.scipy.org/doc/scipy-0.14.0/reference/generated/scipy.stats.binom.html). Utilizando esse método, obtenha a probabilidade de cada uma das quantidades de itens em não conformidade, ou seja, de 0 a 14, quando $n=14$ e $p=0,10$. Armazene as probabilidades em uma lista (probabilidades de todas as quantidades possíveis, de 0 a 14) e guarde esta lista em uma variável chamada `probabilidades_teoricas`.\n",
+ "1. Calcule o valor esperado e a variância da quantidade de itens em não conformidade utilizando os métodos `stats.binom.mean` e `stats.binom.var` (a documentação está na mesma página do método `stats.binom.pmf`) e compare com a esperança e variância calculados a partir das [fórmulas da distribuição binomial](#esperanca-variancia).\n",
+ "\n",
+ "*Respostas esperadas para esperança e variância respectivamente: 1.4000000000000001 ; 1.2600000000000002*"
+ ]
+ },
+ {
+ "cell_type": "code",
+ "execution_count": 87,
+ "metadata": {},
+ "outputs": [
+ {
+ "name": "stdout",
+ "output_type": "stream",
+ "text": [
+ "1.4000000000000001 1.2600000000000002 1.4000000000000001 1.2600000000000002\n"
+ ]
+ }
+ ],
+ "source": [
+ "# ESCREVA SEU CÓDIGO AQUI\n",
+ "n = 14\n",
+ "p = 0.1\n",
+ "probabilidades_teoricas = []\n",
+ "for i in range(n+1):\n",
+ " probabilidades_teoricas.append(stats.binom.pmf(i, n, p))\n",
+ "esp = stats.binom.mean(n, p)\n",
+ "var = stats.binom.var(n, p)\n",
+ "print(esp, var, n*p, n*p*(1-p))\n"
+ ]
+ },
+ {
+ "cell_type": "markdown",
+ "metadata": {},
+ "source": [
+ "\n",
+ "\n",
+ "## Resultados empíricos"
+ ]
+ },
+ {
+ "cell_type": "markdown",
+ "metadata": {},
+ "source": [
+ "A base de dados `Carros.txt` apresenta, para cada um dos três mil carros de passeio vistoriados, duas informações:\n",
+ "\n",
+ "- **Tipo**: tipo de carro (1: Popular e 2: Não Popular)\n",
+ "- **Quantidade**: quantidade de itens vistoriados em não conformidade (que pode variar de 0 a 14) em 14 itens vistoriados\n",
+ "\n",
+ "Vamos começar carregando a base em um `DataFrame`:"
+ ]
+ },
+ {
+ "cell_type": "code",
+ "execution_count": 88,
+ "metadata": {},
+ "outputs": [
+ {
+ "name": "stdout",
+ "output_type": "stream",
+ "text": [
+ "Esperamos trabalhar no diretório: \n",
+ "c:\\Users\\ribei\\OneDrive\\Área de Trabalho\\cdados\\cdados\n",
+ "\n"
+ ]
+ }
+ ],
+ "source": [
+ "import os\n",
+ "print(f'Esperamos trabalhar no diretório: \\n{os.getcwd()}\\n')"
+ ]
+ },
+ {
+ "cell_type": "code",
+ "execution_count": 89,
+ "metadata": {},
+ "outputs": [
+ {
+ "name": "stdout",
+ "output_type": "stream",
+ "text": [
+ "Parece que o arquivo Carros.txt está na mesma pasta do notebook, yay!\n"
+ ]
+ }
+ ],
+ "source": [
+ "filename = 'Carros.txt'\n",
+ "\n",
+ "if filename in os.listdir():\n",
+ " print(f'Parece que o arquivo {filename} está na mesma pasta do notebook, yay!')\n",
+ " \n",
+ "else:\n",
+ " print(f'Não encontrei o arquivo {filename}')"
+ ]
+ },
+ {
+ "cell_type": "code",
+ "execution_count": 90,
+ "metadata": {},
+ "outputs": [
+ {
+ "data": {
+ "text/html": [
+ "
\n",
+ "\n",
+ "
\n",
+ " \n",
+ "
\n",
+ "
\n",
+ "
Tipo
\n",
+ "
Quantidade
\n",
+ "
\n",
+ " \n",
+ " \n",
+ "
\n",
+ "
1
\n",
+ "
1
\n",
+ "
0
\n",
+ "
\n",
+ "
\n",
+ "
2
\n",
+ "
1
\n",
+ "
2
\n",
+ "
\n",
+ "
\n",
+ "
3
\n",
+ "
1
\n",
+ "
2
\n",
+ "
\n",
+ "
\n",
+ "
4
\n",
+ "
1
\n",
+ "
3
\n",
+ "
\n",
+ "
\n",
+ "
5
\n",
+ "
1
\n",
+ "
1
\n",
+ "
\n",
+ " \n",
+ "
\n",
+ "
"
+ ],
+ "text/plain": [
+ " Tipo Quantidade\n",
+ "1 1 0\n",
+ "2 1 2\n",
+ "3 1 2\n",
+ "4 1 3\n",
+ "5 1 1"
+ ]
+ },
+ "execution_count": 90,
+ "metadata": {},
+ "output_type": "execute_result"
+ }
+ ],
+ "source": [
+ "carros = pd.read_table('Carros.txt', sep=' ')\n",
+ "carros.head()"
+ ]
+ },
+ {
+ "cell_type": "markdown",
+ "metadata": {},
+ "source": [
+ "\n",
+ "\n",
+ "### EXERCÍCIO 3\n",
+ "\n",
+ "Considerando todos os carros, gere uma tabela de frequências relativas da quantidade de itens vistoriados em não conformidade (variável **Quantidade**). Armazene essa tabela em uma variável chamada `frequencias_relativas`. \n",
+ "\n",
+ "**Observação:** utilize o método `.sort_index()` no resultado do `.value_counts()` para corrigir a ordenação."
+ ]
+ },
+ {
+ "cell_type": "code",
+ "execution_count": 91,
+ "metadata": {},
+ "outputs": [
+ {
+ "ename": "KeyError",
+ "evalue": "False",
+ "output_type": "error",
+ "traceback": [
+ "\u001b[1;31m---------------------------------------------------------------------------\u001b[0m",
+ "\u001b[1;31mKeyError\u001b[0m Traceback (most recent call last)",
+ "File \u001b[1;32mc:\\Users\\ribei\\anaconda3\\lib\\site-packages\\pandas\\core\\indexes\\base.py:3653\u001b[0m, in \u001b[0;36mIndex.get_loc\u001b[1;34m(self, key)\u001b[0m\n\u001b[0;32m 3652\u001b[0m \u001b[39mtry\u001b[39;00m:\n\u001b[1;32m-> 3653\u001b[0m \u001b[39mreturn\u001b[39;00m \u001b[39mself\u001b[39;49m\u001b[39m.\u001b[39;49m_engine\u001b[39m.\u001b[39;49mget_loc(casted_key)\n\u001b[0;32m 3654\u001b[0m \u001b[39mexcept\u001b[39;00m \u001b[39mKeyError\u001b[39;00m \u001b[39mas\u001b[39;00m err:\n",
+ "File \u001b[1;32mc:\\Users\\ribei\\anaconda3\\lib\\site-packages\\pandas\\_libs\\index.pyx:147\u001b[0m, in \u001b[0;36mpandas._libs.index.IndexEngine.get_loc\u001b[1;34m()\u001b[0m\n",
+ "File \u001b[1;32mc:\\Users\\ribei\\anaconda3\\lib\\site-packages\\pandas\\_libs\\index.pyx:155\u001b[0m, in \u001b[0;36mpandas._libs.index.IndexEngine.get_loc\u001b[1;34m()\u001b[0m\n",
+ "File \u001b[1;32mpandas\\_libs\\index_class_helper.pxi:70\u001b[0m, in \u001b[0;36mpandas._libs.index.Int64Engine._check_type\u001b[1;34m()\u001b[0m\n",
+ "\u001b[1;31mKeyError\u001b[0m: False",
+ "\nThe above exception was the direct cause of the following exception:\n",
+ "\u001b[1;31mKeyError\u001b[0m Traceback (most recent call last)",
+ "\u001b[1;32mc:\\Users\\ribei\\OneDrive\\Área de Trabalho\\cdados\\cdados\\Aula11_Atividade_ModelosProbabilísticosDiscretos.ipynb Cell 18\u001b[0m line \u001b[0;36m3\n\u001b[0;32m 1\u001b[0m \u001b[39m# ESCREVA O CÓDIGO DA SUA RESPOSTA AQUI\u001b[39;00m\n\u001b[0;32m 2\u001b[0m frequencias_relativas \u001b[39m=\u001b[39m carros\u001b[39m.\u001b[39mvalue_counts(normalize\u001b[39m=\u001b[39m\u001b[39mTrue\u001b[39;00m)\u001b[39m.\u001b[39msort_index()\n\u001b[1;32m----> 3\u001b[0m frequencias_relativas\u001b[39m.\u001b[39;49mloc[\u001b[39m\"\u001b[39;49m\u001b[39mQuantidade\u001b[39;49m\u001b[39m\"\u001b[39;49m \u001b[39m==\u001b[39;49m \u001b[39m0\u001b[39;49m, :]\n",
+ "File \u001b[1;32mc:\\Users\\ribei\\anaconda3\\lib\\site-packages\\pandas\\core\\indexing.py:1097\u001b[0m, in \u001b[0;36m_LocationIndexer.__getitem__\u001b[1;34m(self, key)\u001b[0m\n\u001b[0;32m 1095\u001b[0m \u001b[39mif\u001b[39;00m \u001b[39mself\u001b[39m\u001b[39m.\u001b[39m_is_scalar_access(key):\n\u001b[0;32m 1096\u001b[0m \u001b[39mreturn\u001b[39;00m \u001b[39mself\u001b[39m\u001b[39m.\u001b[39mobj\u001b[39m.\u001b[39m_get_value(\u001b[39m*\u001b[39mkey, takeable\u001b[39m=\u001b[39m\u001b[39mself\u001b[39m\u001b[39m.\u001b[39m_takeable)\n\u001b[1;32m-> 1097\u001b[0m \u001b[39mreturn\u001b[39;00m \u001b[39mself\u001b[39;49m\u001b[39m.\u001b[39;49m_getitem_tuple(key)\n\u001b[0;32m 1098\u001b[0m \u001b[39melse\u001b[39;00m:\n\u001b[0;32m 1099\u001b[0m \u001b[39m# we by definition only have the 0th axis\u001b[39;00m\n\u001b[0;32m 1100\u001b[0m axis \u001b[39m=\u001b[39m \u001b[39mself\u001b[39m\u001b[39m.\u001b[39maxis \u001b[39mor\u001b[39;00m \u001b[39m0\u001b[39m\n",
+ "File \u001b[1;32mc:\\Users\\ribei\\anaconda3\\lib\\site-packages\\pandas\\core\\indexing.py:1280\u001b[0m, in \u001b[0;36m_LocIndexer._getitem_tuple\u001b[1;34m(self, tup)\u001b[0m\n\u001b[0;32m 1278\u001b[0m \u001b[39mwith\u001b[39;00m suppress(IndexingError):\n\u001b[0;32m 1279\u001b[0m tup \u001b[39m=\u001b[39m \u001b[39mself\u001b[39m\u001b[39m.\u001b[39m_expand_ellipsis(tup)\n\u001b[1;32m-> 1280\u001b[0m \u001b[39mreturn\u001b[39;00m \u001b[39mself\u001b[39;49m\u001b[39m.\u001b[39;49m_getitem_lowerdim(tup)\n\u001b[0;32m 1282\u001b[0m \u001b[39m# no multi-index, so validate all of the indexers\u001b[39;00m\n\u001b[0;32m 1283\u001b[0m tup \u001b[39m=\u001b[39m \u001b[39mself\u001b[39m\u001b[39m.\u001b[39m_validate_tuple_indexer(tup)\n",
+ "File \u001b[1;32mc:\\Users\\ribei\\anaconda3\\lib\\site-packages\\pandas\\core\\indexing.py:976\u001b[0m, in \u001b[0;36m_LocationIndexer._getitem_lowerdim\u001b[1;34m(self, tup)\u001b[0m\n\u001b[0;32m 974\u001b[0m \u001b[39m# we may have a nested tuples indexer here\u001b[39;00m\n\u001b[0;32m 975\u001b[0m \u001b[39mif\u001b[39;00m \u001b[39mself\u001b[39m\u001b[39m.\u001b[39m_is_nested_tuple_indexer(tup):\n\u001b[1;32m--> 976\u001b[0m \u001b[39mreturn\u001b[39;00m \u001b[39mself\u001b[39;49m\u001b[39m.\u001b[39;49m_getitem_nested_tuple(tup)\n\u001b[0;32m 978\u001b[0m \u001b[39m# we maybe be using a tuple to represent multiple dimensions here\u001b[39;00m\n\u001b[0;32m 979\u001b[0m ax0 \u001b[39m=\u001b[39m \u001b[39mself\u001b[39m\u001b[39m.\u001b[39mobj\u001b[39m.\u001b[39m_get_axis(\u001b[39m0\u001b[39m)\n",
+ "File \u001b[1;32mc:\\Users\\ribei\\anaconda3\\lib\\site-packages\\pandas\\core\\indexing.py:1048\u001b[0m, in \u001b[0;36m_LocationIndexer._getitem_nested_tuple\u001b[1;34m(self, tup)\u001b[0m\n\u001b[0;32m 1043\u001b[0m \u001b[39mif\u001b[39;00m \u001b[39mall\u001b[39m(is_hashable(x) \u001b[39mor\u001b[39;00m com\u001b[39m.\u001b[39mis_null_slice(x) \u001b[39mfor\u001b[39;00m x \u001b[39min\u001b[39;00m tup):\n\u001b[0;32m 1044\u001b[0m \u001b[39m# GH#10521 Series should reduce MultiIndex dimensions instead of\u001b[39;00m\n\u001b[0;32m 1045\u001b[0m \u001b[39m# DataFrame, IndexingError is not raised when slice(None,None,None)\u001b[39;00m\n\u001b[0;32m 1046\u001b[0m \u001b[39m# with one row.\u001b[39;00m\n\u001b[0;32m 1047\u001b[0m \u001b[39mwith\u001b[39;00m suppress(IndexingError):\n\u001b[1;32m-> 1048\u001b[0m \u001b[39mreturn\u001b[39;00m cast(_LocIndexer, \u001b[39mself\u001b[39;49m)\u001b[39m.\u001b[39;49m_handle_lowerdim_multi_index_axis0(\n\u001b[0;32m 1049\u001b[0m tup\n\u001b[0;32m 1050\u001b[0m )\n\u001b[0;32m 1051\u001b[0m \u001b[39melif\u001b[39;00m \u001b[39misinstance\u001b[39m(\u001b[39mself\u001b[39m\u001b[39m.\u001b[39mobj, ABCSeries) \u001b[39mand\u001b[39;00m \u001b[39many\u001b[39m(\n\u001b[0;32m 1052\u001b[0m \u001b[39misinstance\u001b[39m(k, \u001b[39mtuple\u001b[39m) \u001b[39mfor\u001b[39;00m k \u001b[39min\u001b[39;00m tup\n\u001b[0;32m 1053\u001b[0m ):\n\u001b[1;32m (...)\u001b[0m\n\u001b[0;32m 1057\u001b[0m \u001b[39m# that themselves contain a slice entry\u001b[39;00m\n\u001b[0;32m 1058\u001b[0m \u001b[39m# See test_loc_series_getitem_too_many_dimensions\u001b[39;00m\n\u001b[0;32m 1059\u001b[0m \u001b[39mraise\u001b[39;00m IndexingError(\u001b[39m\"\u001b[39m\u001b[39mToo many indexers\u001b[39m\u001b[39m\"\u001b[39m)\n",
+ "File \u001b[1;32mc:\\Users\\ribei\\anaconda3\\lib\\site-packages\\pandas\\core\\indexing.py:1306\u001b[0m, in \u001b[0;36m_LocIndexer._handle_lowerdim_multi_index_axis0\u001b[1;34m(self, tup)\u001b[0m\n\u001b[0;32m 1302\u001b[0m \u001b[39mexcept\u001b[39;00m \u001b[39mKeyError\u001b[39;00m \u001b[39mas\u001b[39;00m ek:\n\u001b[0;32m 1303\u001b[0m \u001b[39m# raise KeyError if number of indexers match\u001b[39;00m\n\u001b[0;32m 1304\u001b[0m \u001b[39m# else IndexingError will be raised\u001b[39;00m\n\u001b[0;32m 1305\u001b[0m \u001b[39mif\u001b[39;00m \u001b[39mself\u001b[39m\u001b[39m.\u001b[39mndim \u001b[39m<\u001b[39m \u001b[39mlen\u001b[39m(tup) \u001b[39m<\u001b[39m\u001b[39m=\u001b[39m \u001b[39mself\u001b[39m\u001b[39m.\u001b[39mobj\u001b[39m.\u001b[39mindex\u001b[39m.\u001b[39mnlevels:\n\u001b[1;32m-> 1306\u001b[0m \u001b[39mraise\u001b[39;00m ek\n\u001b[0;32m 1307\u001b[0m \u001b[39mraise\u001b[39;00m IndexingError(\u001b[39m\"\u001b[39m\u001b[39mNo label returned\u001b[39m\u001b[39m\"\u001b[39m) \u001b[39mfrom\u001b[39;00m \u001b[39mek\u001b[39;00m\n",
+ "File \u001b[1;32mc:\\Users\\ribei\\anaconda3\\lib\\site-packages\\pandas\\core\\indexing.py:1300\u001b[0m, in \u001b[0;36m_LocIndexer._handle_lowerdim_multi_index_axis0\u001b[1;34m(self, tup)\u001b[0m\n\u001b[0;32m 1297\u001b[0m axis \u001b[39m=\u001b[39m \u001b[39mself\u001b[39m\u001b[39m.\u001b[39maxis \u001b[39mor\u001b[39;00m \u001b[39m0\u001b[39m\n\u001b[0;32m 1298\u001b[0m \u001b[39mtry\u001b[39;00m:\n\u001b[0;32m 1299\u001b[0m \u001b[39m# fast path for series or for tup devoid of slices\u001b[39;00m\n\u001b[1;32m-> 1300\u001b[0m \u001b[39mreturn\u001b[39;00m \u001b[39mself\u001b[39;49m\u001b[39m.\u001b[39;49m_get_label(tup, axis\u001b[39m=\u001b[39;49maxis)\n\u001b[0;32m 1302\u001b[0m \u001b[39mexcept\u001b[39;00m \u001b[39mKeyError\u001b[39;00m \u001b[39mas\u001b[39;00m ek:\n\u001b[0;32m 1303\u001b[0m \u001b[39m# raise KeyError if number of indexers match\u001b[39;00m\n\u001b[0;32m 1304\u001b[0m \u001b[39m# else IndexingError will be raised\u001b[39;00m\n\u001b[0;32m 1305\u001b[0m \u001b[39mif\u001b[39;00m \u001b[39mself\u001b[39m\u001b[39m.\u001b[39mndim \u001b[39m<\u001b[39m \u001b[39mlen\u001b[39m(tup) \u001b[39m<\u001b[39m\u001b[39m=\u001b[39m \u001b[39mself\u001b[39m\u001b[39m.\u001b[39mobj\u001b[39m.\u001b[39mindex\u001b[39m.\u001b[39mnlevels:\n",
+ "File \u001b[1;32mc:\\Users\\ribei\\anaconda3\\lib\\site-packages\\pandas\\core\\indexing.py:1293\u001b[0m, in \u001b[0;36m_LocIndexer._get_label\u001b[1;34m(self, label, axis)\u001b[0m\n\u001b[0;32m 1291\u001b[0m \u001b[39mdef\u001b[39;00m \u001b[39m_get_label\u001b[39m(\u001b[39mself\u001b[39m, label, axis: AxisInt):\n\u001b[0;32m 1292\u001b[0m \u001b[39m# GH#5567 this will fail if the label is not present in the axis.\u001b[39;00m\n\u001b[1;32m-> 1293\u001b[0m \u001b[39mreturn\u001b[39;00m \u001b[39mself\u001b[39;49m\u001b[39m.\u001b[39;49mobj\u001b[39m.\u001b[39;49mxs(label, axis\u001b[39m=\u001b[39;49maxis)\n",
+ "File \u001b[1;32mc:\\Users\\ribei\\anaconda3\\lib\\site-packages\\pandas\\core\\generic.py:4088\u001b[0m, in \u001b[0;36mNDFrame.xs\u001b[1;34m(self, key, axis, level, drop_level)\u001b[0m\n\u001b[0;32m 4085\u001b[0m index \u001b[39m=\u001b[39m \u001b[39mself\u001b[39m\u001b[39m.\u001b[39mindex\n\u001b[0;32m 4087\u001b[0m \u001b[39mif\u001b[39;00m \u001b[39misinstance\u001b[39m(index, MultiIndex):\n\u001b[1;32m-> 4088\u001b[0m loc, new_index \u001b[39m=\u001b[39m index\u001b[39m.\u001b[39;49m_get_loc_level(key, level\u001b[39m=\u001b[39;49m\u001b[39m0\u001b[39;49m)\n\u001b[0;32m 4089\u001b[0m \u001b[39mif\u001b[39;00m \u001b[39mnot\u001b[39;00m drop_level:\n\u001b[0;32m 4090\u001b[0m \u001b[39mif\u001b[39;00m lib\u001b[39m.\u001b[39mis_integer(loc):\n",
+ "File \u001b[1;32mc:\\Users\\ribei\\anaconda3\\lib\\site-packages\\pandas\\core\\indexes\\multi.py:3026\u001b[0m, in \u001b[0;36mMultiIndex._get_loc_level\u001b[1;34m(self, key, level)\u001b[0m\n\u001b[0;32m 3024\u001b[0m \u001b[39mfor\u001b[39;00m i, k \u001b[39min\u001b[39;00m \u001b[39menumerate\u001b[39m(key):\n\u001b[0;32m 3025\u001b[0m \u001b[39mif\u001b[39;00m \u001b[39mnot\u001b[39;00m \u001b[39misinstance\u001b[39m(k, \u001b[39mslice\u001b[39m):\n\u001b[1;32m-> 3026\u001b[0m loc_level \u001b[39m=\u001b[39m \u001b[39mself\u001b[39;49m\u001b[39m.\u001b[39;49m_get_level_indexer(k, level\u001b[39m=\u001b[39;49mi)\n\u001b[0;32m 3027\u001b[0m \u001b[39mif\u001b[39;00m \u001b[39misinstance\u001b[39m(loc_level, \u001b[39mslice\u001b[39m):\n\u001b[0;32m 3028\u001b[0m \u001b[39mif\u001b[39;00m com\u001b[39m.\u001b[39mis_null_slice(loc_level) \u001b[39mor\u001b[39;00m com\u001b[39m.\u001b[39mis_full_slice(\n\u001b[0;32m 3029\u001b[0m loc_level, \u001b[39mlen\u001b[39m(\u001b[39mself\u001b[39m)\n\u001b[0;32m 3030\u001b[0m ):\n\u001b[0;32m 3031\u001b[0m \u001b[39m# everything\u001b[39;00m\n",
+ "File \u001b[1;32mc:\\Users\\ribei\\anaconda3\\lib\\site-packages\\pandas\\core\\indexes\\multi.py:3160\u001b[0m, in \u001b[0;36mMultiIndex._get_level_indexer\u001b[1;34m(self, key, level, indexer)\u001b[0m\n\u001b[0;32m 3157\u001b[0m \u001b[39mreturn\u001b[39;00m \u001b[39mslice\u001b[39m(i, j, step)\n\u001b[0;32m 3159\u001b[0m \u001b[39melse\u001b[39;00m:\n\u001b[1;32m-> 3160\u001b[0m idx \u001b[39m=\u001b[39m \u001b[39mself\u001b[39;49m\u001b[39m.\u001b[39;49m_get_loc_single_level_index(level_index, key)\n\u001b[0;32m 3162\u001b[0m \u001b[39mif\u001b[39;00m level \u001b[39m>\u001b[39m \u001b[39m0\u001b[39m \u001b[39mor\u001b[39;00m \u001b[39mself\u001b[39m\u001b[39m.\u001b[39m_lexsort_depth \u001b[39m==\u001b[39m \u001b[39m0\u001b[39m:\n\u001b[0;32m 3163\u001b[0m \u001b[39m# Desired level is not sorted\u001b[39;00m\n\u001b[0;32m 3164\u001b[0m \u001b[39mif\u001b[39;00m \u001b[39misinstance\u001b[39m(idx, \u001b[39mslice\u001b[39m):\n\u001b[0;32m 3165\u001b[0m \u001b[39m# test_get_loc_partial_timestamp_multiindex\u001b[39;00m\n",
+ "File \u001b[1;32mc:\\Users\\ribei\\anaconda3\\lib\\site-packages\\pandas\\core\\indexes\\multi.py:2752\u001b[0m, in \u001b[0;36mMultiIndex._get_loc_single_level_index\u001b[1;34m(self, level_index, key)\u001b[0m\n\u001b[0;32m 2750\u001b[0m \u001b[39mreturn\u001b[39;00m \u001b[39m-\u001b[39m\u001b[39m1\u001b[39m\n\u001b[0;32m 2751\u001b[0m \u001b[39melse\u001b[39;00m:\n\u001b[1;32m-> 2752\u001b[0m \u001b[39mreturn\u001b[39;00m level_index\u001b[39m.\u001b[39;49mget_loc(key)\n",
+ "File \u001b[1;32mc:\\Users\\ribei\\anaconda3\\lib\\site-packages\\pandas\\core\\indexes\\base.py:3655\u001b[0m, in \u001b[0;36mIndex.get_loc\u001b[1;34m(self, key)\u001b[0m\n\u001b[0;32m 3653\u001b[0m \u001b[39mreturn\u001b[39;00m \u001b[39mself\u001b[39m\u001b[39m.\u001b[39m_engine\u001b[39m.\u001b[39mget_loc(casted_key)\n\u001b[0;32m 3654\u001b[0m \u001b[39mexcept\u001b[39;00m \u001b[39mKeyError\u001b[39;00m \u001b[39mas\u001b[39;00m err:\n\u001b[1;32m-> 3655\u001b[0m \u001b[39mraise\u001b[39;00m \u001b[39mKeyError\u001b[39;00m(key) \u001b[39mfrom\u001b[39;00m \u001b[39merr\u001b[39;00m\n\u001b[0;32m 3656\u001b[0m \u001b[39mexcept\u001b[39;00m \u001b[39mTypeError\u001b[39;00m:\n\u001b[0;32m 3657\u001b[0m \u001b[39m# If we have a listlike key, _check_indexing_error will raise\u001b[39;00m\n\u001b[0;32m 3658\u001b[0m \u001b[39m# InvalidIndexError. Otherwise we fall through and re-raise\u001b[39;00m\n\u001b[0;32m 3659\u001b[0m \u001b[39m# the TypeError.\u001b[39;00m\n\u001b[0;32m 3660\u001b[0m \u001b[39mself\u001b[39m\u001b[39m.\u001b[39m_check_indexing_error(key)\n",
+ "\u001b[1;31mKeyError\u001b[0m: False"
+ ]
+ }
+ ],
+ "source": [
+ "# ESCREVA O CÓDIGO DA SUA RESPOSTA AQUI\n",
+ "frequencias_relativas = carros.value_counts(normalize=True).sort_index()\n",
+ "frequencias_relativas.loc[\"Quantidade\" == 0, :]"
+ ]
+ },
+ {
+ "cell_type": "markdown",
+ "metadata": {},
+ "source": [
+ "\n",
+ "\n",
+ "### EXERCÍCIO 4\n",
+ "\n",
+ "1. **A partir da tabela de frequências relativas**, calcule a média, variância e desvio padrão da quantidade de itens vistoriados em não conformidade. Ou seja, sem utilizar as funções `.mean()`, `.var(ddof=0)` e `std(ddof=0)`. Para isso, será necessário utilizar as fórmulas vistas em aula:\n",
+ "\n",
+ " $\\qquad\\qquad\\overline{y} = \\sum\\limits_y y\\cdot fr_y$\n",
+ "\n",
+ " $\\qquad\\qquad var(y) = \\sum\\limits_y (y-\\overline{y})^2\\cdot fr_y$\n",
+ " \n",
+ " $\\qquad\\qquad dp(y) = \\sqrt{var(y)}$\n",
+ "\n",
+ "sendo $fr_y$ a frequência relativa da quantidade $y$ na amostra.\n",
+ "\n",
+ "1. Compare os resultados com a média, variância populacional e desvio padrão populacional obtidos a partir das funções `.mean()` `.var(ddof=0)` e `.std(ddof=0)`.\n",
+ "\n",
+ "1. Explique sucintamente o que você pode concluir a partir desses valores.\n",
+ "\n",
+ "*Respostas esperadas Média, Variância e Desvio Padrão respectivamente: 1.3713333 ; 1.5794449 ; 1.25675967*"
+ ]
+ },
+ {
+ "cell_type": "code",
+ "execution_count": null,
+ "metadata": {},
+ "outputs": [
+ {
+ "ename": "SyntaxError",
+ "evalue": "incomplete input (1279670733.py, line 4)",
+ "output_type": "error",
+ "traceback": [
+ "\u001b[1;36m Cell \u001b[1;32mIn[67], line 4\u001b[1;36m\u001b[0m\n\u001b[1;33m \u001b[0m\n\u001b[1;37m ^\u001b[0m\n\u001b[1;31mSyntaxError\u001b[0m\u001b[1;31m:\u001b[0m incomplete input\n"
+ ]
+ }
+ ],
+ "source": [
+ "# ESCREVA O CÓDIGO DA SUA RESPOSTA AQUI\n",
+ "media = 0\n",
+ "for i in range(len(frequencias_relativas)):\n",
+ " media += *frequencias_relativas[i]"
+ ]
+ },
+ {
+ "cell_type": "code",
+ "execution_count": null,
+ "metadata": {},
+ "outputs": [],
+ "source": []
+ },
+ {
+ "cell_type": "raw",
+ "metadata": {},
+ "source": [
+ "ESCREVA SUAS CONCLUSÕES AQUI"
+ ]
+ },
+ {
+ "cell_type": "markdown",
+ "metadata": {},
+ "source": [
+ "\n",
+ "\n",
+ "## Comparação: resultados empíricos *vs* modelo teórico\n",
+ "\n",
+ "Vamos comparar as probabilidades teóricas ([exercício 2](#ex2)) com as frequências relativas observadas nos dados ([exercício 4](#ex4)). Para isso, temos, por exemplo, as duas opções gráficas a seguir para verificar se os resultados empíricos se encaixam no modelo teórico proposto. Procure entender pelo menos a ideia do código que gera os gráficos abaixo (pode ser necessário procurar alguma documentação, mas não se preocupe em entender todos os detalhes), eles serão úteis na última questão.\n",
+ "\n",
+ "\n",
+ "\n",
+ "### Opção 1: Frequências relativas *vs* Probabilidades teóricas\n",
+ "\n",
+ "A primeira opção gráfica contrasta a frequência relativa e a probabilidade teórica para uma determinada quantidade de itens em não conformidade. Essa opção contrasta a frequência relativa $fr$ para um valor de $y$ com a probabilidade pontual $P(Y=y)$."
+ ]
+ },
+ {
+ "cell_type": "code",
+ "execution_count": null,
+ "metadata": {},
+ "outputs": [
+ {
+ "data": {
+ "image/png": "",
+ "text/plain": [
+ ""
+ ]
+ },
+ "metadata": {},
+ "output_type": "display_data"
+ }
+ ],
+ "source": [
+ "fr = frequencias_relativas #Calculadas no Exercício 4 - Amostra\n",
+ "pr = probabilidades_teoricas #Calculadas no Exercício 1 - Modelo teórico\n",
+ "\n",
+ "plt.figure(figsize=(10,6))\n",
+ "plt.plot(range(len(fr)), fr, 'o', alpha=0.8)\n",
+ "plt.plot(range(len(pr)), pr, 'D', alpha=0.8)\n",
+ "plt.legend(('Freq.relativa','P(Y=y)'), loc='upper right')\n",
+ "plt.title('Frequência relativa VS Probabilidade teórica')\n",
+ "plt.xlim(-1,15)\n",
+ "plt.show()"
+ ]
+ },
+ {
+ "cell_type": "markdown",
+ "metadata": {},
+ "source": [
+ "\n",
+ "\n",
+ "### Opção 2: Frequência relativa acumulada *vs* Probabilidade acumulada\n",
+ "\n",
+ "A segunda opção gráfica contrasta a frequência relativa acumulada com a probabilidade acumulada até determinada quantidade de itens em não conformidade. Ou seja, compara a frequência relativa acumulada $fra$ até $y$ com a probabilidade acumulada $P(Y\\leq y)$."
+ ]
+ },
+ {
+ "cell_type": "code",
+ "execution_count": null,
+ "metadata": {},
+ "outputs": [
+ {
+ "data": {
+ "image/png": "",
+ "text/plain": [
+ ""
+ ]
+ },
+ "metadata": {},
+ "output_type": "display_data"
+ }
+ ],
+ "source": [
+ "fra = fr.cumsum() #fra contem as frequencias relativas acumuladas calculadas no Exercício 1 - Amostra\n",
+ "n = 14\n",
+ "p = 0.1\n",
+ "fda = stats.binom.cdf(range(n), n=n, p=p) #fda contem as probabilidades acumuladas pelo modelo teorico\n",
+ "\n",
+ "plt.figure(figsize=(10,6))\n",
+ "plt.plot(range(len(fra)), fra, 'o', alpha=0.8)\n",
+ "plt.plot(range(n), fda, 'D', alpha=0.8)\n",
+ "plt.legend(('Freq.rel.acumulada','P(Y<=y)'), loc='lower right')\n",
+ "plt.title('Frequência relativa acumulada VS Probabilidade teórica acumulada')\n",
+ "plt.xlim(-1,15)\n",
+ "plt.show()"
+ ]
+ },
+ {
+ "cell_type": "markdown",
+ "metadata": {},
+ "source": [
+ "\n",
+ "\n",
+ "### EXERCÍCIO 5\n",
+ "\n",
+ "Baseado nos gráficos acima, refine sua conclusão quanto ao uso do modelo teórico para ajustar a variável em questão ([exercício 1](#ex1))."
+ ]
+ },
+ {
+ "cell_type": "raw",
+ "metadata": {},
+ "source": [
+ "ESCREVA SUA RESPOSTA AQUI"
+ ]
+ },
+ {
+ "cell_type": "code",
+ "execution_count": null,
+ "metadata": {},
+ "outputs": [],
+ "source": []
+ },
+ {
+ "cell_type": "markdown",
+ "metadata": {},
+ "source": [
+ "\n",
+ "\n",
+ "### EXERCÍCIO 6\n",
+ "\n",
+ "Na prática, qual a necessidade de um modelo probabilístico já que temos os dados observados?"
+ ]
+ },
+ {
+ "cell_type": "raw",
+ "metadata": {},
+ "source": [
+ "ESCREVA SUA RESPOSTA AQUI"
+ ]
+ },
+ {
+ "cell_type": "code",
+ "execution_count": null,
+ "metadata": {},
+ "outputs": [],
+ "source": []
+ },
+ {
+ "cell_type": "markdown",
+ "metadata": {},
+ "source": [
+ "\n",
+ "\n",
+ "### EXERCÍCIO 7\n",
+ "\n",
+ "Considerando apenas os carros populares, o modelo binomial com parâmetros $n=14$ e $p=0,10$ é adequado para ajustar a variável **Quantidade**? Se sim, justifique; caso não, sugira novos valores para os parâmetros da distribuição para que ela se ajuste aos dados. **Dica**: utilize a [fórmula de $E(Y)$](#esperanca-variancia).\n",
+ "\n",
+ "*Resposta esperada para probabilide de sucesso estimada a partir dos carros populares: 0.13103174603174603*"
+ ]
+ },
+ {
+ "cell_type": "code",
+ "execution_count": null,
+ "metadata": {},
+ "outputs": [],
+ "source": [
+ "# ESCREVA SEU CÓDIGO AQUI"
+ ]
+ },
+ {
+ "cell_type": "code",
+ "execution_count": null,
+ "metadata": {},
+ "outputs": [],
+ "source": []
+ },
+ {
+ "cell_type": "markdown",
+ "metadata": {},
+ "source": [
+ "\n",
+ "\n",
+ "___\n",
+ "\n",
+ "## Lista de comandos utilizados neste notebook\n",
+ "\n",
+ "Os seguintes comandos foram utilizados neste jupyter notebook. Para facilitar sua consulta, escreva um resumo do que cada um deles faz:\n",
+ "\n",
+ "- [`stats.binom.pmf`](#pmf-stats): ESCREVA AQUI O RESUMO\n",
+ "- [`stats.binom.mean`](#pmf-stats): ESCREVA AQUI O RESUMO\n",
+ "- [`stats.binom.var`](#pmf-stats): ESCREVA AQUI O RESUMO\n"
+ ]
+ },
+ {
+ "cell_type": "code",
+ "execution_count": null,
+ "metadata": {},
+ "outputs": [],
+ "source": []
+ }
+ ],
+ "metadata": {
+ "anaconda-cloud": {},
+ "kernelspec": {
+ "display_name": "Python 3",
+ "language": "python",
+ "name": "python3"
+ },
+ "language_info": {
+ "codemirror_mode": {
+ "name": "ipython",
+ "version": 3
+ },
+ "file_extension": ".py",
+ "mimetype": "text/x-python",
+ "name": "python",
+ "nbconvert_exporter": "python",
+ "pygments_lexer": "ipython3",
+ "version": "3.10.13"
+ }
+ },
+ "nbformat": 4,
+ "nbformat_minor": 4
+}
diff --git "a/Aula11_Exercicio_ModelosProbabil\303\255sticosDiscretos.ipynb" "b/Aula11_Exercicio_ModelosProbabil\303\255sticosDiscretos.ipynb"
new file mode 100644
index 0000000..39efa7a
--- /dev/null
+++ "b/Aula11_Exercicio_ModelosProbabil\303\255sticosDiscretos.ipynb"
@@ -0,0 +1,410 @@
+{
+ "cells": [
+ {
+ "cell_type": "markdown",
+ "metadata": {},
+ "source": [
+ "___\n",
+ "# Exercício:
Modelos probabilísticos discretos\n",
+ "___\n",
+ "\n",
+ "## Aula 11"
+ ]
+ },
+ {
+ "cell_type": "markdown",
+ "metadata": {},
+ "source": [
+ "___\n",
+ "\n",
+ "\n",
+ "## Índice\n",
+ "\n",
+ " - [Exercício 1](#ex1) **- APS6 disponível no Blackboard**\n",
+ " - [Exercício 2](#ex2) \n",
+ " - [Exercício 3](#ex3) **- APS6 disponível no Blackboard**\n",
+ " - [Exercício 4](#ex4) \n",
+ " \n",
+ " - [Respostas esperadas](#resps)"
+ ]
+ },
+ {
+ "cell_type": "code",
+ "execution_count": 212,
+ "metadata": {},
+ "outputs": [],
+ "source": [
+ "from scipy import stats #importa apenas as funções de estatísticas da biblioteca SciPy.\n",
+ "\n",
+ "# Importe outras bibliotecas se julgar necessário"
+ ]
+ },
+ {
+ "cell_type": "markdown",
+ "metadata": {},
+ "source": [
+ "___\n",
+ "\n",
+ "\n",
+ "### EXERCÍCIO 1\n",
+ "A mortalidade de microempresas no 1º ano de funcionamento é da ordem de 55%. \n",
+ "Deseja-se avaliar as causas da mortalidade.
\n",
+ "Numa amostra de 10 empresas: \n",
+ "(a) qual á a probabilidade de exatamente 5 terem falido ao final do 1º ano? \n",
+ "(b) qual é a probabilidade de pelo menos 3 virem a falir no 1º ano? \n",
+ "(c) sabe-se que pelo menos 3 faliram no 1º ano, qual é a probabilidade de no máximo 5 terem falido? \n",
+ "(d) qual o número esperado de empresas que irão à falência no 1º ano na amostra? E o desvio padrão? \n"
+ ]
+ },
+ {
+ "cell_type": "code",
+ "execution_count": 213,
+ "metadata": {},
+ "outputs": [
+ {
+ "data": {
+ "text/plain": [
+ "0.23403270759257822"
+ ]
+ },
+ "execution_count": 213,
+ "metadata": {},
+ "output_type": "execute_result"
+ }
+ ],
+ "source": [
+ "# item (a)\n",
+ "# ESCREVA SUA RESPOSTA AQUI\n",
+ "stats.binom.pmf(5, 10, .55)"
+ ]
+ },
+ {
+ "cell_type": "code",
+ "execution_count": 214,
+ "metadata": {},
+ "outputs": [
+ {
+ "data": {
+ "text/plain": [
+ "0.9726081607386718"
+ ]
+ },
+ "execution_count": 214,
+ "metadata": {},
+ "output_type": "execute_result"
+ }
+ ],
+ "source": [
+ "# item (b)\n",
+ "# ESCREVA SUA RESPOSTA AQUI\n",
+ "1 - stats.binom.cdf(2, 10, .55)"
+ ]
+ },
+ {
+ "cell_type": "code",
+ "execution_count": 215,
+ "metadata": {},
+ "outputs": [
+ {
+ "data": {
+ "text/plain": [
+ "0.48138971888756615"
+ ]
+ },
+ "execution_count": 215,
+ "metadata": {},
+ "output_type": "execute_result"
+ }
+ ],
+ "source": [
+ "# item (c)\n",
+ "# ESCREVA SUA RESPOSTA AQUI\n",
+ "((1 - stats.binom.cdf(2, 10, .55)) - (1 - stats.binom.cdf(5, 10, .55)))/(1 - stats.binom.cdf(2, 10, .55))"
+ ]
+ },
+ {
+ "cell_type": "code",
+ "execution_count": 216,
+ "metadata": {},
+ "outputs": [
+ {
+ "name": "stdout",
+ "output_type": "stream",
+ "text": [
+ "5.5 2.4749999999999996\n"
+ ]
+ }
+ ],
+ "source": [
+ "# item (d)\n",
+ "# ESCREVA SUA RESPOSTA AQUI\n",
+ "E = 10*.55\n",
+ "var = 10*.55*(1-0.55)\n",
+ "print(E, var)"
+ ]
+ },
+ {
+ "cell_type": "markdown",
+ "metadata": {},
+ "source": [
+ "[Volte ao Índice](#indice)"
+ ]
+ },
+ {
+ "cell_type": "markdown",
+ "metadata": {},
+ "source": [
+ "
\n",
+ "\n",
+ "### EXERCÍCIO 2\n",
+ "\n",
+ "O número médio de clientes satisfeitos com o atendimento de uma loja, em amostras de 40 clientes escolhidos ao acaso, é de 5,5. \n",
+ "Qual é a probabilidade de, numa amostra de 40 clientes escolhidos ao acaso, encontrarmos pelo menos 2 satisfeitos?\n"
+ ]
+ },
+ {
+ "cell_type": "code",
+ "execution_count": 217,
+ "metadata": {},
+ "outputs": [],
+ "source": [
+ "# ESCREVA SUA RESPOSTA AQUI"
+ ]
+ },
+ {
+ "cell_type": "markdown",
+ "metadata": {},
+ "source": [
+ "[Volte ao Índice](#indice)"
+ ]
+ },
+ {
+ "cell_type": "markdown",
+ "metadata": {},
+ "source": [
+ "\n",
+ "\n",
+ "### EXERCÍCIO 3\n",
+ "\n",
+ "Um supermercado que tem um cartão de fidelidade classifica os clientes em regular e diamante. \n",
+ "Atualmente 70 % dos clientes são regulares. \n",
+ "A direção do supermercado deseja premiar os clientes que, num determinado mês, comprem mais de 1 mil reais. \n",
+ "Sabemos que se o cliente é diamante a probabilidade dele fazer uma compra acima de 1 mil reais é de 75%; já para o cliente regular, essa probabilidade é de 5%.
\n",
+ "\n",
+ "(a) Sorteada uma amostra de 20 clientes diamante, qual é a probabilidade de exatamente 12 fazerem uma compra acima de 1 mil reais? \n",
+ "(b) Sorteados 20 clientes com a mesma classificação ao acaso, qual a probabilidade de exatamente 12 fazerem uma compra acima de 1 mil reais? \n",
+ "(c) Sorteados 20 clientes ao acaso, qual a probabilidade de exatamente 12 fazerem uma compra acima de 1 mil reais? \n",
+ "(d) Um gerente está analisando 200 compras efetuadas em um caixa, dessas 120 foram superiores a 1 mil reais. Dessas compras sob análise, deseja-se sortear uma amostra de 20 compras, sendo que a mesma compra não pode ser sorteada mais de uma vez, qual é a probabilidade de 15 terem sido superiores a 1 mil reais? "
+ ]
+ },
+ {
+ "cell_type": "code",
+ "execution_count": 218,
+ "metadata": {},
+ "outputs": [
+ {
+ "data": {
+ "text/plain": [
+ "0.06088668921620408"
+ ]
+ },
+ "execution_count": 218,
+ "metadata": {},
+ "output_type": "execute_result"
+ }
+ ],
+ "source": [
+ "# item (a)\n",
+ "# ESCREVA SUA RESPOSTA AQUI\n",
+ "stats.binom.pmf(12, 20, 0.75)"
+ ]
+ },
+ {
+ "cell_type": "code",
+ "execution_count": 219,
+ "metadata": {},
+ "outputs": [
+ {
+ "data": {
+ "text/plain": [
+ "0.01826600677914339"
+ ]
+ },
+ "execution_count": 219,
+ "metadata": {},
+ "output_type": "execute_result"
+ }
+ ],
+ "source": [
+ "# item (b)\n",
+ "# ESCREVA SUA RESPOSTA AQUI\n",
+ "stats.binom.pmf(12, 20, 0.75) * 0.3 + stats.binom.pmf(12, 20, 0.05) * 0.7"
+ ]
+ },
+ {
+ "cell_type": "code",
+ "execution_count": 220,
+ "metadata": {},
+ "outputs": [
+ {
+ "data": {
+ "text/plain": [
+ "0.0010809386926081336"
+ ]
+ },
+ "execution_count": 220,
+ "metadata": {},
+ "output_type": "execute_result"
+ }
+ ],
+ "source": [
+ "# item (c)\n",
+ "# ESCREVA SUA RESPOSTA AQUI\n",
+ "stats.binom.pmf(12, 20, 0.75*0.3 + 0.05*0.7)"
+ ]
+ },
+ {
+ "cell_type": "code",
+ "execution_count": 221,
+ "metadata": {},
+ "outputs": [
+ {
+ "data": {
+ "text/plain": [
+ "0.07047763575173921"
+ ]
+ },
+ "execution_count": 221,
+ "metadata": {},
+ "output_type": "execute_result"
+ }
+ ],
+ "source": [
+ "# item (d)\n",
+ "# ESCREVA SUA RESPOSTA AQUI\n",
+ "\n",
+ "Pc1000 = 120/200\n",
+ "stats.binom.pmf(15,120, Pc1000) * stats.binom.pmf(5,80, Pc1000)/stats.binom.pmf(20,200, Pc1000)"
+ ]
+ },
+ {
+ "cell_type": "markdown",
+ "metadata": {},
+ "source": [
+ "[Volte ao Índice](#indice)"
+ ]
+ },
+ {
+ "cell_type": "markdown",
+ "metadata": {},
+ "source": [
+ "
\n",
+ "\n",
+ "### EXERCÍCIO 4\n",
+ "\n",
+ "Um agricultor cultiva laranjas e também produz mudas para vender. \n",
+ "Após alguns meses a muda pode ser atacada por fungos com probabilidade 0,05 e, nesse caso, ela é escolhida para ser recuperada com probabilidade 0,5. \n",
+ "Admita que o processo de recuperação é infalível. O custo de cada muda produzida é R\\\\$ 1,00; acrescido de R\\\\$1,50 se for para o processo de recuperação. \n",
+ "Cada muda é vendida a R\\\\$ 4,00 e são descartadas as mudas que não foram para o processo de recuperação de ataque de fungos. \n",
+ "\n",
+ "Responda: \n",
+ "(a) Qual é a distribuição de probabilidades do lucro (ou seja, pode haver ganho ou prejuízo) por muda produzida pelo agricultor? Justifique claramente todas as contas feitas para obtenção do resultado. \n",
+ "(b) O agricultor seleciona aleatoriamente 3 mudas da sua produção de mudas de laranjas para verificar se houve ataque por fungos após alguns meses. Nesse caso: \n",
+ "(b.1) Qual é a probabilidade dele encontrar pelo menos 2 mudas que foram atacadas por fungos? Justifique claramente todas as contas feitas para obtenção do resultado. \n",
+ "(b.2) Sabendo que o agricultor já encontrou pelo menos 2 mudas que foram atacadas por fungos, qual é a probabilidade de encontrar menos de 3 atacadas por fungos? Justifique claramente todas as contas feitas para obtenção do resultado.\n"
+ ]
+ },
+ {
+ "cell_type": "code",
+ "execution_count": 222,
+ "metadata": {},
+ "outputs": [],
+ "source": [
+ "# item (a)\n",
+ "# ESCREVA SUA RESPOSTA AQUI"
+ ]
+ },
+ {
+ "cell_type": "code",
+ "execution_count": 223,
+ "metadata": {},
+ "outputs": [],
+ "source": [
+ "# item (b.1)\n",
+ "# ESCREVA SUA RESPOSTA AQUI"
+ ]
+ },
+ {
+ "cell_type": "code",
+ "execution_count": 224,
+ "metadata": {},
+ "outputs": [],
+ "source": [
+ "# item (b.2)\n",
+ "# ESCREVA SUA RESPOSTA AQUI"
+ ]
+ },
+ {
+ "cell_type": "markdown",
+ "metadata": {},
+ "source": [
+ "[Volte ao Índice](#indice)"
+ ]
+ },
+ {
+ "cell_type": "markdown",
+ "metadata": {},
+ "source": [
+ "\n",
+ "\n",
+ "## Respostas Esperadas:"
+ ]
+ },
+ {
+ "cell_type": "markdown",
+ "metadata": {},
+ "source": [
+ "#### EXERCÍCIO 2 \n",
+ "*Resposta esperada: p=0,1375. Logo, P(X>=2)=98,02%*"
+ ]
+ },
+ {
+ "cell_type": "markdown",
+ "metadata": {},
+ "source": [
+ "#### EXERCÍCIO 4 \n",
+ "*Respostas esperadas:* \n",
+ "*(a) Considere que X represente o lucro por muda e x, seus respectivos valores* \n",
+ "