Mathematics">
Análise Aplicada A Desempenho
Análise Aplicada A Desempenho
Análise Aplicada A Desempenho
(Aplicada a Análise de
Desempenho)
Profa. Jussara M. Almeida
1o Semestre de 2014
Por quê?
• Modelagem probabilística
• Avaliação dos resultados
– Qual a probabilidade do tempo de residência no disco 1
ser inferior a 0.5 segundo?
• Depende da distribuição de probabilidade do tempo de
residência!!!
– O tempo médio de resposta é uma boa estimativa do
desempenho do sistema?
• Depende da variabilidade de R: variância, desvio padrão
• Caracterização da carga
– Como modelar o tempo entre chegada de requisições no
servidor?
Variável Aleatória
ou
–
• CDF e PMF:
Função de Probabilidade de Massa
• Representação gráfica da PMF
– Seja X o número de visitas que cada requisição
faz ao disco
– p(X): p(0) = 0.25 p(1) = 0.5 p(2) = 0.25
Histograma
• Outra representação gráfica equivalente
– Plota o número de vezes que a saída de um experimento
aleatório foi igual a cada ponto amostral
– Ex: se total de requisições ao servidor = 1000
Variáveis Aleatórias Contínuas
• Pode assumir um número incontável de valores
• Função Densidade de Probabilidade (PDF) f():
• Propriedades:
– f(x) ≥ 0, ∀x
–
• CDF e PDF:
Métricas Simples para
Caracterização de uma
Variável Aleatória
Expectativa
• Valor Esperado de uma VA X
X discreta X contínua
X discreta X contínua
• Bernoulli
• Binomial
• Poisson
• Geométrica
• Zipf
• Várias outras no livro do Ross
Distribuições Discretas
• Bernoulli (p)
– X = {0,1} X = {sucesso, falha}
– p(0) = P(X=0) = 1-p
– p(1) = P(X=1) = p
• Binomial (n, p)
– X = # sucessos em n experimentos independentes,
onde a probabilidade de sucesso em um experimento é p
E(X) = Var(X) = λ
λ = # médio de eventos que ocorrem no período
Distribuições Discretas
• Poisson (λ)
– Muito comumente usado para modelar chegada de sessões
de usuários
• servidores Web, multimídia, banco de dados, ftp, e-mail
– Sessões são iniciadas por usuários
• Chegada de duas sessões tendem a ser independentes:
Poisson é uma boa aproximação
– Contra-exemplo:
• Chegada de requisições em um servidor Web
• Premissa de independência não é válida: existe
dependência entre requisições para o arquivo HTML
e as imagens embutidas nele
Distribuições Discretas
• Geométrica (p)
– Número de experimentos (sucesso/falha) até que um
sucesso ocorra
E(X) = 1/p
Var(X) = (1-p)/p2
C é a constante de normalização
Zipf: lei das Potências
Distribuição Zipf
• Modela popularidade dos remetentes de e-mails
para a UFMG
Distribuições Contínuas
• Uniforme
• Normal
• Exponencial
• Pareto
• LogNormal
µ= valor esperado
σ2 = variância
Distribuições Contínuas
• Exponencial (λ)
– Quantidade de tempo até que determinado evento ocorra
– Tempo entre chegadas de sessões em um servidor
E(X) = 1/ λ
Var(X) = 1/λ2 ⇒ SD(X) = 1/λ ⇒ CV(X) = 1
CV = 1 ⇒ exponencial (aproximação???)
Distribuições Exponencial e Poisson
Processo de
Chegadas
Poisson
• Lognormal (µ, σ)
– Duração de sessões de usuários e de requisições interativas a
vídeo
– Tamanho de e-mails
– Uma VA X é Lognormal (µ, σ) se Y = ln(X) é Normal (µ, σ)
Sumário
• Caracterização de uma VA X
– Média de X
– Variância, desvio padrão, CV
– CDF
– PMF (discreta) ou PDF (contínua)
– Modelo de distribuição e seus parâmetros
– Várias outras
FX,Y(a,b) = F(a)F(b)
pX,Y(a,b) = P(X=a)P(X=b)
E(g(X)h(Y)) = E(g(X))×E(h(Y))
Aplicações de Distribuição Conjunta
• Distribuição multinomial:
p1
fluxo 1
p2
Chegada de fluxo 2
clientes
pm
fluxo m
⎛ n ⎞ n1 n 2 n m
P(X1 = n1 ∩ X 2 = n 2 ∩ ...∩ X m = n m ) = ⎜ ⎟ p1 p2 ...pm
⎝ n1n 2 ...n m ⎠
n!
= p1n1 p2n 2 ...pmnm
n1!n 2!...n m !
Aplicações de Distribuição Conjunta
• Transações no servidor A têm tempo de execução TA ∼ exponencial(λ)
• Transações no servidor B têm tempo de execução TB ∼ exponencial(µ)
• Se duas transações T1 e T2 chegam nos sites A e B, respectivamente,
ao mesmo tempo e são servidas imediatamente, qual a probabilidade de
que T1 termine antes que T2
Funções de Variáveis Aleatórias
Soma de Poissons
• X e Y são VAs independentes, X ∼ Poisson(λ1) e Y ∼ Poisson(λ2)
• Qual a distribuição de Z=X+Y ?
Poisson λ1
Poisson λ2
Poisson λ1 + λ2+…+ λn
Poisson λn
1 2 3 n
Erlang(n,λ)
p = (1-e-λz)
Z tem distribuição
exponencial com
parâmetro λn
Distribuição dos Máximos
• n tarefas independentes : X1, X2, ...., Xn: exponencial (λ)
• Tempo de resposta = tempo de execução da tarefa mais longa
Z = max (X1, X2, ...., Xn)
– Ex: tempo de resposta de máquina de busca composta de n
processadores executando em paralelo. Cada máquina processa
consulta em uma partição do dicionário
Front-end:
atraso desprezível
Distribuição dos Máximos
• n tarefas independentes : X1, X2, ...., Xn: exponencial (λ)
• Tempo de resposta = tempo de execução da tarefa mais longa
Z = max (X1, X2, ...., Xn)
Exercício
Considere um computador paralelo com n processadores.
Sejam X1, X2, ..., Xn, os tempos de falha dos processadores,
cada um exponencialmente distribuído com parâmetro λ.
Qual a distribuição da capacidade de processamento Cn do
computador?
Y1 = min(Xi) ∼ exponencial(nλ)
Exemplo (cont.)
Sejam W1, W2, ..., Wn-j os tempos restantes de processamento
de cada um dos processadores ainda operando depois que j
processadores falharam
Se X ∼ exponencial(λ):
Y = rX ∼ exponencial(λ/r)