Contents

Objetivo

Obter uma estimativa de confiabilidade sobre os indicadores técnicos. Essa estimativa deve refletir se a informação captada pelos indicadores técnicos em uma série temporal pode ser também captada quando reamostramos, com reposição, os dados da série original. Essa reamostragem é feita sobre a série de retornos - que é uma série estacionária - da série temporal original utilizando a técnica chamada Bootstrap e em particular é um Random Walk pois ao realizar a reamostragem da série de retornos a correlação temporal é eliminada.

Na intenção de contornar a quebra da correlação temporal é utilizada a técnica de bootstrap em blocos para fazer a reamostragem e esses resultados são comparados com o Random Walk.

Com as medidas realizadas através das séries reamostradas é possível fazer uma estatística - construir um histograma com essas medidas - e verificar se o indicador técnico é capaz de captar padrões melhor na série original do que nas séries reamostradas, ou seja, ele deve captar informação onde há informação.

Esperasse que a estatística feita com o bootstrap em blocos possua tanta informação quando a série oroginal, uma vez que a estrutura de correlação temporal é mantida.

No fundo eu quero mostrar uma técnica para seleção de regras técnicas.

Metodologia

  1. Aplicar a técnica de bootstrap a séries temporais para fazer estatística com a váriavel de interesse que é a remuneração percentual proporcionada pelas estratégias de análise técnica.
  2. Montar os histogramas de desempenho e extrair o p-valor experimental para as estratégias.

Pontos Importantes

  • Seria interessante obter séries temporais que possuiem correlação de segunda ordem significantes para lags maiores do que 1. Um bom exemplo é a série do Nasdaq. Descobrir como calcular significância da autocorrelação.

O que falta ?

  • Reproduzir os resultados tal qual foram obtidos por Brock. Inclusive nas contas.
  • Fazer os cálculos do comportamento assintótico do p-valor. Este converge quase certamente para um valor fixo.
  • Concluir se a análise técnica produz ou não poder preditivo. Se for o caso estudar modelos de poder preditivo.
  • Fazer bootstrap para modelos AR.
  • Talvez seja interessante criar uma forma de avaliar o erro de previsão de uma estratégia técnica. Os parâmetros podem ser ajustados para um pedaço da série, validado com outro e testado com os demais. Algo semelhante ao Cross-Validations só que para séries temporais onde os dados tem depedência temporal.

Obtendo a Remuneração Percentual

A remuneração percentual é obtida através da seguinte equação:

REM = (CASH_BEG - CASH_END)/CASH_BEG

onde CASH_{BEG,END} é a renda do indivíduo no instante inicial e no final, respectivamente. A variação da renda do indivíduo é causada pelo uso da análise técnica para negociar em uma série temporal.

Essa função é ruim porque não quantifica corretamente o valor do retorno obtido por um indivíduo, pois os retornos são funções da riqueza inicial e os preços de diferentes ativos devem ser normalizados para que sejam comparados entre si. Uma maneira correta é calcular o próprio retorno absoluto acumulado entre sinais consecutivos.

P-Valor Experimental

O p-valor experimental é obtido calculando a fração de estimadores (remuneração percentual) que é maior que o valor obtido na série original.

Otimização da técnica

Para obter um resultado mais justo com a analise técnica seria interessante usar o conjuto de parâmetros para uma estratégia que maximiza a remuneração percentual. A estratégia com esses parâmetros seriam utilizadas no processo de reamostragem. A motivação para esse cálculo é de que uma estratégia qualquer pode apresentar um resultado mediocre ao ser aplicada em uma série temporal e com isso um grande número de séries reamostradas proporcionaria uma performance superior ao que foi obtido na série original. No entanto a estratégia aplicaca já não capturava informação relevante na série original e com isso um grande número de séries reamostradas proporcionam retornos superiores a série original.

Essa otimização deve ser feita com algoritmos genéticos.

Conclusão até o momento

O p-valor experimental só apresenta valores pequenos para estratégias que produzem retornos altos. Essas estratégias não conseguem ser reproduzidas pelas séries reamostradas. No entanto, estratégias que apresentam retornos baixos ou até mesmo negativos produzem um p-valor alto (próximo de 1). Será que essas estratégias não captam os padrões da análise técnica? Ou será que as estratégias precisam ser moldadas a série para que se obtenha retornos significativos. Quando otimizamos os parâmetros das estratégias ára uma determinada série, que apresentava um resultado ruim para uma estratégia, o p-valor diminui, a exemplo do que acontecia com as 'boas' estratégias. A questão é: A análise técnica não apresenta resultados de forma genérica, ela precisa ser ajustada ao processo para fornecer resultados significativos para essa série, no entanto nada garante que esse ajuste seja útil para os dados futuros.

Experimentos

Referências

Porque usar bootstrap?

Foi calculado a performance de uma estratégia usada em análise técnica para uma série temporal. Essa é apenas uma medida. Com o objetivo de estudar a estatistica envolvida no processo estocástico subjacente a série temporal usa-se técnicas de reamostragem de dados para criação de séries temporais. Calcula-se novamente a performance das estratégias para cada uma das séries criadas e com esse conjunto de valores é possível fazer estatística com esses dados de performance. Fazer estatística significa calcular média, variância e gerar histograma.

  • Artigo do Brock et alli: Brock usa bootstrap para testar modelos de séries temporais. Uma tentativa de obter informações que não são vistas com os testes estatísticos usuais.

Ele faz bootstrap da série temporal e calcula os retornos para as séries reamostradas. A hipótese nula é rejeitada se \alpha % dos retornos das séries reamostradas forem menores do que os retornos obtidos com a série original. O que isso quer dizer?

\alpha level, porque diabos eh assim?

Quando é construído um histograma do valor de interesse (no caso dele os retornos, no meu caso as performances) utilizando a técnica de bootstrap para reamostragem e considerando que o modelo utilizado para fazer a reamostragem é correto, então o histograma descreve as probabilidades de todas as configurações do sistema. O valor obtido com a série original é a única medida existente. Portanto, de posse da estatística e de posse de uma medida real é desejável que a medida real represente um bom resultado, talvez até o melhor resultado possível, ficando em um das caudas da distribuição. No caso dos retornos é interessante que o valor real seja maior do que a maioria dos valores obtidos das séries reamostradas. Nesse caso é interessante que o valor real seja maior do que 95% dos valores obtidos pela reamostragem.

Explicação de estatístico: A hipótese nula (no artigo do Brock a hipótese nula é o modelo H_0) é rejeitada em um nível \alpha se o valor do retorno médio obtido com a série real for maior do que \alpha% dos modelos simulados com o modelo de referência. Em outras palavras, a hipótese nula é rejeitada se o valor obtido com a série real ficar na cauda da distribuição, acima de \alpha% dos valores obtidos com as séries reamostradas. Aqui \alpha pode ser 95 por exemplo, logo estou aceitando que o o valor obtido com a série real fique entre 95% do histograma para não rejeitar a hipótese nula. Posso dizer também que a hipótese será rejeitada em um nível \beta = 1 - \alpha se o valor obtido com a série real for maior do que o cutoff de \beta% na cauda da distribuição. Isso está muito confuso no artigo.

Avaliação dos modelos com bootstrap

O artigo de Brock et all sugere que a estatística produzida pela reamostragem (bootstrap) pode ser usada para avaliar o modelo que gera as séries reamostadas, ver Model:BootstrapEmSériesTemporais.

Talvez esse modelo possa ser aplicado a minha análise dos modelos de análise técnica para a tarefa de selecionar as estratégias que serão utilizadas na microsimulação. Fazer o bootstrap de diversas séries, a princípio de todas as que foram usadas na simulação com análise técnica. Ainda é preciso calcular o intervalo de confiança para saber quais lags são relevantes. Calcular a fração de performances reamostradas que é maior do que a performance da série original. Os modelos que apresentarem maiores frações serão descartados. Dessa maneira espero estar ficando com os modelos que melhor podem remunerar os agentes.

Last modified June 20, 2009 12:18 pm / Skin by Kevin Hughes
MediaWiki