Monday 2 September 2019

Renaming all variables in stata forex


Eu tenho uma lista de conjuntos de dados Stata: entre alguns uma variável tor está ausente, e eu quero adicionar essa variável se ele não existe. Os conjuntos de dados contêm uma variável chamada x classe onde x poderia ser qualquer coisa (por exemplo, Aclass. lclass, etc.). Eu gostaria de renomear essas variáveis ​​para dec. Eu quero criar uma variável ajustada que é sim se o nome do arquivo contém ajustado e não se não. Eu acho que seria algo como: Mas então na linguagem Stata adequada. Então eu tenho isso agora, mas não está funcionando, ele não faz nada. Esta não é uma resposta, este é o conselho que não caberá em um comentário. O que você está tentando não é elementar Stata. Se na verdade você não está familiarizado com Stata (não stata) você vai encontrá-lo desafiador para automatizar este processo. Im simpático para você como um novo usuário de Stata - é muito para absorver. E ainda pior se você está sob pressão para produzir alguma produção rapidamente. No entanto, eu gostaria de encorajá-lo a dar um passo para trás de suas tarefas imediatas. Quando comecei a usar Stata de uma maneira séria, comecei lendo meu caminho através do manual Getting Started with Stata, relevante para a minha configuração. O capítulo 18 dá então uma leitura adicional sugerida, muito do que está no Stata Users Guide. E eu trabalhei o meu caminho através de muita dessa leitura também. Há muitos exemplos para copiar e colar no editor de Statas do-file para executar você mesmo, e melhor ainda, experimentar com a mudança das opções para ver como os resultados mudam. Todos esses manuais estão incluídos como PDFs na instalação Stata (desde a versão 11) e são acessíveis a partir do Stata - por exemplo, através da seção Documentação PDF do menu Ajuda do Statas. O objetivo de fazer a leitura não era tanto dominar Stata como ter certeza de me familiarizar com uma grande variedade de técnicas básicas importantes, de modo que, quando chegasse o momento em que eu precisava deles, eu poderia lembrar a sua existência, se não a totalidade sintaxe. A documentação Stata é realmente exemplar - há apenas um monte de it. O caminho que segui as superfícies as coisas que você precisa saber para começar com pressa. Com isso dito, você talvez encontre o comando foreach útil para looping, o comando filelist para obter uma lista de conjuntos de dados Stata (não bancos de dados) eo comando ds para obter uma lista de nomes de variáveis ​​dentro de um conjunto de dados Stata. Mais sutilmente, o comando de captura permitirá que você tente gerar sua variável tor e simplesmente falhará graciosamente se já existir, economizando uma pequena quantidade de lógica de programa. Respondeu Jul 6 at 15:04 A parte do meio pode ser esboçado: Sobre o gerenciamento de listas de arquivos: filelist (SSC) é muito bom também ver fs (SSC) para uma abordagem diferente. EDIT: Aqui está a prova de conceito para o último detalhe: strpos (ltstring1gt, ltstring2gt) retorna um resultado diferente de zero, ou seja, a posição inicial da segunda seqüência no primeiro se o primeiro contém o segundo. Não-zero como um argumento significa verdadeiro em Stata zero significa falso. Veja ajuda strpos () e se desejar ajuda cond (). Não consigo ver seus nomes de arquivo para comentar ou testar seu código, mas um possível problema é que a macro local não está definida no mesmo namespace como aquela em que você está tentando avaliar a expressão. (Isso é o que significa local.) Uma macro que não é definida será avaliada como uma seqüência vazia, com o resultado que você menciona. Respondido Jul 6 at 16:03 gen ajustado cond (strpos (quotfilename39quot, quotadjustedquot), quotyesquot, quotnoquot) sempre gera ajustado não. Mesmo se quotadjustedquot está no nome do arquivo. É strpos () uma função por si só eu can39t parecem ser capazes de usá-lo quando eu tentei isso: if (strpos (quotfilename39quot, quotadjustedquot) true). Então novamente talvez isso não faz sentido. Ndash DuEllier Jul 7 at 11:41 That39s fantasia sintaxe baseada em algum outro idioma. Ver resposta editada para uma resposta. Ndash Nick Cox Jul 7 at 12:37 Corrigido se rc 0 para if rc. Ndash Nick Cox Jul 7 at 23:55 Sua resposta 2017 Stack Exchange, IncIn Stata, Eu tenho um conjunto de variáveis ​​que todos começam com pkg. No seu estado atual, suas terminações são numéricas: pkg1, pkg2, pkg3, pkg4, etc. Eu preciso mudar todas essas variáveis ​​terminações para strings: pkgmz, pkggmz, pkgsp, pkgsptc, etc Tenho uma coluna destes terminais de cordas que Eu posso designar como uma lista local, por exemplo: Minha pergunta é como faço para alterar as terminações numéricas para os fins de seqüência de caracteres. Meu palpite no código segue. O . Indica onde eu estou perplexo: Gostaria de saber se seria melhor utilizar o comando regexr (), mas não posso pensar em uma maneira de incluí-lo. Aprecie qualquer ajuda. Perguntou 3 de dezembro às 2:03 Não é necessário aqui para invocar expressões regulares. Você tem os sufixos novos o prefixo pkg é sempre o mesmo, então o trabalho de extraí-lo repetidamente é desnecessário. O cerne do problema é andar de bicicleta em duas listas ao mesmo tempo. Aqui está uma maneira de corrigir seu código. Note também renomear no Stata 12 pode lidar com este regexr () é uma função, não um comando uma discussão mais geral em stata-journal / sjpdf. htmlarticlenumpr0009 (um pouco fora de data, mas relevante sobre o problema principal) você tem também Muitas aspas no seu comando renomear, por isso não funcionaria. Você disse que o comando renomear no Stata 12 pode lidar com isso. É possível fazê-lo em um único comando renomear eu postei uma resposta com algumas opções usando o novo comando, mas eu couldn39t descobrir se era possível usar uma única chamada. Ndash Michael A Jun 18 15 em 22:26 Michael A É possível fazê-lo com um comando, mas a única resposta que me ocorre não é envolvente. Ainda assim, continua a ser verdade que as pessoas vão gastar minutos tentando pensar em um truque inteligente quando os nomes poderiam ter sido digitados em segundos. (Pkgmz-pkg9) (pkgmz pkggmz pkgsp pkgsptc pkgmil pkgcof pkgsuk pkgtea pkgric) Ndash Nick Cox Jun 19 15 às 11:00 Ben perguntou em um comentário sobre incrementar contadores mantidos em macros locais. Statas macros locais são, em geral, para a realização de strings string caracteres podem ser numéricos, então segurando números é um caso especial, mas naturalmente um muito útil. Este tópico sozinho mostrou vários exemplos. Isso ajuda a manter essa história em mente. Uma sintaxe de longa data é baseada nos formulários O primeiro formulário copia para o macname enquanto o segundo formulário avalia antes de atribuir os resultados ao macname. A principal forma de incrementar contadores era para várias versões agora é permitida. No entanto, embora permitido não funcionará como você pode esperar, embora o que acontece é consistente com a primeira sintaxe para macros. Então, se isso parece um pouco estranho dado o seu plano de fundo, thats compreensível, mas as macros locais foram destinados para processamento de seqüência de caracteres, não aritmética. Mata é muito mais mainstream-like a este respeito. Eu escrevi um tutorial sobre loops e macros em Cox, N. J. 2002. Como enfrentar listas com atitude. Stata Journal 2 (2): 202-222 que é acessível a todos em As de Stata 12, renomear pode lidar com este caso de várias maneiras. Este método cria uma nova macro newcroplist contendo nomes de variáveis ​​pkgmz pkggmz pkgsp pkgsptc pkgmil pkgcof pkgsuk pkgtea pkgric. Em seguida, usa renomear para renomear variáveis ​​seguindo o padrão pkgltdigitsgt para os nomes especificados em newcroplist. Os números seguintes pkg não precisam ser consecutivos. Um segundo método usa a nova função renomear duas vezes como antes, isso não requer números consecutivos nos nomes originais. O primeiro comando renomeia variáveis ​​do padrão pkgltdigitsgt para os nomes especificados no croplist. O segundo comando adiciona o prefixo pkg aos novos nomes de variáveis. Em ambos os casos, e em geral ao usar o comando rename (conhecido como renomear grupo na documentação Statas), o número de nomes de variáveis ​​antigos deve corresponder ao número de novos nomes de variáveis, portanto, certifique-se de que o número de variáveis ​​correspondidas por pkg corresponde O número de novos nomes especificados no croplist. Respondeu Jun 18 15 at 22:20 Sua resposta 2017 Stack Exchange, IncFor perguntas rápidas e-mail dataprinceton. edu. Nenhum appts. Necessário durante horas walk-in. Nota: o laboratório do DSS está aberto desde que o Firestone esteja aberto, sem compromissos necessários para usar os computadores do laboratório para sua própria análise. Dados, conjuntos de dados e variáveis ​​Gerenciamento de dados Configuração de diretório de trabalho, arquivo de log, abertura / salvamento de um arquivo de dados Stata, sistema de codificação de cores Stata, renomeação, recodificação e criação de novas variáveis, droping casos, exclusão de variáveis, mesclar, anexar, freqüências, crosstabulations e estatística descritiva Clique aqui Arquivos de dados Um conjunto de dados é apenas um arquivo no qual as linhas representam observações e as colunas representam variáveis. Por exemplo, uma observação poderia ser um carro, e as variáveis ​​seriam peças de informação sobre o carro, como a marca, comprimento, preço e relação de transmissão: Se os dados já estão no formato de arquivo proprietário Statas, ele terá a Extensão dta. Por exemplo mydata. dta. Os dados nesse formato podem ser lidos diretamente no Stata com o comando use. Se Stata lhe der a mensagem de erro quando você tenta abrir um arquivo de dados, veja aqui para obter informações sobre como corrigir o problema. Stata pode ler conjuntos de dados em vários formatos de texto, bem como no formato proprietário Statas. Muitas vezes você vai começar com dados em formato de texto, lê-lo em Stata, e salvá-lo no formato Stata. Você também pode encontrar dados em vários outros formatos. Por exemplo, os dados de certos arquivos de dados são frequentemente formatados para o pacote estatístico SPSS. Um programa chamado DBMS / Copy. Disponível no laboratório DSS, bem como em máquinas Windows nos clusters públicos OIT, pode converter dados do SPSS e de muitos outros formatos para o formato Stata de forma rápida e fácil. Um formato de texto comum é o arquivo delimitado. Os arquivos delimitados são mais comumente separados por tabulação ou por vírgula. Isso significa apenas que as variáveis ​​em cada observação são inseridas uma após a outra em uma linha e separadas por guias ou vírgulas, enquanto as observações são separadas por retornos rígidos. O exemplo acima é realmente como um arquivo de texto delimitado por vírgulas seria procurar se aberto no Word. A sintaxe de comando para ler em um arquivo delimitado por tabulação ou por vírgulas é: onde filename é o nome do arquivo que contém os dados delimitados por tabulação ou por vírgula. É frequentemente usado para ler planilhas salvas como arquivos csv (delimitados por vírgulas) de um pacote como o Excel. Observe que uma planilha precisa ser colocada em um formulário Stata-friendly antes Stata será capaz de lê-lo adequadamente. Não fazer isso pode causar dores de cabeça. Para obter mais detalhes, consulte Há dois comandos além de insheet - infile e infix - que lêem outros tipos menos comuns de arquivos de texto. Se você tiver dados delimitados por espaço, dados de largura fixa ou encontrar um dicionário de dados Stata. Consulte Você pode usar o comando Stata save para salvar um arquivo no formato Stata: onde filename é o nome do seu arquivo Stata. Por exemplo: irá salvar um arquivo Stata chamado myfile. dta. Este arquivo pode ser lido no Stata com o comando use. Observe que a extensão de arquivo. dta é anexada automaticamente aos arquivos Stata. Você não precisa incluir a extensão de arquivo nos comandos use ou save. Se você já tem um arquivo Stata chamado myfile. dta e deseja salvar uma versão atualizada do arquivo com o mesmo nome, use o comando Stata save com a opção replace, como em: onde filename é o nome do arquivo que você deseja Para substituir, por exemplo Para salvar uma versão atualizada do arquivo ativo, você pode simplesmente digitar: Este comando irá destruir a versão anterior do seu arquivo, então use a opção replace somente se tiver certeza de que não precisará da versão mais antiga do seu arquivo. Não há nenhuma maneira de recuperar seu arquivo original, uma vez que outro arquivo tenha escrito sobre ele. Valores ausentes Às vezes, uma variável está faltando para algumas observações. (Faltando significa que não há valor - a pessoa não respondeu à pergunta da pesquisa, ou os dados não puderam ser adquiridos por algum outro motivo.) No Stata, valores ausentes em variáveis ​​numéricas são representados por um ponto (.). As observações com valores faltantes são deixadas de fora das tabelas produzidas por aba, e também são deixadas de fora das regressões. Eles aparecem como períodos no navegador de dados stata e são representados por pontos em comandos. Os valores de cadeia em falta aparecem como células em branco no browser e são representados nos comandos por duas aspas duplas sem nada entre elas (). O que entendemos por representado em comandos fará mais sentido um pouco mais tarde. Lembre-se que se você estiver salvando dados fora do Excel, os valores ausentes precisam ter sido deixados em branco para Stata para reconhecê-los como ausentes. Tipos de Variáveis ​​Stata Existem dois tipos de variáveis ​​no Stata: numeric e string. Um terceiro tipo, data, é realmente um tipo especial de numérico, como veremos. As variáveis ​​numéricas são simples - contêm números. As variáveis ​​de cadeia contêm texto que pode conter quaisquer caracteres no teclado: letras, números e caracteres especiais. Em auto3, make é uma variável de string - todos os outros são numéricos. Podemos fazer cálculos numéricos e análise estatística em variáveis ​​numéricas - não podemos em variáveis ​​de cadeia. As variáveis ​​de cadeia são geralmente usadas como identificadores para a observação. Uma das variáveis ​​numéricas, date, destina-se a representar uma data - digamos que era a data em que os dados sobre cada carro foram coletados. Em Stata, as datas são números que representam o número de dias desde 1º de janeiro de 1960. Representar datas como números dessa forma nos permite fazer cálculos sobre eles, como medir o tempo entre duas datas. Mas parece estranho e Stata tem uma maneira simples de fazer as variáveis ​​de data parecerem datas: (O comando format tem outros usos, que você pode ver digitando o formato da ajuda.) Você pode usar o comando di juntamente com a função d () Para exibir o valor Stata de qualquer data: Para obter mais informações sobre como Stata processa datas e dados de tempo, consulte Dados de séries de tempo em Stata Variável Convenções de nomenclatura As regras para nomear variáveis ​​em Stata são simples: Stata é sensível a maiúsculas e minúsculas, Letras maiúsculas e minúsculas em nomes de variáveis ​​é uma boa idéia. Eles podem conter no máximo 32 caracteres. Eles podem conter letras, números ou sublinhados (). Espaços ou outros caracteres especiais (como ,,, etc.) não são permitidos. O primeiro caractere deve ser uma letra ou sublinhado, não um número. Iniciar nomes de variáveis ​​com sublinhados é uma idéia muito ruim, uma vez que Statas built-in variáveis ​​começam com um sublinhado. Renomeando variáveis ​​Alterando um nome de variáveis ​​no Stata é fácil com o comando rename: copy 2007 The Trustees of Princeton University. Todos os direitos reservados. Dataprinceton. edu NOTA: A informação é para a Universidade de Princeton. Sinta-se livre para usar a documentação, mas não podemos responder a perguntas fora de Princeton Esta página foi atualizada em:

No comments:

Post a Comment