Dati La Categorizzazione In Forex Stata
AVVISO: Il gruppo di consulenza Idre statistica sarà la migrazione del sito web per il CMS WordPress nel mese di febbraio per facilitare la manutenzione e la creazione di nuovi contenuti. Alcune delle nostre pagine più vecchie verranno rimossi o archiviati in modo tale che essi non saranno più mantenuti. Cercheremo di mantenere i reindirizzamenti in modo che i vecchi URL continueranno a lavorare nel miglior modo possibile. Benvenuti al Istituto per la ricerca e l'istruzione digitale Aiuto Consulting Group Stat dando un regalo Stata FAQ Come posso ricodificare variabili continue in gruppi Ci possono essere momenti che si desidera convertire una variabile continua in gruppi. Ad esempio, si potrebbe desiderare di convertire un punteggio lettura continua che va da 0 a 100 in 3 gruppi (dici basso, medio e alto). È possibile utilizzare egen con la funzione di taglio () per fare questo rapido e semplice, come illustrato di seguito. Noi illustrare questo con il file di dati hsb2 con una scrittura variabile chiamata che va da 31 a 67. Possiamo usare egen con la funzione di taglio () per fare un writecat variabile chiamata che i gruppi della scrittura variabile nelle seguenti 4 categorie. 30 fino a (ma non inclusa) 40 40 fino a (ma non inclusa) 50 50 fino a (ma non inclusa) 60 60 fino a (ma non inclusa) 70 Il comando seguente tabella viene utilizzato per verificare che i dati sono raggruppati come ci aspettavamo. Possiamo vedere che quando writecat è nella categoria più bassa (30) che scrivere range 31-39, e così via, come ci aspettiamo, per esempio i valori quando writecat è nella categoria 30 corrispondono a scrivere con valori di 30 fino a (ma non compreso) 40. Qui usiamo lo stesso comando, ma la nostra ultima categoria da 50 a 60. Come si vede, si genera un valore mancante perché ci sono una serie di valori che sono 60 o superiore e quindi al di fuori della gamma abbiamo specificato. Questo dimostra che se ci sono valori al di fuori del campo da Lei forniti, quelli sarà assegnato un valore mancante. Se usiamo l'opzione icodes, tagliare () creerà codici interi 0, 1, 2 e così via. Nell'esempio che segue, si può vedere che ha creato i codici 0, 1, 2 e 3. Se si utilizza l'opzione etichetta (che implica automaticamente ICODE), allora si creerà valori interi come sopra, ma sarà anche possibile creare etichette di valore. Come potete vedere qui sotto, il writecat4 variabile viene etichettato 30- 40- 50- 60- e. Usiamo l'opzione nolabel per sopprimere la visualizzazione delle etichette dei valori e si può vedere che la variabile in realtà è codificata 0, 1, 2 e 3. Se si preferisce, si può chiedere tagliare () per scegliere i tagli in modo da formare gruppi con circa lo stesso numero per gruppo. Di seguito si richiede la creazione di 4 (circa) i gruppi di uguali dimensioni. Per ulteriori informazioni, consultare la guida o il manuale di riferimento su Egen. Il contenuto di questo sito web non deve essere interpretata come un'approvazione di un particolare sito web, il libro, o di un prodotto software dalla posizione Menu Università di California. Categorise: posizione Menu: DataCleaning e EncodingCategorise. Questa funzione consente di classificare qualsiasi insieme di dati in gruppi specificati, per esempio età in gruppi di età. In genere, una variabile continua potrebbe essere diviso in categorie o gruppi. Prendere la variabile IgM nella scheda parametrica della cartella di lavoro di prova per esempio questo ha 298 osservazioni che si potrebbe desiderare di riassumere in intervalli di valori. Per fare questo, è sufficiente selezionare la voce di menu DataGroupingCategorise quindi selezionare la colonna IgM dei dati. Si sono presentati con diversi modi di raggruppare i dati in bidoni (intervalli) di conteggi: Quartili: 4 scomparti (lt quartile inferiore, in basso quartile di mediana, mediana al quartile superiore, GT quartile superiore) Quintiles: 5 contenitori (lt prima gt quintile quarto quintile) decili: 10 cassoni (ltfirst decile gtninth decile) gruppi di età: uno dei quattro raggruppamenti comuni (LT15, 15-19 cinque bande annuali a 85 LT15, 15-24 dieci bande annuali a 85 LT1, 1-4 a cinque bande annuali a 85 LT1, 1-4 dieci bande annuali a 75) definita dall'utente: da un minimo di minuti, a intervalli di k passo pari dimensioni (LMin 1 passo, gt min 1 passo per lt min 2 step in intervalli k a GT passo k min ) Utilizzando l'esempio IgM in quartili: un rapido sguardo ai conti mostra un quadro simile a quello che si vedrebbe da un istogramma di cui sopra. vale a dire che i dati non sono uniformemente distribuite in intervalli di valori, vale a dire che non sono allineate. L'istogramma testuale vi darà conta, ma nota che i valori bin in un istogramma sono il punto medio del bidone e non il valore di cut-off tra bidoni, vale a dire che sono gli stessi di un bidone cut definito dall'utente I valori fuori meno la metà della dimensione del passo. Due diverse opzioni vengono presentate per il calcolo quantili per l'utilizzo come punti di taglio in questa funzione di categorizzazione. I metodi sono descritti sotto la pagina di Quantili. Metodo 1 (default) corrisponde al metodo predefinito utilizzato in Stata e metodo 2 è equivalente alla definizione alternativo utilizzato in Stata. Copyright 2000-2016 Stats - direct MMG Limited, tutti i diritti riservati. Scarica una prova gratuita qui.
Comments
Post a Comment