Programación en R: Análisis de los datos del Titanic de Kaggle

Leer el conjunto de datos del Titanic [codesyntax lang=“php”]train <- read.csv(“C:/[PFAD]/train.csv”, header = TRUE)[/codesyntax] Información sobre la estructura de los datos [codesyntax lang=“php”]str (train)[/codesyntax] Resultado: ’train.frame’: 891 obs. of 11 variables: $ survived: int 0 1 1 1 0 0 0 0 1 1 … $ pclass : int 3 1 3 1 3 3 1 3 3 2 … $ name : Factor w/ 891 levels “Abbing, Mr. Anthony”,..: 109 191 358 277 16 559 520 629 417 581 … $ sex : Factor w/ 2 levels “female”,“male”: 2 1 1 1 2 2 2 2 1 1 … $ age : num 22 38 26 35 35 NA 54 2 27 14 … $ sibsp : int 1 1 0 1 0 0 0 3 0 1 … $ parch : int 0 0 0 0 0 0 0 1 2 0 … $ ticket : Factor w/ 681 levels “110152”,“110413”,..: 524 597 670 50 473 276 86 396 345 133 … $ fare : num 7.25 71.28 7.92 53.1 8.05 … $ cabin : Factor w/ 148 levels “”,“A10”,“A14”,..: 1 83 1 57 1 1 131 1 1 1 … $ embarked: Factor w/ 4 levels “”,“C”,“Q”,“S”: 4 2 4 4 4 3 4 4 4 2 … ...

18 de octubre de 2016 Â· Aaron