EMPEZANDO EL CURSO-TALLER (12 Marzo 2020)
Descarga la guía para la introducción e instala el R y el RStudio (Guia R curso)
También puedes consultar el documento de Collatón, 2014
ANUNCIO DEL CURSO-TALLER
Primer curso-taller para manipular, preparar y limpiar bases de datos
Santa Cruz del 16 al 20 de Marzo de 2020
Descarga el pdf del anuncio del Curso_Bases de Datos con R
#Segundo dia del curso de Manipulacion y limpieza de bases de datos
#Docente Geovana Carreno Rocabado, PhD.
#Fecha=17 de Marzo 2020
#________________________________________________
# Esta vez vamos a trabajar dentro de un proyecto
# Eso significa que todos lo archivos se guardaran en ese proyecto
# y tambien los objetos e historia de trabajo
#_________________________________________________
#Vamos a files y new project, y buscar el directorio de cursoR
dir()#estamos en la carpeta cursoR
# vamos a cargar los datos de la carpeta datos
setwd(“D:\\CursoR\\datos”)
dir()
a<-read.csv(“encuesta-hogar-cultivos.csv”)
summary(a)## descripcion del objeto
head(a,2)
# esta base tiene los datos generales a nivel de hogar
base<-read.csv(“informacion.gen.csv”)
summary(base)
head(base)
# integrando datos generales al archivo a
names(a)
names(base)
a$casa
base$casa
# union de los cultivos con los datos generales
ar <- merge(a,base,by=”casa”)
head(ar)
names(ar)
#1. LIMPIEMOS DATOS NOMINALES
## correccion de los nombres de cultivos
summary(ar)
levels(ar$cod.cul.tex)# veremos los niveles
ar$cod.cul.tex<-as.character(ar$cod.cul.tex)# vamos a volverlo texto ya no factor
levels(ar$cod.cul.tex)# veremos los niveles
unique(ar$cod.cul.tex)# veremos los niveles
ar$cod.cul.tex[ar$cod.cul.tex==”Forraje / Pasto”]<-“forrage.pasto”
ar$cod.cul.tex[ar$cod.cul.tex==”Forraje / Pasto”]<-“forrage.pasto”
ar$cod.cul.tex[ar$cod.cul.tex==”Vid/Uva”]<-“vid”
ar$cod.cul.tex[ar$cod.cul.tex==”S?samo”]<-“sesamo”
ar$cod.cul.tex[ar$cod.cul.tex==”T<ica”]<-“ticaaaaa”
ar$cod.cul.tex[ar$cod.cul.tex==”Alfa Alfa”]<-“alfa.alfa”
ar$cod.cul.tex[ar$cod.cul.tex==”Ca?a”]<-“cana”
ar$cod.cul.tex[ar$cod.cul.tex==”Wiru Wiru”]<-“wiru”
ar$cod.cul.tex[ar$cod.cul.tex==”Salsa Mora”]<-“Zarzamora”
ar$cod.cul.tex[ar$cod.cul.tex==”Ca?ahua”]<-“caniahua”
ar$cod.cul.tex<- tolower(ar$cod.cul.tex)## todo en minusculas
ar$cod.cul.tex<-as.factor(as.character(ar$cod.cul.tex))# volverlo factor para guardar los cambios
levels(ar$cod.cul.tex)
unique(ar$cod.cul.tex)
### para no modificar la columna podemos crear una copia de la columna de cod.cul.tex
ar$cultivos2<-ar$cod.cul.tex
names(ar)
head(ar)
#___________________
# Vamos a limpiar la columan de unidades de cosecha
levels(ar$unidades.cosecha)
levels(ar$unidad.venta)
# base con nombres de cultivos limpios
#write.csv(ar, “base.L.4.csv”)#guardamos la base
# seguimos otro dia
#names(ar)
## promedio para cosecha
# Jueves 5 septiembre conversion a TN
#ar<-read.csv(“base.L.4.csv”)
names(ar)
#copia de la columna undades.cosecha para estandarizar
levels(ar$unidades.cosecha)
ar$unidades.cosecha1<-ar$unidades.cosecha
levels(ar$unidades.cosecha1)
#volver caractes las unidades
ar$unidades.cosecha1<-as.character(ar$unidades.cosecha1)
# ponerlas todas en minusculas
ar$unidades.cosecha1<- tolower(ar$unidades.cosecha1)
unique(ar$unidades.cosecha1)# para visualizar que todo este en minusculas
###corrigiendo las unidades
ar$unidades.cosecha1[ar$unidades.cosecha1==”@”]<-“arroba”