Desde las hojas de cálculo a R [No vigente]

Dos mitades de una manzana roja, a la derecha se ve la cascara, a la izquierda se ve la parte de adentro de la manzana.  Foto de Louis Hansel. Foto por Louis Hansel en Unsplash

Actualización: Este es un curso no activo que dimos anteriormente y no está planeado reeditarlo por el momento, aquí dispones de todos los materiales por si quieres enseñarlo.


Índice

Objetivos

Este curso está dirigido a personas que utilizan hojas de cálculo para la manipulación de datos y que nunca han programado, pero que les gustaría aprender a trabajar con R. Por lo tanto, se empieza trabajando con ¿por qué utilizar R? y ¿por dónde empezar?

Proponemos trabajar con R de forma ordenada y reproducible. Por ello, presentamos un flujo de trabajo que permite a quienes realicen este curso aplicar buenas prácticas de programación, trabajar de forma colaborativa y presentar su trabajo en un único documento que incluya el análisis y los resultados.

Siempre que podamos, mencionaremos cómo lo que proponemos resolver con R también puede hacerse con hojas de cálculo y las ventajas y desventajas de cada enfoque.

En cada sección incluimos actividades junto con ejemplos. Queremos que estos ejercicios sean realistas para que cualquiera pueda encontrar similitudes en sus propios datos y pueda aplicar lo aprendido a otras situaciones

¿Para quién?

Este workshop stá dirigido a personas que utilizan hojas de cálculo (Excel, Google sheets) para la manipulación y el análisis de datos, pero que desean aprender a utilizar R. En particular, estamos pensando en:

  • Naomi: Está haciendo un doctorado en genética. Lleva casi diez años analizando datos con Excel. Va a realizar 300 experimentos en los próximos seis meses. No quiere tener que hacer todos los análisis a mano. Y quiere gráficos más bonitos para su tesis que los que puede producir en Excel.

  • Andrea: lleva muchos años trabajando en el análisis de cultivos, rendimientos y precios a partir de los datos que recibe en hojas de cálculo. Se maneja muy bien con Excel y, aunque tiene que empezar cada análisis desde cero y necesita copiar las tablas y los gráficos a Word para los informes que tiene que elaborar, tiene mucha práctica. Escuchó hablar de R y piensa que puede ser útil para automatizar su flujo de trabajo, pero al mismo tiempo es un reto cambiar la forma en que siempre han estado trabajando.

  • Rodrigo: trabaja con datos en Google Sheets, porque edita los archivos con otras personas. No tiene tanta experiencia y a menudo comete errores que le obligan a volver a empezar el análisis. Al mismo tiempo tiene miedo de perder los datos originales y acaba descargando y guardando en disco muchas versiones del mismo archivo. Quiere aprender a programar pero no sabe si empezar a usar R o Python y si podrá resolver los problemas que tiene con Google Sheets con alguna de estas herramientas.

Mira nuestras personas tipo para leer más detalles.

Duración

El taller tiene una duración de 3 horas con dos intervalos (preferentemente lejos de pantallas) de aproximadamente 5 minutos cada uno.

Cronograma tentativo

Duration (min) Actividad
-5 Tiempo previo para conectarse y asegurarse que anda bien tu conexión de audio y video (si no tenés una cámara no importa, pero ayuda si tenés una)
55 Introducción, reportes y flujo de trabajo
5 Corte
55 Leyendo datos y graficando
5 Corte
30 Manipulación de datos
20 Informando tu trabajo con reportes
10 Preguntas y respuestas, feedback and despedida

Capítulo 1 - Introducción y reportes

  • ¿Por qué?
  • ¿Cómo vamos a trabajar?
  • RMarkdown: texto markdown y código de R

Capítulo 2 - Leyendo datos

  • Sobre Palmer Penguins
  • Leyendo archivos csv
  • Leyendo archivos xls

Capítulo 3 - Graficando

  • Primera capa: el área de gráfico
  • Segunda capa: geometrías
  • Agregando geometrías
  • Hablemos de como se ve el gráfico

Capítulo 4 - Manipulación de datos

  • Creando tablas de resumen
  • Formateo de tablas
  • Creando nuevas variables
  • Filtrando datos

Capítulo 5 - Informando tu trabajo con reportes

  • Control de código
  • Automatización

Materiales del curso

Este curso es parte de la serie de Research Software Engineering con R.

¡Servite sin culpa!

Nuestros materiales están disponibles en forma gratuita bajo esta licencia. Es decir, puedes reusar o editar cualquier material que aparece acá, lo único que pedimos a cambio es que cuando tomes material de acá incluyas una referencia a esta página web.

Paola Corrales
Paola Corrales
Coordinación
Siguiente
Anterior