Curso pre-congreso: Introducción al manejo de datos y programación en R

Por: Gustavo A. Ballen, Museu de Zoologia da USP. gaballench@gmail.com

Introducción

El análisis de datos siempre ha sido una fase importante de cualquier investigación en ciencias biológicas; sin embargo, en las últimas décadas, se ha convertido en una herramienta poderosa que permite por un lado, tratar de forma eficiente la cada vez mayor cantidad de datos disponibles, y por otro, aplicar nuevas metodologías para abordar una gran diversidad de preguntas científicas. Respondiendo a este interés nace R, un dialecto de libre acceso del lenguaje de programación estadística S, que con el tiempo ha superado herramientas tradicionales basadas en interfaz gráfica pero con una notable carencia de flexibilidad programática, lo que básicamente obliga al usuario a usar lo que los programas traen disponible, sin permitirle expandir o modificar los métodos computacionales usados por los mismos.

La masificación de R ha tenido diversas consecuencias en el quehacer científico, entre estas, fomentar la escritura de códigos computacionales para el análisis de datos, intensificando así la adopción de paradigmas de las ciencias exactas tales como la investigación reproducible y la programación de rutinas de análisis. El notable impacto de R se ha visto poco reflejado en la investigación en América Latina, mientras que en lugares con mayor trayectoria científica, su uso ha sido fácilmente incorporado y fomentado. Se espera que con la masificación del uso de esta herramienta, se optimice la investigación en el continente, haciéndola comparable con aquella realizada en el primer mundo. El potencial de aplicación de R a problemas de investigación ictiológica es tan amplio como las áreas mismas que involucran peces. R ha sido usado de manera efectiva en el estudio de pesquerías, ecología a diversas escalas, sistemática, biología molecular, biogeografía, taxonomía y fisiología. De este modo, el uso eficiente de R promete convertirse en una poderosa herramienta dentro de la investigación ictiológica, más dentro del Neotrópico que presenta la ictiofauna más rica del mundo.

El presente curso no exige un conocimiento previo en programación, escritura de código computacional o habilidades específicas en el uso de computadoras portátiles. Está diseñado para personas con interés en analizar datos para responder preguntas científicas concretas, ya que que ofrece una introducción concisa sobre el potencial de R en la vida del científico, así como una idea acerca de la cantidad de preguntas que se pueden responder usando una adecuada estratégia de análisis de datos. Los asistentes deberán contar con una computadora personal con cualquier sistema operativo (MS Windows, Mac o cualquier distribución linux), que pueda conectarse a la red disponible. Se recomienda que los asistentes tengan a mano conjuntos de datos de su quehacer, así como preguntas de investigación que hayan abordado o que quisieran abordar, con el fin de sacar mayor provecho del curso.

Objetivos

1. Presentar una visión general del dialecto de programación R, su estructura y potencial en el análisis de datos. 2. Proporcionar a los asistentes el conjunto de herramientas básicas para entender la sintaxis del dialecto de programación de R, y poder programar códigos sencillos. 3. Ofrecer una guía teórico-práctica sobre las temáticas presentadas en el curso, para poder aplicar tales conocimientos a problemas de investigación ictiológica.

Contenidos

1. Introducción a R: Breve historia y contexto 2. Variables, operadores, funciones y asignación 3. Paquetes y potencial gráfico 4. Práctica de los temas 1 a 3 5. Estructura de objetos en R 6. Funciones, estructuras de control, e introducción a la simulación 7. Práctica de los temas 5 y 6 8. Aplicaciones de R a problemas de investigación ictiológica: Pesquerías, ecología de comunidades, y paleontología. 9. Consejos sobre scripts informáticos. ¿Cómo obtener ayuda? 10. Práctica del temas 8 y 9

Metodología

Se propone una estrategia teórico-práctica para el presente curso, permitiendo al estudiante obtener una introducción clara y concisa sobre el potencial de R para responder preguntas de investigación de diversa indole, tanto por medio de la presentación de conceptos y ejemplos, como por medio de prácticas guiadas donde se pretende que el estudiante se familiarice con la escritura de código estructurado, limpio y eficiente en R. Se presentará además el paradigma de investigación reproducible como mecanismo para disponibilizar los datos y estrategias de análisis que hacen de una investigación totalmente transparente al escrutinio por parte de la comunidad académica, maximizando el aporte de las investigaciones particulares al desarrollo científico del campo de estudio. Se espera que los primeros cinco contenidos propuestos sean cubiertos en el día I, mientras que los seis restantes sean cubiertos en el día II, balanceando la cantidad de conceptos presentados y de prácticas sobre los mismos.

Requisitos en logística

Cupo: 20 estudiantes Computadores. Cada estudiante debe tener un portátil Proyector: video beam Conexión a internet

Cronograma propuesto

Día I: Temas 1 a 5 Día II: Temas 6 a 11

0 Comentarios

Contesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

*

CONTÁCTANOS

En el momento estamos fuera de línea. Déjanos un mensaje y te responderemos en breve

Enviando

©2019 Acictios Todos los derechos reservados - Desarrollo y diseño:  Asistic

Inicia Sesión con tu Usuario y Contraseña

¿Olvidó sus datos?