diff --git a/content/author/andrea-gomez-vargas/_index.es.md b/content/author/andrea-gomez-vargas/_index.es.md index 7052a0b94b..7c86f86a68 100644 --- a/content/author/andrea-gomez-vargas/_index.es.md +++ b/content/author/andrea-gomez-vargas/_index.es.md @@ -1,6 +1,6 @@ --- name: Andrea Gomez Vargas -link: https://soyandrea.netlify.app/ +link: https://soyandrea.github.io/ bio: INDEC Argentina, R-Ladies Global, Latin-R github: SoyAndrea linkedin: andreasociologa diff --git a/content/author/andrea-gomez-vargas/_index.md b/content/author/andrea-gomez-vargas/_index.md index 7052a0b94b..7c86f86a68 100644 --- a/content/author/andrea-gomez-vargas/_index.md +++ b/content/author/andrea-gomez-vargas/_index.md @@ -1,6 +1,6 @@ --- name: Andrea Gomez Vargas -link: https://soyandrea.netlify.app/ +link: https://soyandrea.github.io/ bio: INDEC Argentina, R-Ladies Global, Latin-R github: SoyAndrea linkedin: andreasociologa diff --git a/content/blog/2025-05-15-puentes-y-comunidades-mi-camino-como-campeona-de-ropensci/arcenso-hex.png b/content/blog/2025-05-15-puentes-y-comunidades-mi-camino-como-campeona-de-ropensci/arcenso-hex.png new file mode 100644 index 0000000000..b0ef2af369 Binary files /dev/null and b/content/blog/2025-05-15-puentes-y-comunidades-mi-camino-como-campeona-de-ropensci/arcenso-hex.png differ diff --git a/content/blog/2025-05-15-puentes-y-comunidades-mi-camino-como-campeona-de-ropensci/arcenso-meet.png b/content/blog/2025-05-15-puentes-y-comunidades-mi-camino-como-campeona-de-ropensci/arcenso-meet.png new file mode 100644 index 0000000000..9d3e5e0c6e Binary files /dev/null and b/content/blog/2025-05-15-puentes-y-comunidades-mi-camino-como-campeona-de-ropensci/arcenso-meet.png differ diff --git a/content/blog/2025-05-15-puentes-y-comunidades-mi-camino-como-campeona-de-ropensci/censos-argentina.png b/content/blog/2025-05-15-puentes-y-comunidades-mi-camino-como-campeona-de-ropensci/censos-argentina.png new file mode 100644 index 0000000000..0a9329ece4 Binary files /dev/null and b/content/blog/2025-05-15-puentes-y-comunidades-mi-camino-como-campeona-de-ropensci/censos-argentina.png differ diff --git a/content/blog/2025-05-15-puentes-y-comunidades-mi-camino-como-campeona-de-ropensci/codehero.png b/content/blog/2025-05-15-puentes-y-comunidades-mi-camino-como-campeona-de-ropensci/codehero.png new file mode 100644 index 0000000000..e4ef2ed52d Binary files /dev/null and b/content/blog/2025-05-15-puentes-y-comunidades-mi-camino-como-campeona-de-ropensci/codehero.png differ diff --git a/content/blog/2025-05-15-puentes-y-comunidades-mi-camino-como-campeona-de-ropensci/comunidades.png b/content/blog/2025-05-15-puentes-y-comunidades-mi-camino-como-campeona-de-ropensci/comunidades.png new file mode 100644 index 0000000000..684e69fa35 Binary files /dev/null and b/content/blog/2025-05-15-puentes-y-comunidades-mi-camino-como-campeona-de-ropensci/comunidades.png differ diff --git a/content/blog/2025-05-15-puentes-y-comunidades-mi-camino-como-campeona-de-ropensci/index.en.md b/content/blog/2025-05-15-puentes-y-comunidades-mi-camino-como-campeona-de-ropensci/index.en.md new file mode 100644 index 0000000000..000eaf57fb --- /dev/null +++ b/content/blog/2025-05-15-puentes-y-comunidades-mi-camino-como-campeona-de-ropensci/index.en.md @@ -0,0 +1,78 @@ +--- +title: Bridges and Communities. My Journey as an rOpenSci Champion +author: +- Andrea Gomez Vargas +date: '2025-05-15' +slug: puentes-comunidades-campeones-ropensci +description: Developing the ARcenso package with rOpenSci and presenting it to R communities +package_version: 0.1.0 +tags: +- champions program +- packages +- community +editor: +- Yanina Bellini Saibene +- Steffi LaZerte +translator: Yanina Bellini Saibene +doi: 10.59350/6ckxv-axw35 +--- + +To be part of the [rOpenSci Champions program](https://champions-program.ropensci.org) has been an experience of **professional growth and an opportunity to contribute to the rOpenSci community**. I learned about R package development while working on a tool to facilitate access to census data from Argentina. + +In this blog, I want to share how this experience *opened new opportunities, connected me with people and communities, and led me to be part of new projects, strengthening my commitment to open access to data*. + +## My project in the program + +From the beginning, my goal was to develop a package in R that would allow structured access to Argentina's census data. The idea arose from the need to have historical information organized and ready to be used in statistical analysis and research projects. My work as a population statistics analyst led me to identify the importance of having a tool that would facilitate the processing of these data. In historical censuses, these data are scattered in different formats (books, PDFs, spreadsheets and REDATAM), which makes it difficult to access and use. + +{{
}} + +During the program, I worked on the organization and standardization of the data, facing challenges such as the structuring of the information (tidy data) and the creation of efficient functions for its manipulation. One of the most enriching aspects of the program were the training sessions provided by rOpenSci (special thanks to [Maëlle](/author/maëlle-salmon/) and [Yani](/author/yanina-bellini-saibene/) for all the patience and learning), and the continuous discussion of projects with the other Champions in the program. + +We participated in virtual trainings on (among other topics) code management, use of efficient packages for the creation of R packages, and automation with GitHub Actions, all with a focus on best practices. In addition, I had the opportunity to benefit from the personalized mentoring of [Luis Verde](/author/luis-verde-arregoitia/) a friend of the LatinR community, who accompanied me throughout the package development process, providing key guidance at each stage. + +## Expectation vs. reality + +{{
}} + +As I progressed in the development of the package, I faced a key challenge: the structure of the data. As I incorporated information from different census years, I realized that each census brought with it thousands of excel files in different formats making automation difficult and making the transformation one by one, which made the standardization task even more complex. +It was then that I decided to invite [*Emanuel Ciardullo*](https://github.com/ECiardullo) to join the project. We formed a duo from our complementary points of view - me from sociology, him from statistics - to face this first phase of the package. This alliance was key to rethinking the approach and sharing the technical and conceptual work. + +My intention was to cover all the census years in the package, but over time I realized that it was going to take more time than I had estimated. It was not only a matter of organizing data, but also of designing a structure that would allow the integration of information in a scalable and reusable way in the future. + +With a volume of work already done and a clearer strategy, we reordered the project outline, defined a roadmap for the different phases of data availability, and then were able to focus on finalizing the data we had already structured. Finally, we put together the documentation and developed the first functions: `get_census()`, `check_repository()` and `arcenso()`. + +## ARcenso + +{{
}} + +In the midst of these reflections and technical challenges, [ARcenso](https://soyandrea.github.io/arcenso/) was born. This project, with the package arcenso, not only seeks to facilitate access to census data, but also to promote its use among researchers, the public sector and citizens in general by means of free software tools. The possibility of contributing with a useful, open and community-oriented tool has been one of the most important motivations of this process. + +The project is in its first stage: you can already install the package using `remotes` and explore the first census years available, 1970 and 1980. The purpose is to continue development so that ARcenso becomes more robust, undergoes [rOpenSci peer review](/software-review/), and eventually become available on CRAN. The Champions Program was the starting point, but development of the package continues because the potential to facilitate access to key data in an open and reusable way is enormous. + +## The community + +### A scholarship, a conference and a global community + +I had the opportunity to receive the scholarship to attend Posit::Conf, one of the most important international conferences in the R ecosystem. It was a transformative experience: I learned a lot, met people I admire and experienced firsthand what it means to be part of a global community that is committed to free software, open access and collaborative development. In addition, it was very special to meet in person with part of the rOpenSci team and other people who are part of this community. The exchange helped me to rethink key aspects of ARcenso, from its structure to its potential to attract open collaboration. I came away with new ideas, inspiration and a network of people to continue growing with. + +{{
}} + +### LatinR + +In November 2024, [we presented ARcenso at LatinR](https://youtu.be/YYfyBrQhMQc?si=lQZMormzo83ImToS), the Latin American conference on the use of R in research and development. Together with Emanuel, we shared the work done during the program and how we worked together to build this first phase of the project. It was a very special moment to show the regional community what we had achieved and to receive their feedback and support during the panel on the Package Development Process. + +### R in Network + +And to close this great 2024, from the organization 'R in Buenos Aires', together with R-Ladies Buenos Aires, we gave a local presentation of the package. As part of the R in Buenos Aires organizing team, I coordinated this activity with the aim of sharing the project with the community, showing what we were building and inviting more people to get to know it. This instance was very good, as not only did I receive valuable feedback from the community, but I was also able to connect with other people who had faced similar problems. We also took the opportunity to spread the word about the rOpenSci Champions Program, in the hope that more people in our region will be encouraged to apply for the next cohort. + +{{
}} + + +Presenting the project and discussing it with the community allowed me to reaffirm the importance of creating accessible and well-documented tools. It was also a reminder that we were not alone in this process: the R community is a space where knowledge is built collectively, and actively participating in it was fundamental to move forward with the package. + +### What remains after the momentum + +Participating in the rOpenSci Champions Program was the starting point to create something I didn't know I could build. It encouraged me to move from using R to developing a package in R, and from the chaos of data to designing a tool meant for other people to work better. But, above all, it connected me with a community that believes in sharing what it knows, in accompanying each other in the process and in opening paths for those who come after. Today ARcenso continues to grow, and so do I: with new ideas, new challenges and the desire to continue building in community and for the community. + + diff --git a/content/blog/2025-05-15-puentes-y-comunidades-mi-camino-como-campeona-de-ropensci/index.es.md b/content/blog/2025-05-15-puentes-y-comunidades-mi-camino-como-campeona-de-ropensci/index.es.md new file mode 100644 index 0000000000..c05e7d91dc --- /dev/null +++ b/content/blog/2025-05-15-puentes-y-comunidades-mi-camino-como-campeona-de-ropensci/index.es.md @@ -0,0 +1,78 @@ +--- +title: 'Puentes y Comunidades. Mi Camino como Campeona de rOpenSci' +author: +- Andrea Gomez Vargas +date: "2025-05-15" +slug: "puentes-comunidades-campeones-ropensci" +description: El desarrollo del paquete ARcenso junto a rOpenSci y su presentación en comunidades de R +package_version: 0.1.0 +tags: +- campeones +- paquetes +- comunidad +editor: +- Yanina Bellini Saibene +doi: "10.59350/6ckxv-axw35" +--- + +Ser parte del [programa de Campeones y Campeonas de rOpenSci](https://champions-program.ropensci.org) ha sido una experiencia de **crecimiento profesional y una oportunidad para contribuir a la comunidad**. Aprendí sobre el desarrollo de paquetes en R mientras trabajaba en una herramienta para facilitar el acceso a datos censales de Argentina. + +En este blog, quiero compartir cómo esta experiencia _abrió nuevas oportunidades, me conectó con personas y comunidades, y me llevó a formar parte de nuevos proyectos, fortaleciendo mi compromiso con el acceso abierto a los datos_. + +## Mi proyecto en el programa + +Desde el inicio, mi objetivo fue desarrollar un paquete en R que permitiera acceder de manera estructurada a los datos censales de Argentina. La idea surgió de la necesidad de contar con información histórica organizada y lista para su uso en análisis estadísticos y proyectos de investigación. Mi trabajo como analista de estadísticas de población me llevó a identificar la importancia de contar con una herramienta que facilitara el tratamiento de estos datos. En los censos históricos, estos datos se encuentran dispersos en distintos formatos (libros, PDFs, excels y REDATAM), lo que dificulta su acceso y utilización. + +{{
}} + +Durante el programa, trabajé en la organización y estandarización de los datos, enfrentándome a desafíos como la estructuración de la información (tidy data) y la creación de funciones eficientes para su manipulación. Uno de los aspectos más enriquecedores del programa fueron las sesiones de entrenamiento proporcionadas por rOpenSci (agradecimiento especial a [Maëlle](/es/author/maëlle-salmon/) y [Yani](/author/yanina-bellini-saibene/) por toda la paciencia y aprendizaje), y el intercambio continuo de proyectos con los demás campeones y campeonas del programa. + +Participamos en capacitaciones virtuales sobre manejo de código, uso de paquetes eficientes para la creación de paquetes en R y la automatización con GitHub Actions, entre otros temas, todo con un enfoque en buenas prácticas. Además, tuve la oportunidad de contar con la mentoría personalizada de [Luis Verde](/author/luis-verde-arregoitia/), amigo de la comunidad LatinR, que me acompañó a lo largo del proceso de desarrollo del paquete, brindando orientación clave en cada etapa. + +## Expectativa vs realidad + + +{{
}} + +Mientras avanzaba en el desarrollo del paquete, me enfrenté a un desafío clave: la estructura de los datos. A medida que incorporaba información de distintos años censales, me di cuenta de que cada censo traía consigo miles de archivos excel en formatos diversos dificultando la automatización y haciendo la transformación uno por uno, lo que hacía aún más compleja la tarea de estandarización. +Fue entonces cuando decidí invitar a [*Emanuel Ciardullo*](https://github.com/ECiardullo) a sumarse al proyecto. Formamos una dupla desde nuestras miradas complementarias —yo desde la sociología, él desde la estadística— para encarar esta primera fase del paquete. Esa alianza fue clave para poder repensar el enfoque y compartir el trabajo técnico y conceptual. + +Mi propósito era abarcar en el paquete todos los años censales pero con el tiempo me di cuenta que me iba a llevar más tiempo de los estimado, me sirvió charlar mucho con amigos y miembros de rOpenSci. No era solo una cuestión de organizar datos, sino de diseñar una estructura que permitiera integrar información de manera escalable y reutilizable en el futuro. + +Con el volumen de trabajo ya realizado y una estrategia más clara, reordenamos el esquema del proyecto, definimos las distintas fases de disponibilidad de los datos, y con los que ya estaban estructurados, pudimos enfocarnos en darles su formato final dentro del paquete, armar la documentación y desarrollar las primeras funciones: `get_census()`, `check_repository()` y `arcenso()`. + + +## ARcenso + + +{{
}} + +En medio de estas reflexiones y desafíos técnicos, nació [ARcenso](https://soyandrea.github.io/arcenso/), el paquete no solo busca facilitar el acceso a los datos censales, sino también fomentar su uso entre investigadores, el sector público y la ciudadanía en general mediante herramientas de software libre. La posibilidad de contribuir con una herramienta útil, abierta y pensada para la comunidad ha sido una de las motivaciones más importantes de este proceso. + +El proyecto se encuentra en su primera etapa: ya podés instalar el paquete utilizando `devtools` y explorar los primeros años censales disponibles, 1970 y 1980. El propósito es seguir trabajando para que ARcenso se vuelva más robusto, atraviese [el proceso de revisión por pares de rOpenSci](/es/software-review/) y, eventualmente, esté disponible en CRAN. El programa de campeones fue el punto de partida, pero el desarrollo del paquete continúa porque el potencial del recurso —para facilitar el acceso a datos clave de manera abierta y reutilizable— es enorme. + +## La comunidad + +### Una beca, una conferencia y una comunidad global + +Tuve la oportunidad de recibir la beca para asistir a la Posit::Conf, una de las conferencias internacionales más importante del ecosistema R. Fue una experiencia transformadora: aprendí muchísimo, conocí a personas que admiro y viví de cerca lo que significa formar parte de una comunidad global que apuesta por el software libre, el acceso abierto y el desarrollo colaborativo. Además, fue muy especial encontrarme en persona con parte del equipo de rOpenSci y otras personas que forman esta comunidad. El intercambio me ayudó a repensar aspectos clave de ARcenso, desde su estructura hasta su potencial de colaboración abierta. Me volví con nuevas ideas, inspiración y una red de personas con quienes seguir creciendo. + +{{
}} + +### LatinR + +Para noviembre, [presentamos ARcenso en LatinR](https://youtu.be/YYfyBrQhMQc?si=lQZMormzo83ImToS), la conferencia latinoamericana sobre el uso de R en investigación y desarrollo. Junto a Emanuel, compartimos el trabajo realizado durante el programa y cómo trabajamos en dupla para construir esta primera fase del proyecto. Fue un momento muy especial para mostrarle a la comunidad regional lo que habíamos logrado y recibir sus comentarios y apoyo en el panel de proceso de desarrollo de paquetes. + + +### R en Red + +Y para cerrar este gran 2024, desde la organización de R en Buenos Aires, en conjunto con R-Ladies Buenos Aires, impulsamos una presentación local del paquete. Como parte del equipo organizador, coordiné esta actividad con el objetivo de compartir el proyecto con la comunidad, mostrar lo que veníamos construyendo e invitar a más personas a conocerlo. Esta instancia fue muy buena, ya que no solo recibí comentarios valiosos de la comunidad, sino que también pude conectar con otras personas que habían enfrentado problemas similares. También aprovechamos la oportunidad para difundir el programa de Campeones y Campeonas de rOpenSci, con la esperanza de que más personas de nuestra región se animen a postular a la próxima cohorte. + +{{
}} + +Presentar el proyecto y discutirlo con la comunidad me permitió reafirmar la importancia de crear herramientas accesibles y bien documentadas. Además, fue un recordatorio de que no estábamos solos en este proceso: la comunidad de R es un espacio donde el conocimiento se construye colectivamente, y participar activamente en ella fue fundamental para seguir adelante con el paquete. + + +### Lo que queda después del impulso + +Participar del programa de Campeones y Campeonas de rOpenSci fue el punto de partida para crear algo que no sabía que podía construir. Me animó a pasar del uso de R al desarrollo de un paquete en R, y del caos de los datos al diseño de una herramienta pensada para que otras personas puedan trabajar mejor. Pero, sobre todo, me conectó con una comunidad que cree en compartir lo que sabe, en acompañarse en el proceso y en abrir caminos para quienes vienen después. Hoy ARcenso sigue creciendo, y yo también: con nuevas ideas, nuevos desafíos y el deseo intacto de seguir construyendo en comunidad y para la comunidad.