in

Cómo usar R en Google Colab

0 UZzcgDlNJpLndIW

GOOGLE COLAB | RSTATS | COMPUTADORA PORTÁTIL

Cómo usar R en Google Colab

Y usa datos de tu Drive y BigQuery

Ed Adityawarman

4 de nov. De 2020·5 min de lectura

Colab o Colaboratory es un cuaderno interactivo proporcionado por Google (principalmente) para escribir y ejecutar Python a través de un navegador. Podemos realizar análisis de datos, crear modelos, evaluar estos modelos en Colab. El procesamiento se realiza en servidores propiedad de Google en la nube. Solo necesitamos un navegador y una conexión a Internet bastante estable.

Colab es una gran herramienta alternativa para facilitar nuestro trabajo, ya sea como estudiante, profesional o investigador.

Aunque Colab se usa principalmente para codificar en Python, aparentemente también podemos usarlo para R (#Rstats).

Esta publicaciónl le indicará cómo ejecutar R en Google Colab y cómo montar Google Drive o acceder a BigQuery en un portátil R.

Hay dos formas de ejecutar R en Colab

  • La primera forma es usar el paquete rpy2 en el tiempo de ejecución de Python. Este método le permite ejecutar la sintaxis de R y Python juntos.
  • La segunda forma es Realmente inicie el portátil en el tiempo de ejecución de R.

Cómo usar R y Python juntos en Colab

  1. Abra su navegador favorito.
  2. Cree un cuaderno nuevo: https://colab.research.google.com/#create=true.
  3. Correr rmagic ejecutando este comando %load_ext rpy2.ipython.
  4. Después de eso, cada vez que desee usar R, agregue %%R al comienzo de cada celda.

Comienzo rmagic ejecutando esto en una celda:

%load_ext rpy2.ipython

Usar %%R ejecutar magia celular. Utilice esto si desea que toda la sintaxis de una celda se ejecute en R. Tenga en cuenta que debe colocarse al principio de la celda.

%%R
x <- seq(0, 2*pi, length.out=50)
x

Estas líneas devolverán una variable Xy mostrarlo en la salida de la celda:

Usar %R ejecutar línea mágica. Use esto si desea que una sola línea en una celda se ejecute en R.

Así es como puede usar esta línea mágica para copiar la variable R a Python:

x = %R x

Cómo usar R en Colab

Para usar el portátil directamente con R:

  1. Abra su navegador favorito.
  2. Vaya a esta URL: https://colab.research.google.com/#create=true&language=r, o esta URL corta https://colab.to/r

Después de acceder a la URL, se le dirigirá a un nuevo cuaderno de Colab con el título predeterminado. Unitled.ipynb.

A primera vista, no hay diferencia entre los portátiles con tiempos de ejecución Python y R. Sin embargo, si vamos a la configuración de “Tiempo de ejecución” y seleccionamos “Cambiar tipo de tiempo de ejecución”, obtendremos un cuadro de diálogo que confirma que ya estamos en tiempo de ejecución de R.

También puede confirmar que está en el tiempo de ejecución de R al intentar montar su unidad en la computadora portátil. Al hacerlo, recibirá un mensaje desafortunado como este:

El mensaje «El montaje de Google Drive solo está disponible en tiempos de ejecución de Python alojados». indica claramente que no está en el tiempo de ejecución de Python.

Felicitaciones, ahora ha ejecutado con éxito R en Colab. Puede verificar la versión R escribiendo R.version.string para imprimir la versión R.

Aquí, ya están disponibles varios paquetes que son útiles para el procesamiento y la visualización de datos. Puedes comprobarlo ejecutando print(installed.packages()).

Si tiene problemas para instalar paquetes, esta publicación podría ayudarlo:

Cómo instalar paquetes en R Google Colab

Algunas limitaciones y cómo superar algunas de ellas

haciadatascience.com

Cómo montar Google Drive en el tiempo de ejecución de Colab R

Esto debería hacerse con bastante facilidad. Solo necesitamos instalar el paquete “googledrive” y realizar el proceso de autenticación.

install.packages("googledrive")
library("googledrive")

Después de instalar el paquete, necesitamos autenticar y autorizar el paquete googledrive. Puede leer la documentación del paquete aquí:

Una interfaz para Google Drive

La mayoría de las funciones comienzan con el prefijo drive_. La finalización automática es tu amiga. El objetivo es permitir un acceso a Drive que se sienta …

googledrive.tidyverse.org

# authorize google drivedrive_auth(
email = gargle::gargle_oauth_email(),
path = NULL,
scopes = "https://www.googleapis.com/auth/drive",
cache = gargle::gargle_oauth_cache(),
use_oob = gargle::gargle_oob_default(),
token = NULL
)

Desafortunadamente, el proceso no se desarrolló sin problemas al intentar autenticarse. En cambio, nos enfrentamos a un mensaje de error como este:

Aparentemente, el error ocurrió porque la función interactiva en httr No se pudo ejecutar el paquete.

Aquí hay una solución alternativa que podemos usar, proporcionada por jobdiogene’s: https://gist.github.com/jobdiogenes/235620928c84e604c6e56211ccf681f0

# Check if is running in Colab and redefine is_interactive()
if (file.exists("/usr/local/lib/python3.6/dist-packages/google/colab/_ipython.py")) {
install.packages("R.utils")
library("R.utils")
library("httr")
my_check <- function() {return(TRUE)}
reassignInPackage("is_interactive", pkgName = "httr", my_check)
options(rlang_interactive=TRUE)
}

Después de ejecutar esas líneas, podemos intentar autenticar Google Drive nuevamente, ¡y ahora funcionará!

drive_auth(use_oob = TRUE, cache = TRUE)

Deberá hacer clic en el enlace y otorgar permiso para que los paquetes accedan a su Google Drive. Después de esto, debería poder obtener el código de autorización para pegarlo en el campo de código.

Cómo usar BigQuery en el tiempo de ejecución de Colab R

Para la gente de negocios o para los investigadores que se sienten más cómodos usando R, tal vez debamos recuperar datos de BigQuery propiedad de la empresa o de conjuntos de datos disponibles públicamente allí.

Ahora que tenemos la solución alternativa, autorizar BigQuery y recuperar datos desde allí sería simple:

install.packages("bigrquery")
library("bigrquery")
bq_auth(use_oob = TRUE, cache = FALSE)

Extrae datos de BigQuery con una consulta personalizada:

# Store the project id
projectid = "your-project-id"
# Set the query
sql <- "SELECT * FROM your_table"
# Run the query
project_query <- bq_project_query(projectid, sql, use_legacy_sql = FALSE)
# Download result to dataframe
df <- bq_table_download(project_query)

Conclusión

Esto es lo que creo que puedo aportar a la comunidad de datos. Como mencioné anteriormente, Google Colab nos brinda una alternativa para aprender o trabajar con R, además de Kaggle y RStudio Cloud. Todas ellas son buenas plataformas, especialmente cuando se utilizan con fines de aprendizaje; puede acortar el tiempo de configuración inicial (descarga e instalación de R e instalación de paquetes). Aunque la forma de usar R en Google Colab es un poco confusa y aún no tiene los mismos servicios que el tiempo de ejecución de Python, al final, todavía funciona bastante bien.

¡Gracias por leer!

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

QE8yLiXHHCgkZAbB9phATP 1200 80

Los mejores precios, ofertas y paquetes de PS4 Pro en septiembre de 2021

Información del generador de escenas JavaFX