in

XPath para Python

0k0vKUp3DRKq2BfJ9

Empezando

XPath para Python

Aprenda la expresión regular del web scraping

James Briggs

10 de oct de 2020·7 min de lectura

0*k0vKUp3DRKq2BfJ9

Foto de David Paschke en Unsplash

XEl lenguaje de ruta de aprendizaje automático (XPath) es una herramienta enormemente subestimada en el mundo del web scraping y la automatización. Imagine RegEx, pero para páginas web, eso es XPath.

Cada elemento de una página web está organizado por el Modelo de objetos de documento (DOM). El DOM es una estructura en forma de árbol, donde cada elemento representa un nodo, con rutas a los nodos padre e hijo.

XPath nos ofrece un lenguaje para recorrer rápidamente este árbol. Y, como RegEx, podemos agregar lógica a nuestra selección de nodos para hacer nuestras consultas más poderosas.

En este artículo, cubriremos:

> XPath Essentials
- Testing Our Queries
- The Root
- Paths in XPath
> Navigating the Tree
- Node Indexing
- Extracting XPaths from the Browser
> XPath Logic> Example with Python

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

chica computador telefono 11733

Cómo ver partidos, perfiles y fotos de Tinder Gold gratis y sin pagar – Muy fácil

Redes oracley Talari