← Volver

Cómo obtener todos los enlaces de una página web

El método más sencillo es utilizando Beautiful Soup, una pontente librería para analizar contenido HTML.

from urllib.request import urlopen
from bs4 import BeautifulSoup

r = urlopen("https://www.wikipedia.org/")
bs = BeautifulSoup(r.read(), "html.parser")
r.close()

for link in bs.find_all("a"):
    print(link.get("href"))

Para ejecutar este código primero debe instalarse el módulo bs4.

pip install beautifulsoup4

urllib url beautiful-soup html

🐍 También te puede interesar:

💬 ¿Alguna duda sobre este código? ¡Preguntanos en el foro!

❤️ ¿Te gusta nuestro contenido? ¡Ayudanos a seguir creciendo con una donación!