În această lecție a cursului nostru Python, am învățat despre modul de găsire și selectare a elementelor folosind biblioteca Python BeautifulSoup.
BeautifulSoup este o bibliotecă Python utilizată pentru a extrage date din documente HTML și XML. Această bibliotecă oferă o serie de metode utile pentru a găsi și selecta elementele dintr-un document HTML, inclusiv find()
, find_all()
și select()
.
Pentru a folosi BeautifulSoup, trebuie să instalați biblioteca folosind pip și să importați biblioteca în codul Python. După importarea bibliotecii, puteți folosi metodele de căutare pentru a obține elementele dorite din documentul HTML.
De exemplu, pentru a găsi toate elementele div
dintr-un document HTML, puteți folosi următorul cod:
from bs4 import BeautifulSoup
import requests
url = '<https://www.example.com>'
response = requests.get(url)
soup = BeautifulSoup(response.text, 'html.parser')
divs = soup.find_all('div')
for div in divs:
print(div.text)
În acest exemplu, am folosit metoda find_all()
pentru a găsi toate elementele div
dintr-un document HTML și am iterat prin acestea pentru a afișa textul asociat cu fiecare element.
BeautifulSoup este o bibliotecă puternică și versatilă pentru extragerea datelor din documente HTML și XML în Python. Înțelegerea modului de utilizare a acestei biblioteci poate fi deosebit de utilă în proiectele de web scraping și de analiză a datelor web.