În această lecție de Python, am învățat cum să primim articole de știri folosind modulul feedparser
. Acest modul ne permite să parsăm feed-uri RSS și Atom de pe diferite site-uri web de știri.
Pentru a începe, trebuie să instalăm modulul feedparser
. Putem face acest lucru folosind pip
, prin rularea comenzii pip install feedparser
în terminal.
După ce am instalat modulul, putem utiliza funcția feedparser.parse()
pentru a parsa un feed RSS sau Atom. Această funcție returnează un obiect care conține detalii despre feed și articolele de știri.
De exemplu, putem utiliza următorul cod pentru a parsa feed-ul RSS de pe site-ul CNN:
import feedparser
# Parse the CNN RSS feed
cnn_feed = feedparser.parse('<http://rss.cnn.com/rss/cnn_topstories.rss>')
# Print the title of the feed
print(cnn_feed['feed']['title'])
# Print the titles of the articles
for article in cnn_feed['entries']:
print(article['title'])
Acest cod va afișa titlul feed-ului și titlurile articolelor de știri de pe CNN.
Putem utiliza modulul feedparser
pentru a primi și a analiza articole de știri de pe orice site web care oferă un feed RSS sau Atom. Acest lucru ne permite să automatizăm procesul de colectare a știrilor și să le integrăm în aplicațiile noastre Python.
În general, modulul feedparser
este un instrument util pentru oricine dorește să primească și să analizeze articole de știri în Python.