https://www.w3schools.com/html/html_entities.asp
https://www.freeformatter.com/html-escape.html
https://stackoverflow.com/questions/2087370/decode-html-entities-in-python-string
În HTML, există caractere speciale, cum ar fi &, <, >, ", ' , care nu pot fi afișate direct în codul HTML. În schimb, aceste caractere trebuie să fie înlocuite cu entități HTML.
De exemplu, pentru a afișa simbolul mai mare decât (>), trebuie să utilizați entitatea HTML >
.
Există două tipuri de entități HTML:
- Entități predefinite
- Entități numerice
Entități predefinite
Entitățile predefinite sunt cele mai utilizate și sunt deja definite în HTML. Unele exemple de entități predefinite sunt:
<
- simbolul mai mic decât (<)>
- simbolul mai mare decât (>)&
- semnul ampersand (&)"
- ghilimele duble (")'
- apostrof (')
Entități numerice
Entitățile numerice sunt reprezentările numerice ale caracterelelor speciale. Acestea încep cu &#
și se termină cu ;
. De exemplu, entitatea numerică pentru simbolul mai mare decât este >
.
Exemple
Pentru a afișa un titlu care conține un semn mai mare decât, puteți scrie:
<h1>Aceasta este o entitate HTML: ></h1>
Rezultatul va fi:
<h1>Aceasta este o entitate HTML: ></h1>
Pentru a afișa un text care conține un simbol euro, puteți folosi entitatea numerică:
<p>Prețul este de €10.</p>
Rezultatul va fi:
<p>Prețul este de €10.</p>
Lucrând cu entitățile HTML în Python
În Python, puteți folosi biblioteca html
pentru a lucra cu entitățile HTML. Pentru a codifica un șir de caractere în entități HTML, puteți folosi funcția escape
:
import html
text = 'Aceasta este o entitate HTML: >'
html_text = html.escape(text)
print(html_text)
Rezultatul va fi:
Aceasta este o entitate HTML: >
Pentru a decodifica entitățile HTML în șirul de caractere original, puteți folosi funcția unescape
:
import html
html_text = 'Aceasta este o entitate HTML: >'
text = html.unescape(html_text)
print(text)
Rezultatul va fi:
Aceasta este o entitate HTML: >
În concluzie, entitățile HTML sunt utile atunci când trebuie să afișați caractere speciale în codul HTML și pot fi ușor manipulate în Python folosind biblioteca html
.