In aceasta lectie din cursul nostru de Python, ne vom concentra asupra lucrului cu randurile si coloanele din DataFrames si Series.
DataFrames si Series sunt doua dintre cele mai importante structuri de date din biblioteca Pandas a limbajului de programare Python. DataFrames sunt matrici bidimensionale, care permit stocarea si manipularea datelor in mod eficient, in timp ce Series sunt matrici unidimensionale, care permit stocarea si manipularea datelor intr-un mod asemanator.
In aceasta lectie, vom invata cum sa lucram cu randurile si coloanele din DataFrames si Series, cum sa selectam si sa filtram datele, cum sa aplicam functii pe seturi de date si cum sa manipulam structurile de date pentru a raspunde la intrebari specifice.
De exemplu, putem utiliza functia loc
pentru a selecta un set specific de randuri si coloane dintr-un DataFrame, putem utiliza functia iloc
pentru a selecta un set specific de randuri si coloane utilizand indecsi numerici, si putem utiliza functia head
pentru a afisa primele n randuri dintr-un DataFrame.
Pe langa aceste functii, vom explora si alte metode si tehnici pentru a manipula si analiza datele in DataFrames si Series.
In final, prin intermediul acestei lectii, vom intelege cum sa utilizam Pandas pentru a prelucra si analiza datele, pentru a raspunde la intrebari complexe si pentru a lua decizii informate in ceea ce priveste afacerile sau proiectele noastre.
Exemple de lucrul cu randurile si coloanele
Un exemplu de utilizare a functiei loc
pentru a selecta un set specific de randuri si coloane dintr-un DataFrame:
import pandas as pd
# cream un DataFrame cu date de la un magazin online
data = {'produs': ['pantaloni', 'tricou', 'geaca', 'rochie', 'pantofi'],
'culoare': ['albastru', 'rosu', 'negru', 'alb', 'maro'],
'pret': [49.99, 29.99, 89.99, 79.99, 99.99],
'rating': [4.5, 4.2, 4.8, 3.9, 4.1]}
df = pd.DataFrame(data)
# selectam numele produselor si preturile pentru produsele cu rating mai mare sau egal cu 4.5
df.loc[df['rating'] >= 4.5, ['produs', 'pret']]
Un exemplu de utilizare a functiei head
pentru a afisa primele n randuri dintr-un DataFrame:
import pandas as pd
# cream un DataFrame cu date de la un magazin online
data = {'produs': ['pantaloni', 'tricou', 'geaca', 'rochie', 'pantofi'],
'culoare': ['albastru', 'rosu', 'negru', 'alb', 'maro'],
'pret': [49.99, 29.99, 89.99, 79.99, 99.99],
'rating': [4.5, 4.2, 4.8, 3.9, 4.1]}
df = pd.DataFrame(data)
# afisam primele 3 randuri din DataFrame
df.head(3)
Acestea sunt doar cateva exemple de tehnici si functii pe care le putem utiliza pentru a lucra cu randurile si coloanele in DataFrames si Series. Cu toate acestea, prin intermediul acestei lectii, vom intelege cum sa utilizam aceste metode si functii pentru a manipula si analiza datele intr-un mod mai complex si mai eficient.