🐼 Pandas क्या है?
Pandas एक Python की लाइब्रेरी है जिसका इस्तेमाल हम डेटा को पढ़ने, समझने, और एनालाइज करने के लिए करते हैं।
🔹 इसे क्यों इस्तेमाल करते हैं?
- टेबल की तरह डेटा (rows & columns) को मैनेज करने के लिए
- Excel या CSV फाइल को पढ़ने और लिखने के लिए
- डेटा को फिल्टर, sort, modify करने के लिए
- बड़े डेटा को आसानी से समझने के लिए
📌 Pandas कैसे इंस्टॉल करें?
pip install pandas
📘 DataFrame Method क्या है? (In Hindi)
🔹 DataFrame क्या होता है?
Pandas में DataFrame एक 2D (two-dimensional) डेटा स्ट्रक्चर होता है जो rows और columns में डेटा को स्टोर करता है — ठीक उसी तरह जैसे एक Excel शीट।
🔹 DataFrame Methods क्या होते हैं?
DataFrame Methods वे functions होते हैं जो Pandas DataFrame पर काम करते हैं और हमें डेटा को analyze, modify, या summarize करने में मदद करते हैं।
🔝 Top Pandas DataFrame Methods (with Hindi Explanation):
Method | क्या करता है? (Description in Hindi) |
---|---|
head() | शुरू की कुछ rows दिखाता है |
tail() | आखिरी की कुछ rows दिखाता है |
info() | DataFrame की summary देता है (datatype, nulls आदि) |
describe() | Numerical डेटा की summary देता है (mean, std, आदि) |
shape | DataFrame की shape देता है (rows, columns) |
columns | सभी column के नाम दिखाता है |
dtypes | सभी columns के data types बताता है |
isnull() | Null (missing) values को check करता है |
drop() | row या column को हटाता है |
fillna() | Missing values को fill करता है |
sort_values() | डेटा को किसी column के अनुसार sort करता है |
groupby() | डेटा को एक group के आधार पर summarize करता है |
apply() | Custom function apply करने के लिए |
🔢 Python Code:
import pandas as pd
data = {'नाम': ['राज', 'सिमा', 'अजय'],
'उम्र': [25, 30, 28]}
df = pd.DataFrame(data)
print(df.head())
print(df.info())
print(df.describe())
🧠 Step-by-step Explanation in Hindi:
🔹 import pandas as pd
यह लाइन Pandas लाइब्रेरी को pd
नाम से import कर रही है। Pandas एक powerful Python लाइब्रेरी है जो डेटा एनालिसिस और डेटा हैंडलिंग के लिए इस्तेमाल होती है।
🔹 data = {'नाम': ['राज', 'सिमा', 'अजय'], 'उम्र': [25, 30, 28]}
यहाँ एक dictionary बनाया गया है, जिसमें दो keys हैं:
'नाम'
→ इसमें तीन नाम हैं: “राज”, “सिमा”, “अजय”'उम्र'
→ इनके age values हैं: 25, 30, 28
🔹 df = pd.DataFrame(data)
यह dictionary को DataFrame में convert करता है। अब df
एक table की तरह होगा जिसमें दो कॉलम होंगे: नाम
और उम्र
।
🔹 print(df.head())
यह DataFrame की शुरुआत की पहली 5 rows को print करेगा। चूँकि हमारे पास केवल 3 rows हैं, इसलिए वही तीन rows दिखेंगी।
🖨️ Output:
नाम उम्र
0 राज 25
1 सिमा 30
2 अजय 28
🔹 print(df.info())
यह method DataFrame की summary जानकारी दिखाता है जैसे:
- कितनी rows और columns हैं,
- कौन से कॉलम हैं,
- datatype क्या है,
- null values कितनी हैं।
🖨️ Output Example:
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 3 entries, 0 to 2
Data columns (total 2 columns):
# Column Non-Null Count Dtype
--- ------ -------------- -----
0 नाम 3 non-null object
1 उम्र 3 non-null int64
dtypes: int64(1), object(1)
memory usage: 176.0 bytes
🔹 print(df.describe())
यह numerical column (यहाँ ‘उम्र’) का statistical summary देगा जैसे:
- count (कितने rows),
- mean (average),
- std (standard deviation),
- min, max, 25%, 50%, 75% percentile values।
🖨️ Output Example:
उम्र
count 3.000000
mean 27.666667
std 2.516611
min 25.000000
25% 26.500000
50% 28.000000
75% 29.000000
max 30.000000
✨ Pandas से आप क्या-क्या कर सकते हो?
काम | Pandas से कैसे? |
---|---|
CSV फाइल पढ़ना | pd.read_csv('file.csv') |
Excel फाइल पढ़ना | pd.read_excel('file.xlsx') |
डेटा को sort करना | df.sort_values('column') |
खाली वैल्यू हटाना | df.dropna() |
किसी कॉलम का औसत निकालना | df['marks'].mean() |
अगर आप चाहो, तो मैं इसके ऊपर PDF नोट्स, quiz, या practice questions भी बना सकता हूँ। बोलो बस 😊
📘 DataFrame Methods in Pandas (हिंदी में)
🔸 1. head()
क्या करता है? – DataFrame के शुरू के 5 rows दिखाता है।
import pandas as pd
df = pd.DataFrame({'नाम': ['राज', 'सीमा', 'अजय'], 'उम्र': [25, 30, 28]})
print(df.head())
🔸 2. tail()
क्या करता है? – DataFrame के आखिरी 5 rows दिखाता है।
print(df.tail())
🔸 3. info()
क्या करता है? – DataFrame की बेसिक जानकारी देता है (columns, datatype, null values आदि)।
print(df.info())
🔸 4. describe()
क्या करता है? – DataFrame में numerical डेटा का statistical summary देता है।
print(df.describe())
🔸 5. shape
क्या करता है? – Rows और Columns की संख्या देता है (Tuple में)।
print(df.shape) # (3, 2)
🔸 6. columns
क्या करता है? – सभी column के नाम देता है।
print(df.columns)
🔸 7. dtypes
क्या करता है? – हर कॉलम का डेटा टाइप दिखाता है।
print(df.dtypes)
🔸 8. isnull()
क्या करता है? – कौन सी जगह null (missing) value है, वो बताएगा।
print(df.isnull())
🔸 9. dropna()
क्या करता है? – null वाले rows को हटा देता है।
df_cleaned = df.dropna()
🔸 10. fillna()
क्या करता है? – null values को किसी value से भर देता है।
df_filled = df.fillna(0)
🔸 11. rename()
क्या करता है? – Columns या index के नाम बदलने के लिए।
df_renamed = df.rename(columns={'नाम': 'Name'})
🔸 12. sort_values()
क्या करता है? – किसी column के अनुसार rows को sort करता है।
df_sorted = df.sort_values('उम्र')
🔸 13. value_counts()
क्या करता है? – किसी column में unique values की गिनती।
print(df['उम्र'].value_counts())
🔸 14. drop()
क्या करता है? – किसी row या column को हटाने के लिए।
df_dropped = df.drop('उम्र', axis=1)
🔸 15. loc[]
और iloc[]
क्या करता है? – rows/columns को select करने के लिए।
print(df.loc[0]) # नाम से access
print(df.iloc[0]) # index से access
🔸 16. apply()
क्या करता है? – Function को हर row या column पर apply करता है।
df['age_plus_5'] = df['उम्र'].apply(lambda x: x + 5)
🔸 17. groupby()
क्या करता है? – किसी column के base पर data को group करता है।
data = {'शहर': ['दिल्ली', 'दिल्ली', 'मुंबई'],
'उम्र': [25, 35, 40]}
df2 = pd.DataFrame(data)
print(df2.groupby('शहर').mean())
🔸 18. merge()
क्या करता है? – दो DataFrames को SQL की तरह जोड़ने के लिए।
df1 = pd.DataFrame({'ID': [1, 2], 'नाम': ['राज', 'सीमा']})
df2 = pd.DataFrame({'ID': [1, 2], 'स्कोर': [90, 85]})
df_merged = pd.merge(df1, df2, on='ID')
🔸 19. concat()
क्या करता है? – दो DataFrames को ऊपर-नीचे या बगल-बगल जोड़ता है।
df_concat = pd.concat([df1, df2], axis=1)
🔸 20. reset_index()
क्या करता है? – index को default value में reset करता है।
df_reset = df.reset_index(drop=True)
Pandas में DataFrame methods की मदद से आप data को analyze, clean, transform, और visualize कर सकते हैं। ऊपर दिए गए सभी methods आपको किसी भी डेटा एनालिसिस प्रोजेक्ट में बहुत काम आएंगे।
✅ निष्कर्ष:
यह कोड Pandas की सहायता से एक DataFrame बनाता है और फिर उस डेटा का preview, structure और statistical summary दिखाता है। यह शुरुआत के लिए बहुत अच्छा और basic उदाहरण है।
अगर आप चाहें तो मैं इसका PDF बना दूं या इसे और विस्तार में भी समझा सकता हूँ। बताएं 😊