Lab: Explore Dataset
Lab: Explore Dataset
Section titled “Lab: Explore Dataset”ในแล็บนี้คุณจะฝึกสำรวจข้อมูลยอดขายร้านค้าออนไลน์ ตั้งแต่โหลดข้อมูลจนถึงตอบคำถามทางธุรกิจ
-
สร้างข้อมูลจำลอง
import pandas as pddata = {"order_id": ["001", "002", "003", "004", "005", "006", "007", "008"],"product": ["เสื้อยืด", "กางเกง", "รองเท้า", "หมวก", "เสื้อยืด", "กางเกง", "รองเท้า", "ถุงเท้า"],"category": ["เสื้อผ้า", "เสื้อผ้า", "รองเท้า", "accessories", "เสื้อผ้า", "เสื้อผ้า", "รองเท้า", "accessories"],"price": [350, 590, 1200, 299, 350, 650, 1500, 89],"qty": [2, 1, 1, 5, 3, 2, 1, 10],"region": ["กรุงเทพ", "เชียงใหม่", "กรุงเทพ", "ภูเก็ต", "กรุงเทพ", "เชียงใหม่", "ภูเก็ต", "กรุงเทพ"]}df = pd.DataFrame(data) -
ตรวจสอบโครงสร้างข้อมูล
ใช้
.shape,.dtypes,.info(),.describe()และ.head()สำรวจข้อมูล -
ตอบคำถามธุรกิจ
- สินค้าที่ราคามากกว่า 500 บาทมีกี่รายการ?
- ยอดขายรวม (price * qty) ของแต่ละ order เป็นเท่าไร?
- สินค้าในหมวด “เสื้อผ้า” ที่ขายในกรุงเทพมีอะไรบ้าง?
- order ที่มียอดขายรวมสูงสุดคือ order ไหน?
-
สร้าง column ใหม่
เพิ่มคอลัมน์
total= price * qty แล้วหา.sum(),.mean()
Show Solution
# Step 2: ตรวจสอบโครงสร้างprint(df.shape) # (8, 6)df.info()print(df.describe())print(df.head())
# Step 3a: ราคามากกว่า 500expensive = df[df["price"] > 500]print(f"สินค้าราคา > 500: {len(expensive)} รายการ")
# Step 3b: ยอดขายรวมแต่ละ orderdf["total"] = df["price"] * df["qty"]print(df[["order_id", "product", "total"]])
# Step 3c: เสื้อผ้าในกรุงเทพbkk_clothes = df[(df["category"] == "เสื้อผ้า") & (df["region"] == "กรุงเทพ")]print(bkk_clothes[["product", "price", "qty"]])
# Step 3d: order ยอดสูงสุดmax_idx = df["total"].idxmax()print(f"Order ยอดสูงสุด: {df.loc[max_idx, 'order_id']}")print(f"สินค้า: {df.loc[max_idx, 'product']}")print(f"ยอด: {df.loc[max_idx, 'total']:,} บาท")
# Step 4: สถิติprint(f"ยอดขายรวมทั้งหมด: {df['total'].sum():,} บาท")print(f"ค่าเฉลี่ยต่อ order: {df['total'].mean():,.2f} บาท")