Skip to content

Lab: Explore Dataset

ในแล็บนี้คุณจะฝึกสำรวจข้อมูลยอดขายร้านค้าออนไลน์ ตั้งแต่โหลดข้อมูลจนถึงตอบคำถามทางธุรกิจ

  1. สร้างข้อมูลจำลอง

    import pandas as pd
    data = {
    "order_id": ["001", "002", "003", "004", "005", "006", "007", "008"],
    "product": ["เสื้อยืด", "กางเกง", "รองเท้า", "หมวก", "เสื้อยืด", "กางเกง", "รองเท้า", "ถุงเท้า"],
    "category": ["เสื้อผ้า", "เสื้อผ้า", "รองเท้า", "accessories", "เสื้อผ้า", "เสื้อผ้า", "รองเท้า", "accessories"],
    "price": [350, 590, 1200, 299, 350, 650, 1500, 89],
    "qty": [2, 1, 1, 5, 3, 2, 1, 10],
    "region": ["กรุงเทพ", "เชียงใหม่", "กรุงเทพ", "ภูเก็ต", "กรุงเทพ", "เชียงใหม่", "ภูเก็ต", "กรุงเทพ"]
    }
    df = pd.DataFrame(data)
  2. ตรวจสอบโครงสร้างข้อมูล

    ใช้ .shape, .dtypes, .info(), .describe() และ .head() สำรวจข้อมูล

  3. ตอบคำถามธุรกิจ

    • สินค้าที่ราคามากกว่า 500 บาทมีกี่รายการ?
    • ยอดขายรวม (price * qty) ของแต่ละ order เป็นเท่าไร?
    • สินค้าในหมวด “เสื้อผ้า” ที่ขายในกรุงเทพมีอะไรบ้าง?
    • order ที่มียอดขายรวมสูงสุดคือ order ไหน?
  4. สร้าง column ใหม่

    เพิ่มคอลัมน์ total = price * qty แล้วหา .sum(), .mean()

Show Solution
# Step 2: ตรวจสอบโครงสร้าง
print(df.shape) # (8, 6)
df.info()
print(df.describe())
print(df.head())
# Step 3a: ราคามากกว่า 500
expensive = df[df["price"] > 500]
print(f"สินค้าราคา > 500: {len(expensive)} รายการ")
# Step 3b: ยอดขายรวมแต่ละ order
df["total"] = df["price"] * df["qty"]
print(df[["order_id", "product", "total"]])
# Step 3c: เสื้อผ้าในกรุงเทพ
bkk_clothes = df[(df["category"] == "เสื้อผ้า") & (df["region"] == "กรุงเทพ")]
print(bkk_clothes[["product", "price", "qty"]])
# Step 3d: order ยอดสูงสุด
max_idx = df["total"].idxmax()
print(f"Order ยอดสูงสุด: {df.loc[max_idx, 'order_id']}")
print(f"สินค้า: {df.loc[max_idx, 'product']}")
print(f"ยอด: {df.loc[max_idx, 'total']:,} บาท")
# Step 4: สถิติ
print(f"ยอดขายรวมทั้งหมด: {df['total'].sum():,} บาท")
print(f"ค่าเฉลี่ยต่อ order: {df['total'].mean():,.2f} บาท")