파이썬 데이터 학교 챌린지 #76: 데이터 마술사! ‘판다스로 나만의 표 만들기’

안녕하세요! 가족과 함께하는 스마트 라이프입니다. 지난주 거북이와 함께한 우주 여행, 즐거우셨나요? 이번 주부터는 우리가 수집한 수많은 정보를 아주 깔끔하게 정리해 주는 ‘데이터 마술사, 판다스(Pandas)’를 배워볼 거예요. 뒤죽박죽 섞인 숫자들을 마법처럼 멋진 표로 만들어봐요!

파이썬 데이터 학교 챌린지 #76: 데이터 마술사! ‘판다스로 나만의 표 만들기’

1. 데이터를 정리하는 마법 상자, ‘판다스(Pandas)’

인터넷에서 가져온 뉴스 제목이나, 여러분이 푼 수학 문제 점수들이 엄청나게 많아지면 한눈에 보기 힘들죠? 판다스는 이 데이터들을 엑셀처럼 가로줄과 세로줄이 있는 반듯한 표로 만들어 주는 도구예요. 이 표를 판다스에서는 ‘데이터프레임(DataFrame)’이라고 부른답니다. 데이터 마술사의 가장 중요한 가방인 셈이죠!

2. 데이터 마술사의 필수 주문

데이터를 표로 만들기 위해 필요한 기초 주문들을 배워봐요.

  • import pandas as pd: 판다스 마법사를 ‘pd’라는 별명으로 불러와요.
  • DataFrame(): 흩어져 있는 데이터를 모아 반듯한 표(데이터프레임)로 변신시켜요.
  • head(): 데이터가 너무 많을 때, 맨 앞부분만 살짝 미리 봐요.
  • describe(): 데이터의 평균이나 개수 같은 특징을 한 번에 요약해서 보여줘요.

3. 실전 연습: 우리 가족 성적표 만들기 코딩

# 이 코드는 pandas라는 도구가 설치되어 있어야 해요!
# 설치 방법: pip install pandas

import pandas as pd

print("📊 파이썬 데이터 마술사가 표를 만들기 시작합니다!")

# 1. 정리할 데이터 준비하기 (딕셔너리 형태)
data = {
    '이름': ['파이썬', '거북이', '판다스', '에듀패드'],
    '수학': [95, 80, 100, 90],
    '영어': [85, 90, 95, 100],
    '코딩': [100, 70, 90, 85]
}

# 2. 데이터를 마법의 표(DataFrame)로 만들기
df = pd.DataFrame(data)

# 3. 표 출력하기
print("\n--- 완성된 우리 가족 성적표 ---")
print(df)

# 4. 수학 점수 평균 구해보기
math_avg = df['수학'].mean()
print(f"\n💡 우리 가족의 수학 평균 점수는 {math_avg}점이에요!")

print("\n✨ 복잡한 데이터가 아주 깔끔한 표가 되었습니다!")

[IMAGE_2]

4. 더 유능한 분석가로 업그레이드!

우리 데이터 마술사에게 더 멋진 기술을 가르쳐볼까요?

  • 순서대로 줄 세우기: df.sort_values(by='코딩', ascending=False)를 사용해 코딩 점수가 높은 순서대로 표를 다시 정리해 보세요.
  • 특정 사람만 보기: df[df['이름'] == '에듀패드']처럼 내가 원하는 정보만 쏙 골라내는 필터 마법을 써보세요.
  • 엑셀로 변신: 56탄에서 배운 것처럼 df.to_excel('score.xlsx') 한 줄이면 이 표를 진짜 엑셀 파일로 만들 수 있어요!

5. 가족과 함께하는 ‘우리 집 데이터 분석’

아이와 함께 지난 일주일 동안 먹은 간식이나 운동 시간을 데이터로 만들어 보세요. “어떤 간식을 가장 많이 먹었을까?”라고 물으며 아이가 직접 숫자를 입력하게 해주세요. 아이가 직접 만든 데이터가 mean() 함수를 통해 평균 숫자로 변하는 것을 보며 ‘데이터가 어떻게 의미 있는 정보가 되는지’ 통계의 기초를 이해하게 해주세요. EduPad 프로젝트에서 아이들이 푼 100가지 수학 문제의 정답률을 분석해 어떤 단원을 더 공부해야 할지 알려주는 ‘스마트 학습 분석기’의 가장 핵심적인 기초로 활용하기에 정말 완벽한 예제입니다.

마치며: 숫자에 숨겨진 이야기를 찾아서!

챌린지의 76번째 미션 완료! 오늘은 흩어진 데이터를 모아 반듯한 표로 만드는 판다스의 마법을 배웠습니다. 내일 오전 9시에는 이 표에서 내가 원하는 정보만 더 정확하게 골라내는 ‘족집게 비서! 데이터 선택과 슬라이싱’ 마법으로 돌아오겠습니다!