파이썬 마법 학교 34강: 내 말을 찰떡같이 알아들어요! ‘음성 인식(STT)’ 마법

안녕하세요! 가족과 함께하는 스마트 라이프입니다. 지난 시간에 비서가 멋진 목소리로 인사하는 걸 들으셨나요? 오늘은 드디어 비서에게 ‘귀’를 달아줄 거예요. 우리가 키보드를 치지 않아도, 말만 하면 척척 알아듣는 ‘음성 인식(STT)’ 마법을 배워봅시다!

파이썬 마법 학교 34강: 내 말을 찰떡같이 알아들어요! ‘음성 인식(STT)’ 마법

1. STT가 무엇인가요?

STT는 Speech-To-Text의 약자로, 사람의 목소리(Speech)를 컴퓨터가 읽을 수 있는 글자(Text)로 바꿔주는 기술이에요. 우리가 마이크에 대고 말을 하면, 파이썬 비서가 그 소리 파동을 분석해서 “아! 주인님이 ‘안녕’이라고 하셨구나!”라고 이해하게 되는 마법이죠.

2. 소리를 글자로 바꾸는 도구: SpeechRecognition

파이썬에는 우리의 목소리를 통역해주는 SpeechRecognition이라는 아주 똑똑한 통역사 친구가 있어요.

  • Recognizer: “내 말을 들어줄 인공지능 귀를 준비해!”
  • Microphone: “컴퓨터의 마이크를 켤게!”
  • recognize_google: “방금 들은 소리를 구글 통역사에게 물어봐서 글자로 바꿔줘!”

3. 실전 연습: 내 말을 받아쓰는 비서

비서가 내 목소리를 듣고 화면에 글자로 보여주게 해볼까요? (이 코드를 실행하려면 speechrecognitionpyaudio 설치가 필요해요!)

import speech_recognition as sr

# 1. 귀(인식기)와 마이크 준비
r = sr.Recognizer()
mic = sr.Microphone()

with mic as source:
    print("🎤 비서가 듣고 있어요! 말씀해 보세요...")
    # 주변 소음을 제거하고 목소리만 잘 듣게 조절해요
    r.adjust_for_ambient_noise(source)
    audio = r.listen(source)

try:
    # 2. 구글 통역사에게 글자로 바꿔달라고 부탁해요 (한국어)
    text = r.recognize_google(audio, language='ko-KR')
    print(f"🤖 AI 비서가 들은 말: {text}")
    
    if "안녕" in text:
        print("🤖 AI: 네, 주인님! 반가워요!")

except:
    print("🤖 AI: 죄송해요, 목소리가 잘 안 들렸어요. 다시 말씀해 주시겠어요?")
파이썬 마법 학교 34강: 내 말을 찰떡같이 알아들어요! ‘음성 인식(STT)’ 마법

4. 완전체 비서의 탄생!

자, 이제 상상해 보세요. 33강의 목소리(TTS)와 오늘 배운 귀(STT)를 합치면 어떻게 될까요?
내가 “오늘 날씨 어때?”라고 말하면(STT), 비서가 인터넷에서 정보를 찾아(크롤링), “오늘은 맑아요!”라고 직접 대답해주는(TTS) 진짜 인공지능 비서가 탄생하는 거예요!

5. 가족과 함께하는 ‘말하는 대로 대결’

아이와 함께 비서에게 어려운 단어를 말해서 누가 더 정확하게 받아쓰게 하는지 시합해 보세요. “간장 공장 공장장은…” 같은 잰말놀이를 시켜보는 것도 재밌겠죠? 아이들은 자기가 하는 말이 실시간으로 모니터에 글자로 찍히는 걸 보며 ‘데이터가 어떻게 변하는지’를 몸소 체험하게 됩니다. 이제 코딩은 공부가 아니라 비서와 나누는 즐거운 대화가 될 거예요.

마치며: 여러분의 상상력이 인공지능의 미래입니다

이로써 2기 비서 프로젝트가 모두 끝났습니다! 감정을 읽고, 사이트를 열고, 이메일을 보내고, 이제는 말까지 알아듣는 비서를 만들었네요. 여러분은 이미 초보 마법사를 넘어선 훌륭한 개발자입니다. 다음 연재부터는 [파이썬 마법 학교 3기: 꼬마 알고리즘 요정] 시리즈를 통해 더 똑똑한 생각의 법칙을 배워보겠습니다!