📌 주니어 PM 혼자 AI 기초 공부: 강화 학습(Reinforcement Learning)1. 소개강화 학습(Reinforcement Learning, 이하 RL)은 AI 에이전트가 보상을 최대화하는 방향으로, 스스로 학습하는 방식입니다. RL에서 에이전트는 환경과 상호작용하며 반복적으로 시행착오(Trial and Error)를 겪으면서, 어떤 행동을 해야 가장 큰 보상을 얻는지를 스스로 '깨닫게' 됩니다. 마치 인간 아이가 걷는 법을 배울 때 넘어지면서 균형 잡는 법을 스스로 체득하는 과정과 유사하며, 인간의 학습 방식과 가장 닮은 AI 학습으로 꼽힙니다. RL은 미리 라벨링된 데이터를 필요로 하지 않고, 스스로 최적의 행동을 탐색하게 하는 데 초점을 맞춥니다. 2. 핵심 개념에이전트와 환경학습하..