PM 19

PM 혼자 AI 기초 공부: 머신러닝 - 나이브 베이즈(Naive Bayes)

나이브 베이즈: PM을 위한 실무 가이드확률로 판단하는 AI의 기초, 실무 관점에서 이해하기소개: 확률로 판단하는 AI의 기초나이브 베이즈(Naive Bayes)는 베이즈 정리를 기반으로 한 확률적 머신러닝 알고리즘입니다. "이메일이 스팸일 확률은?", "이 리뷰가 긍정적일 확률은?"과 같은 분류 문제를 확률로 접근합니다.AI 프로젝트를 관리하는 PM에게 나이브 베이즈가 중요한 이유는 세 가지입니다. 첫째, 학습 속도가 빠르고 리소스를 적게 사용해 빠른 프로토타이핑이 가능합니다. 둘째, 결과를 확률로 제시해 비즈니스 의사결정에 직관적으로 활용할 수 있습니다. 셋째, 텍스트 분류, 스팸 필터링 등 실무에서 자주 마주치는 문제에 여전히 효과적입니다.핵심 개념베이즈 정리 기반의 조건부 확률나이브 베이즈는 "이..

2025년, 개발자가 함께 일하고 싶어했던 PM에 대하여

📌 개발자가 함께 일하고 싶어했던 PM에 대하여2025년 한 해 동안 개발자 커뮤니티와 테크 컨퍼런스에서 가장 뜨거운 반응을 얻었던 '개발자가 함께 일하고 싶은 PM' 관련 자료 5가지를 선정했습니다. 실제 자료를 요약한 것도 있고, 여러 가지 자료들을 모아 편집/재구성하여 요약한 것도 있습니다. 각 자료는 AI 협업이 일상화된 2025년의 최신 기술 환경을 반영하고 있습니다.1. [칼럼] "스코프는 유연하게, 결과는 단호하게" - Prashant Mahajan2025년 하반기, 글로벌 테크 씬에서 가장 많이 인용된 제품 리더십 칼럼입니다.요약마하잔은 PM이 빠지기 쉬운 '기능 중심적 사고'의 위험성을 경고합니다.그는 개발자가 가장 선호하는 PM을 '비즈니스 가치(Outcome)를 수호하되, 구현 방식..

Common Sense 2025.12.27

그래디언트 부스팅; 세 가지 알고리즘 핵심만 비교 (XGBoost, LightGBM, CatBoost)

📌 주니어 PM 혼자 AI 기초 공부: 머신러닝 - 그래디언트 부스팅 세 가지 알고리즘 비교 (XGBoost, LightGBM, CatBoost)정형 데이터를 분류하고, 정형 데이터로부터 예측하고, 정형 데이터의 랭킹 작업을 하려면 그래디언트 부스팅 라이브러리 세 가지 중 하나를 사용하면 됩니다. 그래디언트 부스팅 계열의 세 가지 라이브러리XGBoost, LightGBM, CatBoost 는 모두 그래디언트 부스팅(Gradient Boosting) 계열 라이브러리로, 약한 모델(주로 의사결정 트리)을 여러 개 모아 강력한 예측 모델을 만드는 방법입니다. 각 알고리즘은 데이터 처리 방식에서 차이가 있기 때문에, 데이터의 규모와 종류에 따라 적절한 알고리즘을 선택합니다. 연구에 따르면, XGBoost는 균..

주니어 PM 혼자 AI 기초 공부: 머신러닝 - CatBoost

요약CatBoost는 Yandex에서 개발된 오픈소스 그래디언트 부스팅(Gradient Boosting) 라이브러리로, 범주형 특징(categorical features)을 자동으로 처리하는 데 특화되어 있습니다. tabular 데이터 기반의 예측 모델링에서 매우 유용하며, AI 학습에서 과적합(overfitting)을 줄이고 정확도를 높이는 데 중요한 역할을 합니다. CatBoost를 활용해서 데이터 전처리 시간을 절감하고, 비즈니스 의사결정을 위한 빠른 인사이트를 얻을 수 있습니다.핵심 포인트- CatBoost는 범주형 데이터를 별도 변환 없이 처리할 수 있어서 실무 효율성이 높습니다.- Ordered boosting 기법으로 과적합을 방지하며, 모델의 일반화 성능을 강화합니다.- GPU를 지원하여 ..

카테고리 없음 2025.12.23

주니어 PM 혼자 AI 기초 공부: 머신러닝 - XGBoost

📌 주니어 PM 혼자 AI 기초 공부: 머신러닝 - XGBoost정형 데이터 예측의 최강자XGBoost는 eXtreme Gradient Boosting의 약자로, 정형 데이터 예측에서 강력한 성능을 발휘하는 머신러닝 라이브러리입니다. XGBoost는 의사결정 나무(decisoin tree)를 기반으로 한 앙상블 학습 방법으로, 예측의 정확도와 속도, 안정성 면에서 뛰어납니다. 이미지나 음성이 아닌 고객 데이터/거래 데이터/로그 데이터 등의 tabular 데이터 처리에 탁월하고, 실무에서는 분류, 회귀 등의 예측 모델링에 필수적입니다. 특히 빠르게 성과를 내야 하고, 결과에 대한 설명이 필요한 비즈니스에 적합합니다. XGBoost 는 Kaggle 대회에서 우승팀의 60% 이상이 사용한 모델이기도 합니다...

주니어 PM 혼자 AI 기초 공부: 머신러닝 - 그래디언트 부스팅(Gradient Boosting)

📌 주니어 PM 혼자 AI 기초 공부: 머신러닝 - 그래디언트 부스팅(Gradient Boosting) 그래디언트 부스팅그래디언트 부스팅(Gradient Boosting, 이하 GB)은 머신러닝의 앙상블 기법으로, 여러 개의 단순한 모델('약한 예측 모델'. 주로 의사결정 나무)을 순차적으로 결합하여 강력한 예측 모델을 만드는 방법입니다. 정형 데이터를 다루는 머신러닝 대회(Kaggle 등)에서 우승한 모델의 80% 이상이 GB 모델을 사용할 만큼 성능이 검증된 개념입니다. 그래디언트 부스팅이라 부르는 이유는 '그래디언트(경사)' 라는 수학적 도구를 사용해서 모델의 성능을 '부스팅' 하기 때문입니다. 이 방법이 등장하기 전에는 에이다부스트(Adaboost) 라는 기법이 있었는데, 틀린 데이터에 가중치..

주니어 PM 혼자 AI 기초 공부: 강화 학습(Reinforcement Learning)

📌 주니어 PM 혼자 AI 기초 공부: 강화 학습(Reinforcement Learning)1. 소개강화 학습(Reinforcement Learning, 이하 RL)은 AI 에이전트가 보상을 최대화하는 방향으로, 스스로 학습하는 방식입니다. RL에서 에이전트는 환경과 상호작용하며 반복적으로 시행착오(Trial and Error)를 겪으면서, 어떤 행동을 해야 가장 큰 보상을 얻는지를 스스로 '깨닫게' 됩니다. 마치 인간 아이가 걷는 법을 배울 때 넘어지면서 균형 잡는 법을 스스로 체득하는 과정과 유사하며, 인간의 학습 방식과 가장 닮은 AI 학습으로 꼽힙니다. RL은 미리 라벨링된 데이터를 필요로 하지 않고, 스스로 최적의 행동을 탐색하게 하는 데 초점을 맞춥니다. 2. 핵심 개념에이전트와 환경학습하..

주니어 PM 혼자 AI 기초 공부: LLM (Large Language Models)

📌 주니어 PM의 AI 자습서: LLM (Large Language Models)1. LLM의 개념과 정의Large Language Models(이하 LLM) 은 엄청나게 방대한 양의 텍스트 데이터셋을 학습하여 인간의 언어를 알아듣고, 새로운 텍스트를 만들 수 있는 딥러닝 기반의 인공지능 모델입니다. 번역, 요약, 질문 응답 등 다양한 언어 작업이 가능합니다.'Large' 의 의미는 모델의 규모가 크다는 뜻입니다. 이는 주로 모델이 가진 파라미터(parameter; 매개변수)의 수로 측정됩니다. 파라미터는 모델이 학습을 통해 얻는 지식의 양으로 볼 수 있으며, LLM은 수십억 개에서 수조 개에 달합니다. 2. LLM의 등장 배경LLM의 뿌리는 2010년대 후반 자연어 처리(NLP) 연구에서 시작되었습니..

주니어 PM의 AI 자습서: Flux.1 [dev]

📌 주니어 PM의 AI 자습서: Flux.1 [dev]AI 이미지 생성의 SOTAFlux.1 [dev] 는 Black Forest Labs(BFL)가 2024년 8월 발표한, 120억 개 파라미터 규모의 'rectified flow transformer' 를 기반으로 하는 텍스트-to-이미지 생성 모델입니다. 텍스트 프롬프트를 입력으로 받아 고해상도(최대 1,024x1,024) 이미지를 생성합니다. 기존 diffusion 모델의 한계를 넘어선 'flow matching' 기법을 사용해서 복잡한 노이즈 제거 과정을 단순화하여 적은 추론 단계로도 고품질의 이미지를 생성합니다. 이 모델은 AI 이미지 생성의 '스테이트-오브-더-아트'로, Midjourney나 DALL-E와 경쟁하고 있습니다. 오픈소스 생태계..