Ai 13

정보의 몰락과 전문가 시대의 도래: AI와의 공존 전략

1. 정보 및 지식 시장의 패러다임 변화: '양'에서 '신뢰'로정보의 가치 급락: 누구나 정보에 접근하고 생산할 수 있는 시대가 되면서 단순히 정보를 찾는 행위의 가치는 사실상 소진되었습니다.해석과 선별의 시대: 정보 과잉 상태에서 사람들은 이제 정보 그 자체가 아니라, 쏟아지는 데이터 속에서 진짜를 골라내는 '해석과 선별' 능력을 원하고 있습니다.신뢰라는 진입장벽: 정보의 가치는 '무엇'인가보다 '누구'가 제공하는가라는 출처의 신뢰도에 의해 결정되며, 이는 전문가에게 부가적인 프리미엄을 부여합니다.전략적 투명성: 무조건적인 비공개가 아니라, 어떤 정보를 왜 공개하고 왜 제한하는지를 명확히 설명하는 '전략적 투명성'이 새로운 신뢰의 증거가 되고 있습니다.2. 지식의 3단계 계층 구조와 이동 경로제1계층(..

Common Sense 2026.02.10

PM 혼자 AI 기초 공부: 머신러닝 - 나이브 베이즈(Naive Bayes)

나이브 베이즈: PM을 위한 실무 가이드확률로 판단하는 AI의 기초, 실무 관점에서 이해하기소개: 확률로 판단하는 AI의 기초나이브 베이즈(Naive Bayes)는 베이즈 정리를 기반으로 한 확률적 머신러닝 알고리즘입니다. "이메일이 스팸일 확률은?", "이 리뷰가 긍정적일 확률은?"과 같은 분류 문제를 확률로 접근합니다.AI 프로젝트를 관리하는 PM에게 나이브 베이즈가 중요한 이유는 세 가지입니다. 첫째, 학습 속도가 빠르고 리소스를 적게 사용해 빠른 프로토타이핑이 가능합니다. 둘째, 결과를 확률로 제시해 비즈니스 의사결정에 직관적으로 활용할 수 있습니다. 셋째, 텍스트 분류, 스팸 필터링 등 실무에서 자주 마주치는 문제에 여전히 효과적입니다.핵심 개념베이즈 정리 기반의 조건부 확률나이브 베이즈는 "이..

PM 혼자 AI 기초 공부: 머신러닝 - 주성분 분석(PCA)

1. 소개: 주성분 분석주성분 분석(Principal Component Analysis, PCA)은 고차원 데이터를 저차원으로 압축하는 가장 기본적이면서도 강력한 차원 축소 기법입니다.고객 데이터가 100개의 특성(나이, 소득, 구매 이력, 클릭 패턴 등)을 가지고 있다면, 이를 모두 분석하는 것은 매우 복잡하고 시간이 많이 걸립니다. PCA는 이 100개의 특성 중에서 가장 중요한 정보를 담고 있는 5~10개의 '핵심 특성'으로 압축해줍니다.AI/ML 학습에서 PCA가 중요한 이유학습 속도 향상: 데이터 차원이 줄어들면 모델 학습 시간이 대폭 단축됩니다과적합 방지: 불필요한 노이즈를 제거하여 모델이 일반화를 더 잘하도록 돕습니다시각화 가능: 고차원 데이터를 2D/3D로 압축하여 사람이 이해할 수 있게 ..

그래디언트 부스팅; 세 가지 알고리즘 핵심만 비교 (XGBoost, LightGBM, CatBoost)

📌 주니어 PM 혼자 AI 기초 공부: 머신러닝 - 그래디언트 부스팅 세 가지 알고리즘 비교 (XGBoost, LightGBM, CatBoost)정형 데이터를 분류하고, 정형 데이터로부터 예측하고, 정형 데이터의 랭킹 작업을 하려면 그래디언트 부스팅 라이브러리 세 가지 중 하나를 사용하면 됩니다. 그래디언트 부스팅 계열의 세 가지 라이브러리XGBoost, LightGBM, CatBoost 는 모두 그래디언트 부스팅(Gradient Boosting) 계열 라이브러리로, 약한 모델(주로 의사결정 트리)을 여러 개 모아 강력한 예측 모델을 만드는 방법입니다. 각 알고리즘은 데이터 처리 방식에서 차이가 있기 때문에, 데이터의 규모와 종류에 따라 적절한 알고리즘을 선택합니다. 연구에 따르면, XGBoost는 균..

주니어 PM 혼자 AI 기초 공부: 머신러닝 - CatBoost

요약CatBoost는 Yandex에서 개발된 오픈소스 그래디언트 부스팅(Gradient Boosting) 라이브러리로, 범주형 특징(categorical features)을 자동으로 처리하는 데 특화되어 있습니다. tabular 데이터 기반의 예측 모델링에서 매우 유용하며, AI 학습에서 과적합(overfitting)을 줄이고 정확도를 높이는 데 중요한 역할을 합니다. CatBoost를 활용해서 데이터 전처리 시간을 절감하고, 비즈니스 의사결정을 위한 빠른 인사이트를 얻을 수 있습니다.핵심 포인트- CatBoost는 범주형 데이터를 별도 변환 없이 처리할 수 있어서 실무 효율성이 높습니다.- Ordered boosting 기법으로 과적합을 방지하며, 모델의 일반화 성능을 강화합니다.- GPU를 지원하여 ..

카테고리 없음 2025.12.23

주니어 PM 혼자 AI 기초 공부: 머신러닝 - LightGBM

요약 LightGBM은 Microsoft가 개발한 그래디언트 부스팅 라이브러리로, 트리 기반 학습을 통해 대규모 데이터셋에서 효율적인 머신러닝 작업을 수행합니다. 연구에 따르면 XGBoost보다 속도와 메모리 효율성이 우수하지만, 데이터 규모에 따라 최적화가 필요할 수 있습니다.LightGBM은 리프 중심 트리 성장과 히스토그램 기반 기법을 통해 빠르고 메모리 효율적인 모델링을 제공하지만, 작은 데이터셋에서는 과적합 위험이 있을 수 있습니다.경쟁력 면에서 대규모 데이터 처리 속도가 탁월하며, 금융 및 의료 분야에서 실무 적용이 증가하고 있지만, 해석 가능성에 대한 논란이 있습니다.활용 사례는 사기 탐지와 판매 예측이 주를 이루며, 최근 하이브리드 모델이 한계를 보완하고 있습니다.한계로 인해 모든 시나리오..

주니어 PM 혼자 AI 기초 공부: 머신러닝 - XGBoost

📌 주니어 PM 혼자 AI 기초 공부: 머신러닝 - XGBoost정형 데이터 예측의 최강자XGBoost는 eXtreme Gradient Boosting의 약자로, 정형 데이터 예측에서 강력한 성능을 발휘하는 머신러닝 라이브러리입니다. XGBoost는 의사결정 나무(decisoin tree)를 기반으로 한 앙상블 학습 방법으로, 예측의 정확도와 속도, 안정성 면에서 뛰어납니다. 이미지나 음성이 아닌 고객 데이터/거래 데이터/로그 데이터 등의 tabular 데이터 처리에 탁월하고, 실무에서는 분류, 회귀 등의 예측 모델링에 필수적입니다. 특히 빠르게 성과를 내야 하고, 결과에 대한 설명이 필요한 비즈니스에 적합합니다. XGBoost 는 Kaggle 대회에서 우승팀의 60% 이상이 사용한 모델이기도 합니다...

주니어 PM 혼자 AI 기초 공부: 머신러닝 - 그래디언트 부스팅(Gradient Boosting)

📌 주니어 PM 혼자 AI 기초 공부: 머신러닝 - 그래디언트 부스팅(Gradient Boosting) 그래디언트 부스팅그래디언트 부스팅(Gradient Boosting, 이하 GB)은 머신러닝의 앙상블 기법으로, 여러 개의 단순한 모델('약한 예측 모델'. 주로 의사결정 나무)을 순차적으로 결합하여 강력한 예측 모델을 만드는 방법입니다. 정형 데이터를 다루는 머신러닝 대회(Kaggle 등)에서 우승한 모델의 80% 이상이 GB 모델을 사용할 만큼 성능이 검증된 개념입니다. 그래디언트 부스팅이라 부르는 이유는 '그래디언트(경사)' 라는 수학적 도구를 사용해서 모델의 성능을 '부스팅' 하기 때문입니다. 이 방법이 등장하기 전에는 에이다부스트(Adaboost) 라는 기법이 있었는데, 틀린 데이터에 가중치..

주니어 PM 혼자 AI 기초 공부: LLM (Large Language Models)

📌 주니어 PM의 AI 자습서: LLM (Large Language Models)1. LLM의 개념과 정의Large Language Models(이하 LLM) 은 엄청나게 방대한 양의 텍스트 데이터셋을 학습하여 인간의 언어를 알아듣고, 새로운 텍스트를 만들 수 있는 딥러닝 기반의 인공지능 모델입니다. 번역, 요약, 질문 응답 등 다양한 언어 작업이 가능합니다.'Large' 의 의미는 모델의 규모가 크다는 뜻입니다. 이는 주로 모델이 가진 파라미터(parameter; 매개변수)의 수로 측정됩니다. 파라미터는 모델이 학습을 통해 얻는 지식의 양으로 볼 수 있으며, LLM은 수십억 개에서 수조 개에 달합니다. 2. LLM의 등장 배경LLM의 뿌리는 2010년대 후반 자연어 처리(NLP) 연구에서 시작되었습니..