Welcome
안녕하세요. AI & Data Engineer로 일하고 있는 개발자입니다.
이 블로그에서는 제가 공부하고 경험한 것들을 정리해서 공유할 예정입니다. 주로 다룰 주제는 다음과 같습니다.
다룰 주제들
AI & Machine Learning
- MLOps 파이프라인 구축
- 모델 서빙 및 모니터링
- Feature Store 설계
Data Engineering
- 대규모 데이터 파이프라인
- Spark, Flink, Kafka
- Data Contract와 데이터 품질
System Design
- 분산 시스템 설계
- 실시간 처리 아키텍처
- 확장 가능한 ML 시스템
코드 예시
블로그에서는 실제 코드와 함께 설명할 예정입니다.
from typing import List
import pandas as pd
def process_features(data: pd.DataFrame) -> pd.DataFrame:
"""피처 엔지니어링 예시"""
features = data.copy()
# 시간 기반 피처
features['hour'] = features['timestamp'].dt.hour
features['day_of_week'] = features['timestamp'].dt.dayofweek
# 집계 피처
features['rolling_mean'] = features['value'].rolling(window=7).mean()
return features
마무리
앞으로 꾸준히 글을 올릴 예정입니다. 피드백은 언제나 환영합니다!