Research & Project Portfolio
이다운 Lee Dawoon
AI / LLM Engineer · Ph.D. Candidate (재학중)
LLM · AI Agent · RAG · MLOps · Inference Optimization
SECTION · 01 — About Me
LLM 및 AI 에이전트 시스템을 연구·개발하는 AI 엔지니어입니다. 현재 서울시립대학교 박사과정에 재학중이며, 자연어처리 · 이미지 핸들링 · 서비스 모델링을 연구하고 있습니다. 회사에서는 사내 LLMOps 플랫폼 XGEN 출시에 기여했고, 학부 시절부터 5건의 공공기관 연계 R&D 프로젝트에 참여해 도메인 특화 NLP·Vision 모델을 다뤘으며, 현재는 5건의 기업 실무 프로젝트를 통해 RAG · LLMOps · 하드웨어 가속기 검증까지 End-to-End로 수행하고 있습니다.
연구 철학
“모델만 잘 만드는 것이 아니라, 실제 도메인 데이터에서 LLM이 얼마나 신뢰성 있게 작동하는가를 정량적으로 측정하고, 프롬프트 · RAG · 파인튜닝 중 어떤 방법이 가장 효과적인지 비교 검증하는 데 집중해 왔습니다.”
핵심 강점 5가지
학계 + 산업계 양쪽 경험
공공 R&D 5건 + 대학원 자체 연구 3건 + 기업 실무 5건의 균형
End-to-End 책임 경험
요구사항 정의 → 모델 선정 → 분산 학습 → 평가 자동화 → K8s 배포 → 고객사 납품/현장 지원
대안 가속기 검증 능력
Intel Gaudi(HPU), AMD ROCm까지 직접 도입·벤치마크하여 NVIDIA 의존성 완화
최신 표준 프로토콜 활용
MCP·A2A 같은 최신 에이전트 통신 프로토콜을 실서비스에 도입
지속적인 기술 기록
자체 인프라 블로그 koala.ai.kr에 80여 편의 논문 리뷰와 PoC 결과 공개
SECTION · 02 — 대표 프로젝트
★ UBAI 우수상 수상 · 2025
관광 활성화를 위한 거대 언어 모델 및 RAG 파이프라인 구축 연구
서울시립대학교 대학원생 연구역량 강화 프로그램 · 2025.02 ~ 2025.07 · Lead Researcher (개인 연구)
일본인 관광객이 현장에서 직접 활용할 수 있는 온디바이스 환경의 다국어 관광 안내 AI가 목표. 4B 이하 소형 모델로 한국어 문서를 정확히 일본어로 답변하는 시스템 구현 + 4가지 RAG 변형(Vector/Graph/Light/Ensemble) 직접 설계·비교.
RAG 정량 평가 결과
| 시스템 | 관련성 | 충실도 |
|---|---|---|
| EnsembleRAG ✓ | 62.2% | 43.4% |
| LightRAG | 58.0% | 44.6% |
| GraphRAG | 57.0% | 44.6% |
| VectorRAG | 57.8% | 42.0% |
SECTION · 03 — 기업 실무 프로젝트 (5건)
01
LLMOps 플랫폼 개발 (사내 XGEN 출시 기여)
2025.04 ~ 현재 · 진행 중 · Core Engineer
- 모델 평가 자동화 — lm-eval 기반 벤치마크 자동화 파이프라인
- vLLM 서빙 최적화 — 처리량 튜닝, 배치 크기·KV cache 최적화
- Intel HPU 마이그레이션 및 검증 — vllm-fork 기반 NVIDIA → Gaudi 2/3 포팅, FP8 양자화
- 대용량 데이터 MLOps — Kafka·Spark·Hadoop 기반 데이터 파이프라인
- Svelte 관리자 UI 개발
- World IT Show 2025 부스 시연 연사 + 기업 LLMOps 세미나 연사
02
E-commerce 챗봇 솔루션 개발
2024.09 ~ 2025.12 · Backend / AI Engineer
- 3가지 RAG 아키텍처 비교 (정확도·응답 속도·비용 trade-off)
- LangGraph 상태 그래프로 다중 도구 호출 워크플로우
- Next.js + Flask 풀스택 개발
- Docker / Kubernetes 오케스트레이션 + ArgoCD GitOps 자동 배포
03
이커머스 도메인 적합 LLM 개발 (SFT/DPO)
2024.07 ~ 현재 · 진행 중 · LLM Trainer
- SFT·DPO 방법론 PoC — 두 가지 학습 기법 효과 비교
- 선호도 데이터셋 구축 및 품질 관리 (chosen/rejected)
- H100 8-way 클러스터 운영 + NeMo 분산 학습
- K8s GPU 리소스 스케줄링
04
롯데 홈쇼핑 LLMOps 플랫폼 구축 프로젝트
2025.09 ~ 현재 · 진행 중 · Solution Engineer
- 상품 온톨로지 + RAG QA 자동화 워크플로우
- 방송 음성 STT 엔진 개발/튜닝
- 실시간 방송 심의 워크플로우 (금칙어·과대광고 탐지)
- Jenkins · ArgoCD 배포 자동화
05
개발 생산성 향상 도구 개발 및 고도화 (사내 TF)
2025.01 ~ 현재 · 진행 중 · Tech Lead
- OCR 및 복잡 문서 파싱 개선 (RAG 정확도 고도화 기반)
- OpenSearch 인덱스 + Sparse·Dense 하이브리드 검색
- MCP·A2A 프로토콜 멀티 에이전트 시스템 통합
- Next.js + FastAPI + WebSocket 풀스택 개발
SECTION · 04 — 대학원 자체 연구 (박사과정)
대표 프로젝트(관광 RAG)는 위 SECTION 02 참조.
06
교통 네트워크 자료에 대한 거대언어모형의 프롬프트 설계 방안 및 고찰
2023.04 ~ 2024.07
07
Hyperspectral data 분석을 통한 부소산성 인근 위해 식물군 확인
2023.11 ~ 2024.07
SECTION · 05 — 공공기관 연계 R&D 프로젝트 (5건)
01
Text-to-Table을 활용한 120다산 콜센터 RPA 방안 연구
2022.09 ~ 2022.12 · 다산120콜재단 산학협력 · 연구원
02
경기문화재단 민원 분석 프로젝트
2022.10 ~ 2022.12 · 연구원
03
환자안전 보고학습시스템 약물 관련 텍스트 자료 분석
2022.10 ~ 2023.01 · 의료기관평가인증원 · 연구원
04
AOP 기반 ITS/IATA 분자 표현학습 모델
2023.04 ~ 2024.07 · 환경부 R&D · 연구원
05
교육콘텐츠 분석을 위한 Instruction-tuned LLM 개발
2023.04 ~ 2024.07 · 연세대학교 / 북아이피스 · 연구원
SECTION · 06 — 하드웨어 가속기 기술 검증
NVIDIA 의존성을 줄이기 위해 Intel Gaudi(HPU)와 AMD ROCm을 직접 도입·검증.
19
Intel Gaudi 2 / Gaudi 3 HPU 기술 검증
2025.04 ~ 2025.11 · HW 검증 담당
- vault.habana.ai 기반 Docker 환경 구축 + transformers 4.48.x 호환성 직접 해결
- HabanaAI/vllm-fork 빌드 + 멀티 카드 Tensor Parallelism
- Calibration → INC 기반 FP8 양자화 파이프라인
- optimum-habana 모델 파인튜닝 PoC + 성능 벤치마크
20
AMD NPU / GPU 기술 검증
2025.06 ~ 2025.12 · HW 검증 담당
- AMD GPU + NPU 하이브리드 환경 + ROCm 스택 구축
- 프레임워크별 호환성 비교 (vLLM·Ollama·llama.cpp)
- 양자화·배치 전략 최적화 + 운영 가이드 문서화
SECTION · 07 — 개인 프로젝트
23
개인 블로그 koala.ai.kr 자체 운영
2026.02 ~ 현재 · Solo 인프라/개발 운영자
- Next.js 15 + FastAPI + SQLite + Docker Compose
- Nginx + Let's Encrypt SSL 자동 갱신
- GitHub Actions Self-hosted Runner CI/CD
- Grafana + Prometheus + cAdvisor 모니터링 직접 구축
- Neo4j 기반 포스트 지식 그래프 시각화
- 80여 편의 논문 리뷰 + Anthropic SDK 기반 ChatWidget
24
Autonoma — 자기조직화 에이전트 스웜 플랫폼
2026.04 ~ 현재 · 3D VTuber 시각화 · Solo Developer / Architect
- Observe-Decide-Act 루프 + 7가지 액션
- Harness 정책 엔진 — 라우팅·루프 제한·안전 레벨 제어
- Bubblewrap 샌드박스 — CPU/시간/메모리 격리
- VRM + Three.js 실시간 캐릭터 렌더링 + 5모음 립싱크
- OmniVoice 제로샷 음성 클로닝 TTS
- 터미널 TUI / 2D 픽셀 HUD / 3D VTuber / OBS 크로마키 4가지 시청 모드
25
arxiv-graph — arXiv 논문 지식 그래프 자동 구축기
2026.04 · Solo Developer
- all-MiniLM-L6-v2 임베딩 (384차원, ~90MB)
- 코사인 유사도 0.75 임계값 + 공저자 가중치
- 복합 점수 = 0.3 × recency + 0.4 × citations + 0.3 × pagerank
- APScheduler 매일 06:00 UTC 자동 실행
26
UASEF — 의료 LLM 에이전트 안전 에스컬레이션 프레임워크
2026.03 ~ 현재 · 논문 PoC · Solo Researcher
- UQM — Conformal Prediction 비적합 점수 (logprob/self-consistency)
- RTC — 전문과목별 위험 온톨로지 임계값 동적 조정
- EDE — 3가지 트리거 (불확실성·고위험 행동·근거 부재) 결합
- Weighted CP (Tibshirani 2019) + MIMIC-III calibration
- Pareto Sweep + 자동 α 권고 (specialty별 최적값 추천)
SECTION · 08 — 학회 발표 · 수상 · 대외활동
학회 발표 / 수상
| 연도 | 활동 |
|---|---|
| 2025 | UBAI 연구역량 강화 프로그램 우수상 |
| 2023 | 하계 자료분석학회 논문 발표 |
| 2023 | 환경독성보건학회 / 한국통계학회 발표 (2회) |
| 2022 | 동계 자료분석학회 학술발표대회 포스터 |
대외 연사 활동
| 연도 | 행사 |
|---|---|
| 2025.04 | World IT Show 2025 부스 연사 |
| 2025.11 | 기업 대상 LLMOps 세미나 연사 |
블로그 운영 — 자체 운영 블로그 koala.ai.kr에 80여 편의 논문 리뷰와 PoC 결과를 공개. 주요 시리즈: Transformer · LLM · AI Agent · 추론 최적화 · 딥페이크 탐지 · ASR · AI 가속기.
SECTION · 09 — 기술 스택 종합
AI / ML / LLM
| 언어 모델 | Transformer · BERT · GPT · Llama · Qwen · Gemma · EXAONE |
| 학습 기법 | SFT · DPO · LoRA / QLoRA · Instruction Tuning |
| 분산 학습 | DeepSpeed · NeMo · H100 8-way 클러스터 |
| 추론 최적화 | vLLM · vLLM-fork(HPU) · llama.cpp · Ollama |
| RAG / Agent | LangChain · LangGraph · MCP · A2A |
| RAG 변형 | Vector / Graph / Light / Ensemble RAG |
| 평가 | lm-eval · MMLU · BLEU · A/B 테스트 |
| 도메인 | NLP · Vision · Hyperspectral · STT · NER · 의료 |
인프라 / DevOps
| 컨테이너 | Docker · Docker Compose |
| 오케스트레이션 | Kubernetes · Kubeflow · ArgoCD |
| CI/CD | Jenkins · GitHub Actions · GitOps |
| 데이터/검색 | PostgreSQL · MongoDB · MySQL · OpenSearch |
| 벡터/그래프 | FAISS · Vector DB · Neo4j |
| 메시징/스트림 | Kafka · Spark · Hadoop |
| 스토리지/캐시 | Minio · Redis |
| 모니터링 | Grafana · Prometheus · cAdvisor |
하드웨어 가속기
| NVIDIA | H100 · A100 · RTX 3090 · T4 (CUDA) |
| Intel | Gaudi 2 · Gaudi 3 (Habana SDK · HPU) |
| AMD | ROCm 스택 (GPU + NPU 하이브리드) |
| 양자화 | FP8 (INC) · GGUF · Calibration |
웹 / 응용
| 프론트엔드 | Next.js · Svelte · Three.js · VRM |
| 백엔드 | FastAPI · Flask · WebSocket |
| 음성/멀티모달 | STT · OmniVoice TTS · Blendshape |
| 샌드박싱 | Bubblewrap · Anthropic Sandbox Runtime |