Research & Project Portfolio

이다운 Lee Dawoon

AI / LLM Engineer · Ph.D. Candidate (재학중)

LLM · AI Agent · RAG · MLOps · Inference Optimization

Projects

24+

박사

재학중

기업 납품

논문 리뷰

80+

SECTION · 01 — About Me

LLM 및 AI 에이전트 시스템을 연구·개발하는 AI 엔지니어입니다. 현재 서울시립대학교 박사과정에 재학중이며, 자연어처리 · 이미지 핸들링 · 서비스 모델링을 연구하고 있습니다. 회사에서는 사내 LLMOps 플랫폼 XGEN 출시에 기여했고, 학부 시절부터 5건의 공공기관 연계 R&D 프로젝트에 참여해 도메인 특화 NLP·Vision 모델을 다뤘으며, 현재는 5건의 기업 실무 프로젝트를 통해 RAG · LLMOps · 하드웨어 가속기 검증까지 End-to-End로 수행하고 있습니다.

연구 철학

“모델만 잘 만드는 것이 아니라, 실제 도메인 데이터에서 LLM이 얼마나 신뢰성 있게 작동하는가를 정량적으로 측정하고, 프롬프트 · RAG · 파인튜닝 중 어떤 방법이 가장 효과적인지 비교 검증하는 데 집중해 왔습니다.”

핵심 강점 5가지

학계 + 산업계 양쪽 경험

공공 R&D 5건 + 대학원 자체 연구 3건 + 기업 실무 5건의 균형

End-to-End 책임 경험

요구사항 정의 → 모델 선정 → 분산 학습 → 평가 자동화 → K8s 배포 → 고객사 납품/현장 지원

대안 가속기 검증 능력

Intel Gaudi(HPU), AMD ROCm까지 직접 도입·벤치마크하여 NVIDIA 의존성 완화

최신 표준 프로토콜 활용

MCP·A2A 같은 최신 에이전트 통신 프로토콜을 실서비스에 도입

지속적인 기술 기록

자체 인프라 블로그 koala.ai.kr에 80여 편의 논문 리뷰와 PoC 결과 공개

SECTION · 02 — 대표 프로젝트

★ UBAI 우수상 수상 · 2025

관광 활성화를 위한 거대 언어 모델 및 RAG 파이프라인 구축 연구

서울시립대학교 대학원생 연구역량 강화 프로그램 · 2025.02 ~ 2025.07 · Lead Researcher (개인 연구)

일본인 관광객이 현장에서 직접 활용할 수 있는 온디바이스 환경의 다국어 관광 안내 AI가 목표. 4B 이하 소형 모델로 한국어 문서를 정확히 일본어로 답변하는 시스템 구현 + 4가지 RAG 변형(Vector/Graph/Light/Ensemble) 직접 설계·비교.

RAG 정량 평가 결과

시스템	관련성	충실도	응답시간
EnsembleRAG ✓	62.2%	43.4%	9.1초
LightRAG	58.0%	44.6%	~9.2초
GraphRAG	57.0%	44.6%	~9.2초
VectorRAG	57.8%	42.0%	~9.2초

단일 시스템 대비

+4.4%p

온디바이스 메모리

36GB

평균 응답

9.1s

오류율

Qwen3-4BvLLMLangChainFAISSVector RAGGraph RAGLight RAGEnsemble RAGOn-device

SECTION · 03 — 기업 실무 프로젝트 (5건)

LLMOps 플랫폼 개발 (사내 XGEN 출시 기여)

★ 회사 핵심 프로덕트

2025.04 ~ 현재 · 진행 중 · Core Engineer

회사가 자사 LLMOps 플랫폼을 갖추기 위해 진행한 회사 핵심 프로젝트로, 출시에 직접 기여. 금융사·방산·커머스 등 다양한 산업군 고객사에 납품 가능한 수준의 통합 LLM 운영 플랫폼.

모델 평가 자동화 — lm-eval 기반 벤치마크 자동화 파이프라인
vLLM 서빙 최적화 — 처리량 튜닝, 배치 크기·KV cache 최적화
Intel HPU 마이그레이션 및 검증 — vllm-fork 기반 NVIDIA → Gaudi 2/3 포팅, FP8 양자화
대용량 데이터 MLOps — Kafka·Spark·Hadoop 기반 데이터 파이프라인
Svelte 관리자 UI 개발
World IT Show 2025 부스 시연 연사 + 기업 LLMOps 세미나 연사

vLLMlm-evalNeMoIntel HPUSvelteKafkaSparkMinioRedis

E-commerce 챗봇 솔루션 개발

2024.09 ~ 2025.12 · Backend / AI Engineer

Normal RAG / Graph RAG / Light RAG 멀티모달 RAG 아키텍처를 모두 설계·비교. LangGraph 기반 상태 관리로 다중 단계 추론 안정화.

3가지 RAG 아키텍처 비교 (정확도·응답 속도·비용 trade-off)
LangGraph 상태 그래프로 다중 도구 호출 워크플로우
Next.js + Flask 풀스택 개발
Docker / Kubernetes 오케스트레이션 + ArgoCD GitOps 자동 배포

LangChainLangGraphNext.jsPostgreSQLFlaskKubernetesArgoCD

이커머스 도메인 적합 LLM 개발 (SFT/DPO)

2024.07 ~ 현재 · 진행 중 · LLM Trainer

SFT/DPO PoC를 통해 도메인 특화 LLM의 본질적 어려움을 직접 경험. 이커머스 성능을 올리면서도 범용 성능 저하를 막는 균형점을 탐구.

SFT·DPO 방법론 PoC — 두 가지 학습 기법 효과 비교
선호도 데이터셋 구축 및 품질 관리 (chosen/rejected)
H100 8-way 클러스터 운영 + NeMo 분산 학습
K8s GPU 리소스 스케줄링

SFTDPODeepSpeedNeMoH100 8-wayPyTorch

롯데 홈쇼핑 LLMOps 플랫폼 구축 프로젝트

★ 대형 고객사 납품

2025.09 ~ 현재 · 진행 중 · Solution Engineer

국내 대형 홈쇼핑사 LLMOps 플랫폼 구축 + 도메인 특화 워크플로우. 상품 온톨로지 · 방송 음성 STT · 실시간 방송 심의까지 종합 솔루션.

상품 온톨로지 + RAG QA 자동화 워크플로우
방송 음성 STT 엔진 개발/튜닝
실시간 방송 심의 워크플로우 (금칙어·과대광고 탐지)
Jenkins · ArgoCD 배포 자동화

RAGOntologySTT방송 심의JenkinsArgoCD

개발 생산성 향상 도구 개발 및 고도화 (사내 TF)

★ 4개 고객사 납품 + 현장 기술 지원

2025.01 ~ 현재 · 진행 중 · Tech Lead

RAG 정확도 고도화부터 MCP·A2A 같은 최신 에이전트 통신 프로토콜을 실서비스에 도입. 4개 고객사 납품 + 현장 기술 지원.

OCR 및 복잡 문서 파싱 개선 (RAG 정확도 고도화 기반)
OpenSearch 인덱스 + Sparse·Dense 하이브리드 검색
MCP·A2A 프로토콜 멀티 에이전트 시스템 통합
Next.js + FastAPI + WebSocket 풀스택 개발

LangChainOpenSearchMCPA2AFastAPINext.jsWebSocket

SECTION · 04 — 대학원 자체 연구 (박사과정)

대표 프로젝트(관광 RAG)는 위 SECTION 02 참조.

교통 네트워크 자료에 대한 거대언어모형의 프롬프트 설계 방안 및 고찰

★ 2023 하계 자료분석학회 논문 발표

2023.04 ~ 2024.07

교통 네트워크 OD 데이터에 대한 LLM 이해도 평가 + 도메인 특화 Fine-tuning 데이터셋 설계. Zero-shot/Few-shot/CoT 비교 실험으로 정형 시계열 도메인에서 LLM의 한계와 프롬프트 엔지니어링의 효과를 정량 분석.

TransformerFine-tuningPrompt EngineeringCoT

Hyperspectral data 분석을 통한 부소산성 인근 위해 식물군 확인

2023.11 ~ 2024.07

드론 촬영 하이퍼스펙트럴 이미지 전처리 + 픽셀 단위 스펙트럼 특징 추출 + CNN 기반 식물 종 분류 및 세그멘테이션. 문화재 인근 위해 외래식물 분포 지도 생성.

PyTorchOpenCVComputer VisionCNNDrone

SECTION · 05 — 공공기관 연계 R&D 프로젝트 (5건)

Text-to-Table을 활용한 120다산 콜센터 RPA 방안 연구

★ 2022 동계 자료분석학회 포스터

2022.09 ~ 2022.12 · 다산120콜재단 산학협력 · 연구원

연간 수백만 건 규모의 민원 상담 로그에서 비정형 텍스트를 정형 테이블로 변환. Transformer 기반 정보 추출 + DeepSpeed 분산 학습 + RPA 자동화 영역 도출.

PythonTransformerDeepSpeedHuggingFacePandasRPA

경기문화재단 민원 분석 프로젝트

2022.10 ~ 2022.12 · 연구원

민원 데이터 전처리 + 토픽 군집화 + Apriori/FP-Growth 연관규칙 마이닝으로 민원 유형 간 상관관계 분석. NLP 파이프라인 + 시각화 리포트.

PythonTransformerAssociation RuleDeepSpeed

환자안전 보고학습시스템 약물 관련 텍스트 자료 분석

2022.10 ~ 2023.01 · 의료기관평가인증원 · 연구원

의료기관 약물 안전사고 보고서에서 약물명·부작용·사고유형 NER + 사고 심각도 분류. 약물-부작용 공출현 분석으로 고위험 약물 식별.

Text MiningNERTransformerDeepSpeed의료 도메인

AOP 기반 ITS/IATA 분자 표현학습 모델

★ 환경독성보건학회/한국통계학회 발표 2회

2023.04 ~ 2024.07 · 환경부 R&D · 연구원

생활화학제품 성분·독성 데이터를 대규모 웹 크롤링하고 SMILES 기반 분자 표현학습 모델(GROVER/GROBI)을 파인튜닝하여 AOP 경로별 독성 예측 AI 개발. 컴퓨터과학 + 화학정보학 융합 연구.

PyTorchGROVERGROBIRDKitWeb ScrapingAOP

교육콘텐츠 분석을 위한 Instruction-tuned LLM 개발

2023.04 ~ 2024.07 · 연세대학교 / 북아이피스 · 연구원

교육콘텐츠 도메인 특화 Instruction 데이터셋 구축 + LLM Instruction Tuning + 멀티 GPU 분산 학습 환경 운영.

Instruction TuningLoRAQLoRADeepSpeed

SECTION · 06 — 하드웨어 가속기 기술 검증

NVIDIA 의존성을 줄이기 위해 Intel Gaudi(HPU)와 AMD ROCm을 직접 도입·검증.

Intel Gaudi 2 / Gaudi 3 HPU 기술 검증

2025.04 ~ 2025.11 · HW 검증 담당

vault.habana.ai 기반 Docker 환경 구축 + transformers 4.48.x 호환성 직접 해결
HabanaAI/vllm-fork 빌드 + 멀티 카드 Tensor Parallelism
Calibration → INC 기반 FP8 양자화 파이프라인
optimum-habana 모델 파인튜닝 PoC + 성능 벤치마크

Habana SDKvLLM-forkFP8 Quantizationoptimum-habana

AMD NPU / GPU 기술 검증

2025.06 ~ 2025.12 · HW 검증 담당

AMD GPU + NPU 하이브리드 환경 + ROCm 스택 구축
프레임워크별 호환성 비교 (vLLM·Ollama·llama.cpp)
양자화·배치 전략 최적화 + 운영 가이드 문서화

ROCmvLLMOllamallama.cpp

SECTION · 07 — 개인 프로젝트

개인 블로그 koala.ai.kr 자체 운영

2026.02 ~ 현재 · Solo 인프라/개발 운영자

월 $24의 Contabo VPS에 직접 인프라 구축 (8코어/24GB RAM/400GB SSD). AWS 동급 대비 약 1/10 비용으로 풀스택 인프라 운영.

Next.js 15 + FastAPI + SQLite + Docker Compose
Nginx + Let's Encrypt SSL 자동 갱신
GitHub Actions Self-hosted Runner CI/CD
Grafana + Prometheus + cAdvisor 모니터링 직접 구축
Neo4j 기반 포스트 지식 그래프 시각화
80여 편의 논문 리뷰 + Anthropic SDK 기반 ChatWidget

Next.js 15FastAPIDockerNginxGrafanaPrometheusNeo4j

Autonoma — 자기조직화 에이전트 스웜 플랫폼

2026.04 ~ 현재 · 3D VTuber 시각화 · Solo Developer / Architect

에이전트 군집의 자율 협업 과정을 라이브 캐스트로 관전. Director 에이전트가 목표를 분해하고 전문 에이전트를 스폰·라우팅.

Observe-Decide-Act 루프 + 7가지 액션
Harness 정책 엔진 — 라우팅·루프 제한·안전 레벨 제어
Bubblewrap 샌드박스 — CPU/시간/메모리 격리
VRM + Three.js 실시간 캐릭터 렌더링 + 5모음 립싱크
OmniVoice 제로샷 음성 클로닝 TTS
터미널 TUI / 2D 픽셀 HUD / 3D VTuber / OBS 크로마키 4가지 시청 모드

PythonFastAPIWebSocketThree.js / VRMOmniVoice TTSBubblewrap

arxiv-graph — arXiv 논문 지식 그래프 자동 구축기

2026.04 · Solo Developer

매일 cs.CL/cs.LG/cs.AI 카테고리 arXiv 논문 수집 + 시맨틱 유사도 + 공저자 관계로 지식 그래프 자동 구축. PageRank + 최신성 + 인용수 복합 점수로 영향력 정량화.

all-MiniLM-L6-v2 임베딩 (384차원, ~90MB)
코사인 유사도 0.75 임계값 + 공저자 가중치
복합 점수 = 0.3 × recency + 0.4 × citations + 0.3 × pagerank
APScheduler 매일 06:00 UTC 자동 실행

Python 3.12sentence-transformersnetworkxscikit-learnAPScheduler

UASEF — 의료 LLM 에이전트 안전 에스컬레이션 프레임워크

2026.03 ~ 현재 · 논문 PoC · Solo Researcher

LLM 에이전트가 스스로 판단하기에 너무 불확실한 순간을 통계적으로 보장된 방식으로 감지하고 인간 전문가에게 에스컬레이션. Conformal Prediction 기반 3개 모듈.

UQM — Conformal Prediction 비적합 점수 (logprob/self-consistency)
RTC — 전문과목별 위험 온톨로지 임계값 동적 조정
EDE — 3가지 트리거 (불확실성·고위험 행동·근거 부재) 결합
Weighted CP (Tibshirani 2019) + MIMIC-III calibration
Pareto Sweep + 자동 α 권고 (specialty별 최적값 추천)

Conformal PredictionLangGraphWeighted CPMedQAMIMIC-III

SECTION · 08 — 학회 발표 · 수상 · 대외활동

학회 발표 / 수상

연도	활동	내용
2025	UBAI 연구역량 강화 프로그램 우수상	관광 활성화를 위한 거대 언어 모델 및 RAG 파이프라인 구축 연구
2023	하계 자료분석학회 논문 발표	교통 네트워크 자료에 대한 거대언어모형의 프롬프트 설계
2023	환경독성보건학회 / 한국통계학회 발표 (2회)	AOP 기반 ITS/IATA 분자 표현학습 모델
2022	동계 자료분석학회 학술발표대회 포스터	Text-to-Table 활용 120다산 콜센터 RPA 방안 연구

대외 연사 활동

연도	행사	발표 주제
2025.04	World IT Show 2025 부스 연사	엔터프라이즈 챗봇 및 코드 어시스턴트 솔루션의 아키텍처와 적용 사례
2025.11	기업 대상 LLMOps 세미나 연사	LLMOps 플랫폼 구축 전략과 실제 운영 사례

블로그 운영 — 자체 운영 블로그 koala.ai.kr에 80여 편의 논문 리뷰와 PoC 결과를 공개. 주요 시리즈: Transformer · LLM · AI Agent · 추론 최적화 · 딥페이크 탐지 · ASR · AI 가속기.

SECTION · 09 — 기술 스택 종합

AI / ML / LLM

언어 모델	Transformer · BERT · GPT · Llama · Qwen · Gemma · EXAONE
학습 기법	SFT · DPO · LoRA / QLoRA · Instruction Tuning
분산 학습	DeepSpeed · NeMo · H100 8-way 클러스터
추론 최적화	vLLM · vLLM-fork(HPU) · llama.cpp · Ollama
RAG / Agent	LangChain · LangGraph · MCP · A2A
RAG 변형	Vector / Graph / Light / Ensemble RAG
평가	lm-eval · MMLU · BLEU · A/B 테스트
도메인	NLP · Vision · Hyperspectral · STT · NER · 의료

인프라 / DevOps

컨테이너	Docker · Docker Compose
오케스트레이션	Kubernetes · Kubeflow · ArgoCD
CI/CD	Jenkins · GitHub Actions · GitOps
데이터/검색	PostgreSQL · MongoDB · MySQL · OpenSearch
벡터/그래프	FAISS · Vector DB · Neo4j
메시징/스트림	Kafka · Spark · Hadoop
스토리지/캐시	Minio · Redis
모니터링	Grafana · Prometheus · cAdvisor

하드웨어 가속기

NVIDIA	H100 · A100 · RTX 3090 · T4 (CUDA)
Intel	Gaudi 2 · Gaudi 3 (Habana SDK · HPU)
AMD	ROCm 스택 (GPU + NPU 하이브리드)
양자화	FP8 (INC) · GGUF · Calibration

웹 / 응용

프론트엔드	Next.js · Svelte · Three.js · VRM
백엔드	FastAPI · Flask · WebSocket
음성/멀티모달	STT · OmniVoice TTS · Blendshape
샌드박싱	Bubblewrap · Anthropic Sandbox Runtime