본문으로 건너뛰기
🐨코알라 오딧세이
🐨
이다운
코알라 오딧세이

새 글 알림 받기

© 2026 이다운

Research & Project Portfolio

이다운 Lee Dawoon

AI / LLM Engineer · Ph.D. Candidate (재학중)

LLM · AI Agent · RAG · MLOps · Inference Optimization

Projects
24+
박사
재학중
기업 납품
5+
논문 리뷰
80+

SECTION · 01 — About Me

LLM 및 AI 에이전트 시스템을 연구·개발하는 AI 엔지니어입니다. 현재 서울시립대학교 박사과정에 재학중이며, 자연어처리 · 이미지 핸들링 · 서비스 모델링을 연구하고 있습니다. 회사에서는 사내 LLMOps 플랫폼 XGEN 출시에 기여했고, 학부 시절부터 5건의 공공기관 연계 R&D 프로젝트에 참여해 도메인 특화 NLP·Vision 모델을 다뤘으며, 현재는 5건의 기업 실무 프로젝트를 통해 RAG · LLMOps · 하드웨어 가속기 검증까지 End-to-End로 수행하고 있습니다.

연구 철학

“모델만 잘 만드는 것이 아니라, 실제 도메인 데이터에서 LLM이 얼마나 신뢰성 있게 작동하는가를 정량적으로 측정하고, 프롬프트 · RAG · 파인튜닝 중 어떤 방법이 가장 효과적인지 비교 검증하는 데 집중해 왔습니다.”

핵심 강점 5가지

1

학계 + 산업계 양쪽 경험

공공 R&D 5건 + 대학원 자체 연구 3건 + 기업 실무 5건의 균형

2

End-to-End 책임 경험

요구사항 정의 → 모델 선정 → 분산 학습 → 평가 자동화 → K8s 배포 → 고객사 납품/현장 지원

3

대안 가속기 검증 능력

Intel Gaudi(HPU), AMD ROCm까지 직접 도입·벤치마크하여 NVIDIA 의존성 완화

4

최신 표준 프로토콜 활용

MCP·A2A 같은 최신 에이전트 통신 프로토콜을 실서비스에 도입

5

지속적인 기술 기록

자체 인프라 블로그 koala.ai.kr에 80여 편의 논문 리뷰와 PoC 결과 공개

SECTION · 03 — 기업 실무 프로젝트 (5건)

01

LLMOps 플랫폼 개발 (사내 XGEN 출시 기여)

회사 핵심 프로덕트

2025.04 ~ 현재 · 진행 중 · Core Engineer

회사가 자사 LLMOps 플랫폼을 갖추기 위해 진행한 회사 핵심 프로젝트로, 출시에 직접 기여. 금융사·방산·커머스 등 다양한 산업군 고객사에 납품 가능한 수준의 통합 LLM 운영 플랫폼.
  • 모델 평가 자동화 — lm-eval 기반 벤치마크 자동화 파이프라인
  • vLLM 서빙 최적화 — 처리량 튜닝, 배치 크기·KV cache 최적화
  • Intel HPU 마이그레이션 및 검증 — vllm-fork 기반 NVIDIA → Gaudi 2/3 포팅, FP8 양자화
  • 대용량 데이터 MLOps — Kafka·Spark·Hadoop 기반 데이터 파이프라인
  • Svelte 관리자 UI 개발
  • World IT Show 2025 부스 시연 연사 + 기업 LLMOps 세미나 연사
vLLMlm-evalNeMoIntel HPUSvelteKafkaSparkMinioRedis

02

E-commerce 챗봇 솔루션 개발

2024.09 ~ 2025.12 · Backend / AI Engineer

Normal RAG / Graph RAG / Light RAG 멀티모달 RAG 아키텍처를 모두 설계·비교. LangGraph 기반 상태 관리로 다중 단계 추론 안정화.
  • 3가지 RAG 아키텍처 비교 (정확도·응답 속도·비용 trade-off)
  • LangGraph 상태 그래프로 다중 도구 호출 워크플로우
  • Next.js + Flask 풀스택 개발
  • Docker / Kubernetes 오케스트레이션 + ArgoCD GitOps 자동 배포
LangChainLangGraphNext.jsPostgreSQLFlaskKubernetesArgoCD

03

이커머스 도메인 적합 LLM 개발 (SFT/DPO)

2024.07 ~ 현재 · 진행 중 · LLM Trainer

SFT/DPO PoC를 통해 도메인 특화 LLM의 본질적 어려움을 직접 경험. 이커머스 성능을 올리면서도 범용 성능 저하를 막는 균형점을 탐구.
  • SFT·DPO 방법론 PoC — 두 가지 학습 기법 효과 비교
  • 선호도 데이터셋 구축 및 품질 관리 (chosen/rejected)
  • H100 8-way 클러스터 운영 + NeMo 분산 학습
  • K8s GPU 리소스 스케줄링
SFTDPODeepSpeedNeMoH100 8-wayPyTorch

04

롯데 홈쇼핑 LLMOps 플랫폼 구축 프로젝트

대형 고객사 납품

2025.09 ~ 현재 · 진행 중 · Solution Engineer

국내 대형 홈쇼핑사 LLMOps 플랫폼 구축 + 도메인 특화 워크플로우. 상품 온톨로지 · 방송 음성 STT · 실시간 방송 심의까지 종합 솔루션.
  • 상품 온톨로지 + RAG QA 자동화 워크플로우
  • 방송 음성 STT 엔진 개발/튜닝
  • 실시간 방송 심의 워크플로우 (금칙어·과대광고 탐지)
  • Jenkins · ArgoCD 배포 자동화
RAGOntologySTT방송 심의JenkinsArgoCD

05

개발 생산성 향상 도구 개발 및 고도화 (사내 TF)

4개 고객사 납품 + 현장 기술 지원

2025.01 ~ 현재 · 진행 중 · Tech Lead

RAG 정확도 고도화부터 MCP·A2A 같은 최신 에이전트 통신 프로토콜을 실서비스에 도입. 4개 고객사 납품 + 현장 기술 지원.
  • OCR 및 복잡 문서 파싱 개선 (RAG 정확도 고도화 기반)
  • OpenSearch 인덱스 + Sparse·Dense 하이브리드 검색
  • MCP·A2A 프로토콜 멀티 에이전트 시스템 통합
  • Next.js + FastAPI + WebSocket 풀스택 개발
LangChainOpenSearchMCPA2AFastAPINext.jsWebSocket

SECTION · 04 — 대학원 자체 연구 (박사과정)

대표 프로젝트(관광 RAG)는 위 SECTION 02 참조.

06

교통 네트워크 자료에 대한 거대언어모형의 프롬프트 설계 방안 및 고찰

2023 하계 자료분석학회 논문 발표

2023.04 ~ 2024.07

교통 네트워크 OD 데이터에 대한 LLM 이해도 평가 + 도메인 특화 Fine-tuning 데이터셋 설계. Zero-shot/Few-shot/CoT 비교 실험으로 정형 시계열 도메인에서 LLM의 한계와 프롬프트 엔지니어링의 효과를 정량 분석.
TransformerFine-tuningPrompt EngineeringCoT

07

Hyperspectral data 분석을 통한 부소산성 인근 위해 식물군 확인

2023.11 ~ 2024.07

드론 촬영 하이퍼스펙트럴 이미지 전처리 + 픽셀 단위 스펙트럼 특징 추출 + CNN 기반 식물 종 분류 및 세그멘테이션. 문화재 인근 위해 외래식물 분포 지도 생성.
PyTorchOpenCVComputer VisionCNNDrone

SECTION · 05 — 공공기관 연계 R&D 프로젝트 (5건)

01

Text-to-Table을 활용한 120다산 콜센터 RPA 방안 연구

2022 동계 자료분석학회 포스터

2022.09 ~ 2022.12 · 다산120콜재단 산학협력 · 연구원

연간 수백만 건 규모의 민원 상담 로그에서 비정형 텍스트를 정형 테이블로 변환. Transformer 기반 정보 추출 + DeepSpeed 분산 학습 + RPA 자동화 영역 도출.
PythonTransformerDeepSpeedHuggingFacePandasRPA

02

경기문화재단 민원 분석 프로젝트

2022.10 ~ 2022.12 · 연구원

민원 데이터 전처리 + 토픽 군집화 + Apriori/FP-Growth 연관규칙 마이닝으로 민원 유형 간 상관관계 분석. NLP 파이프라인 + 시각화 리포트.
PythonTransformerAssociation RuleDeepSpeed

03

환자안전 보고학습시스템 약물 관련 텍스트 자료 분석

2022.10 ~ 2023.01 · 의료기관평가인증원 · 연구원

의료기관 약물 안전사고 보고서에서 약물명·부작용·사고유형 NER + 사고 심각도 분류. 약물-부작용 공출현 분석으로 고위험 약물 식별.
Text MiningNERTransformerDeepSpeed의료 도메인

04

AOP 기반 ITS/IATA 분자 표현학습 모델

환경독성보건학회/한국통계학회 발표 2회

2023.04 ~ 2024.07 · 환경부 R&D · 연구원

생활화학제품 성분·독성 데이터를 대규모 웹 크롤링하고 SMILES 기반 분자 표현학습 모델(GROVER/GROBI)을 파인튜닝하여 AOP 경로별 독성 예측 AI 개발. 컴퓨터과학 + 화학정보학 융합 연구.
PyTorchGROVERGROBIRDKitWeb ScrapingAOP

05

교육콘텐츠 분석을 위한 Instruction-tuned LLM 개발

2023.04 ~ 2024.07 · 연세대학교 / 북아이피스 · 연구원

교육콘텐츠 도메인 특화 Instruction 데이터셋 구축 + LLM Instruction Tuning + 멀티 GPU 분산 학습 환경 운영.
Instruction TuningLoRAQLoRADeepSpeed

SECTION · 06 — 하드웨어 가속기 기술 검증

NVIDIA 의존성을 줄이기 위해 Intel Gaudi(HPU)와 AMD ROCm을 직접 도입·검증.

19

Intel Gaudi 2 / Gaudi 3 HPU 기술 검증

2025.04 ~ 2025.11 · HW 검증 담당

  • vault.habana.ai 기반 Docker 환경 구축 + transformers 4.48.x 호환성 직접 해결
  • HabanaAI/vllm-fork 빌드 + 멀티 카드 Tensor Parallelism
  • Calibration → INC 기반 FP8 양자화 파이프라인
  • optimum-habana 모델 파인튜닝 PoC + 성능 벤치마크
Habana SDKvLLM-forkFP8 Quantizationoptimum-habana

20

AMD NPU / GPU 기술 검증

2025.06 ~ 2025.12 · HW 검증 담당

  • AMD GPU + NPU 하이브리드 환경 + ROCm 스택 구축
  • 프레임워크별 호환성 비교 (vLLM·Ollama·llama.cpp)
  • 양자화·배치 전략 최적화 + 운영 가이드 문서화
ROCmvLLMOllamallama.cpp

SECTION · 07 — 개인 프로젝트

23

개인 블로그 koala.ai.kr 자체 운영

2026.02 ~ 현재 · Solo 인프라/개발 운영자

월 $24의 Contabo VPS에 직접 인프라 구축 (8코어/24GB RAM/400GB SSD). AWS 동급 대비 약 1/10 비용으로 풀스택 인프라 운영.
  • Next.js 15 + FastAPI + SQLite + Docker Compose
  • Nginx + Let's Encrypt SSL 자동 갱신
  • GitHub Actions Self-hosted Runner CI/CD
  • Grafana + Prometheus + cAdvisor 모니터링 직접 구축
  • Neo4j 기반 포스트 지식 그래프 시각화
  • 80여 편의 논문 리뷰 + Anthropic SDK 기반 ChatWidget
Next.js 15FastAPIDockerNginxGrafanaPrometheusNeo4j

24

Autonoma — 자기조직화 에이전트 스웜 플랫폼

2026.04 ~ 현재 · 3D VTuber 시각화 · Solo Developer / Architect

에이전트 군집의 자율 협업 과정을 라이브 캐스트로 관전. Director 에이전트가 목표를 분해하고 전문 에이전트를 스폰·라우팅.
  • Observe-Decide-Act 루프 + 7가지 액션
  • Harness 정책 엔진 — 라우팅·루프 제한·안전 레벨 제어
  • Bubblewrap 샌드박스 — CPU/시간/메모리 격리
  • VRM + Three.js 실시간 캐릭터 렌더링 + 5모음 립싱크
  • OmniVoice 제로샷 음성 클로닝 TTS
  • 터미널 TUI / 2D 픽셀 HUD / 3D VTuber / OBS 크로마키 4가지 시청 모드
PythonFastAPIWebSocketThree.js / VRMOmniVoice TTSBubblewrap

25

arxiv-graph — arXiv 논문 지식 그래프 자동 구축기

2026.04 · Solo Developer

매일 cs.CL/cs.LG/cs.AI 카테고리 arXiv 논문 수집 + 시맨틱 유사도 + 공저자 관계로 지식 그래프 자동 구축. PageRank + 최신성 + 인용수 복합 점수로 영향력 정량화.
  • all-MiniLM-L6-v2 임베딩 (384차원, ~90MB)
  • 코사인 유사도 0.75 임계값 + 공저자 가중치
  • 복합 점수 = 0.3 × recency + 0.4 × citations + 0.3 × pagerank
  • APScheduler 매일 06:00 UTC 자동 실행
Python 3.12sentence-transformersnetworkxscikit-learnAPScheduler

26

UASEF — 의료 LLM 에이전트 안전 에스컬레이션 프레임워크

2026.03 ~ 현재 · 논문 PoC · Solo Researcher

LLM 에이전트가 스스로 판단하기에 너무 불확실한 순간을 통계적으로 보장된 방식으로 감지하고 인간 전문가에게 에스컬레이션. Conformal Prediction 기반 3개 모듈.
  • UQM — Conformal Prediction 비적합 점수 (logprob/self-consistency)
  • RTC — 전문과목별 위험 온톨로지 임계값 동적 조정
  • EDE — 3가지 트리거 (불확실성·고위험 행동·근거 부재) 결합
  • Weighted CP (Tibshirani 2019) + MIMIC-III calibration
  • Pareto Sweep + 자동 α 권고 (specialty별 최적값 추천)
Conformal PredictionLangGraphWeighted CPMedQAMIMIC-III

SECTION · 08 — 학회 발표 · 수상 · 대외활동

학회 발표 / 수상

연도활동
2025UBAI 연구역량 강화 프로그램 우수상
2023하계 자료분석학회 논문 발표
2023환경독성보건학회 / 한국통계학회 발표 (2회)
2022동계 자료분석학회 학술발표대회 포스터

대외 연사 활동

연도행사
2025.04World IT Show 2025 부스 연사
2025.11기업 대상 LLMOps 세미나 연사

블로그 운영 — 자체 운영 블로그 koala.ai.kr에 80여 편의 논문 리뷰와 PoC 결과를 공개. 주요 시리즈: Transformer · LLM · AI Agent · 추론 최적화 · 딥페이크 탐지 · ASR · AI 가속기.

SECTION · 09 — 기술 스택 종합

AI / ML / LLM

언어 모델Transformer · BERT · GPT · Llama · Qwen · Gemma · EXAONE
학습 기법SFT · DPO · LoRA / QLoRA · Instruction Tuning
분산 학습DeepSpeed · NeMo · H100 8-way 클러스터
추론 최적화vLLM · vLLM-fork(HPU) · llama.cpp · Ollama
RAG / AgentLangChain · LangGraph · MCP · A2A
RAG 변형Vector / Graph / Light / Ensemble RAG
평가lm-eval · MMLU · BLEU · A/B 테스트
도메인NLP · Vision · Hyperspectral · STT · NER · 의료

인프라 / DevOps

컨테이너Docker · Docker Compose
오케스트레이션Kubernetes · Kubeflow · ArgoCD
CI/CDJenkins · GitHub Actions · GitOps
데이터/검색PostgreSQL · MongoDB · MySQL · OpenSearch
벡터/그래프FAISS · Vector DB · Neo4j
메시징/스트림Kafka · Spark · Hadoop
스토리지/캐시Minio · Redis
모니터링Grafana · Prometheus · cAdvisor

하드웨어 가속기

NVIDIAH100 · A100 · RTX 3090 · T4 (CUDA)
IntelGaudi 2 · Gaudi 3 (Habana SDK · HPU)
AMDROCm 스택 (GPU + NPU 하이브리드)
양자화FP8 (INC) · GGUF · Calibration

웹 / 응용

프론트엔드Next.js · Svelte · Three.js · VRM
백엔드FastAPI · Flask · WebSocket
음성/멀티모달STT · OmniVoice TTS · Blendshape
샌드박싱Bubblewrap · Anthropic Sandbox Runtime

이다운 · AI / LLM Engineer · Ph.D. Candidate

koala.ai.kr · 2026