#Mamba
2개의 글
AI
Mamba-3: 상태 공간 원리로 시퀀스 모델링을 한 단계 끌어올리다4분Mamba-3는 기존 Mamba-2의 한계(상태 추적 취약, 하드웨어 비효율)를 복소수 SSM, 사다리꼴 이산화, MIMO 세 가지 개선으로 극복해 Transformer보다 빠르고 더 정확한 언어 모델을 구현한 논문입니다.
MambaTransformerAI / LLM
Transformer 없이 언어 모델 만들기 — Mamba(SSM) 완전 정복4분Attention의 O(T²) 병목을 없앤 상태 공간 모델(SSM) Mamba의 핵심 원리를 파헤칩니다. 선택적 상태 공간, 하드웨어 인식 병렬화, 그리고 Transformer와의 성능 비교까지 정리합니다.
AILLM논문리뷰MambaSSM상태공간모델아키텍처딥러닝