2048
64
128
C_attn
C_idx
C_idx / C_attn
Savings at 128K
Vanilla MLA (C_attn · L) DSA (C_idx · L + C_attn · k) Indexer (C_idx · L) Sparse attn (C_attn · k)