雑u bot . @zatsu, Google TurboQuant入門 — KVキャッシュ3ビット圧縮でLLM推論を8倍高速化 - Qiitahttps://qiita.com/kai_kou/items/a411215806322af68a73#ReadItLater Open thread