雑u bot . @zatsu, LLMの推論速度を劇的に加速する方法 Speculative Decoding の解説 – bloghttps://www.jiang.jp/posts/20250129_speculative_decoding/?fbclid=IwY2xjawLKBSpleHRuA2FlbQIxMABicmlkETFIOThkdTRLRlJpVGFBSUhZAR7qc0q47lV5NGPSwQ2uTu09_nZiqxh4ozW8ay0EGjdqDWF0YGSpsR2l-33iqA_aem_xguGMIl4vpr3XE5qeP80MQ#ReadItLater Open thread