技术栈
lfm2.5-1.2b
skywalk8163
3 小时前
llama
·
lfm2.5-1.2b
2026.1月llama.cpp的最新进展:在AIStudio推理Llama-3-8B-Instruct-Coder.Q6_K.gguf模型
先上结论,在AIStudio上cpu推理非常慢,怎么说呢,速度回到了一年前,真不适应这么慢。所以没法在AIStudio上用。
我是有底线的