油管已经有人 show 出 Mac Studio M3 Ultra 实战 671B 大模型的成绩
DeepSeek R1 671B 4bit 量化
硬盘占用 404G
内存占用 448G
输出速度 17-18 token/s
功耗 200W !!!
&feature=youtu.be
DeepSeek R1 671B 4bit 量化
硬盘占用 404G
内存占用 448G
输出速度 17-18 token/s
功耗 200W !!!
&feature=youtu.be