TA的每日心情 | 怒 2025-8-7 11:56 |
|---|
签到天数: 1132 天 [LV.10]大乘
|
沉宝 发表于 2025-2-22 00:106 q/ @- p) N; G" F+ E1 l, N% }' ~
欢迎讨论。9 ?6 v7 O8 X. m
9 A, }$ V% W4 b) K首先,个人以为KTransformers的最核心最精华的是抓住了DeepSeek模型参数的稀疏性。DeepSeek ... 2 }6 j" H; R- \4 J
刚刚看到一个案例,有个朋友用2686V4 x2 加256GDDR3跑起了671B的Q2.51版本! R" ~# s# `- b0 v4 B2 Q
显卡用的是3070M 16G,环境是Ubuntu 24.04.22 q: C4 Y9 {9 I6 l
输入大概是10不到一点,输出大概是5,勉强可用2 _, n6 C, @2 h& g) ?" D
因为都是整的垃圾配件,总体的成本大概不到4000人民币
0 O& G3 k4 L x3 p6 J4 K
! X9 p1 I& I) k0 h9 \+ {5 H我估计如果他能够用DDR4+至强的话,应该可以到7-8的输出4 g, n7 G( @4 n9 [9 _$ _! w- l
如果是这个速度的话,个人轻量使用已经没有特别大的问题了 |
|