|
|
大黑蚊子 发表于 2025-2-21 14:10
( V+ s5 t) B9 b7 m/ a我建议你再看一下KTransformers的相关资料, ^ i5 I' `5 [1 C" I# m
这个玩意儿的本质是在低并发(甚至是单并发)的情况下,高度依 ...
0 @$ c$ x% p+ |8 ?8 m欢迎讨论。4 R _6 X9 ?5 [) ]5 k* N
4 z: j% I3 [, k, s
首先,个人以为KTransformers的最核心最精华的是抓住了DeepSeek模型参数的稀疏性。DeepSeek是基于MoE的,回答某一个具体问题时只有部分参数高度活跃。KTransformers可以动态调度,把这部分高强度计算交给GPU(好钢用在刀刃上),剩下的则由CPU完成。所以CPU部分对系统整体性能的影响不如GPU大。作为佐证,上一帖我提到了章明星团队在几次版本迭代更新之后才把amx加速添加上去。
; q; _* m, H1 y* @( p( M# j# z( C" \! Y, w8 j+ [1 }# x$ O
CPU/DRAM带宽对系统性能的影响不是简单线性的。老实说,我没有咱们现在讨论的这样大的系统的实际经验。我只能根据在台式机上看到的现象做一些外推。Intel的12代和13代同时支持DDR4和DDR5,DDR5内存下整体成绩要比DDR4好一些,不过差距并不大。至于到显卡的带宽,我也可以说一点。我们知道目前大部分显卡的插座都是PCIe×16。外置显卡时,因为各种原因往往不做16路通道,比方说仅仅实现了8位通道。那么这个PCIe×8的显卡游戏性能下降多少呢?绝对在30%以内,常常也就10-20%。7 p# f7 t, r( ?5 e- w
& L9 e; I/ _9 A7 s6 H# r! a
以上这些是我没有简单照搬章明星团队的配置,而为省钱做了一些变更的原因。 |
|