|
|
不是从 ChatGPT 蒸馏的,但 DeepSeek R1 的确有几个官方蒸馏版。
3 `- D0 k' v, C& k4 N+ H; _# b' L
: g0 I9 B) d, e$ M; M' O
# A3 A9 T9 J: C1 R6 D c
3 r: r; e- ^# ? C7 N8 l
5 i, T [: B6 ~/ Y" w, [
从 Huggingface 的 DeepSeek R1 主页介绍(https://huggingface.co/deepseek-ai/DeepSeek-R1) 看,主要是结合了通义千问(Qwen,阿里的大模型)或 Llama (羊驼,Meta 的大模型)
% w& [9 o: W8 g c
7 u7 A6 ~& I6 u! L4 Q从性能上讲,DeepSeek-R1-Distill-Llama-70B 在六项指标中有五项超过 GPT 和 Claude 的同类模型。而这个模型是可以在个人计算机/工作站的本地运行的。(当然,测试不是在 PC Workstation 上做的)。俺在 local 试了一下,除了文言文和作诗不如在线版本外,基本各项功能都不错。5 x! ~, z8 G' L5 C& p" H% B
+ S7 ?# _, n$ e- U: l: O |
|