|
不是从 ChatGPT 蒸馏的,但 DeepSeek R1 的确有几个官方蒸馏版。
5 @9 d# Q9 _; E6 ?8 j, N8 c) T7 c
8 ^- m N# X1 _7 W
# f, P) z% U1 I3 a. f4 V. d9 E1 \4 p! P& j3 X
, r4 q. q, S5 `3 x+ M1 h
从 Huggingface 的 DeepSeek R1 主页介绍(https://huggingface.co/deepseek-ai/DeepSeek-R1) 看,主要是结合了通义千问(Qwen,阿里的大模型)或 Llama (羊驼,Meta 的大模型)
& `: z m4 ~' h4 T5 X# a
, S1 r2 {& {+ `从性能上讲,DeepSeek-R1-Distill-Llama-70B 在六项指标中有五项超过 GPT 和 Claude 的同类模型。而这个模型是可以在个人计算机/工作站的本地运行的。(当然,测试不是在 PC Workstation 上做的)。俺在 local 试了一下,除了文言文和作诗不如在线版本外,基本各项功能都不错。 v! q4 s# u6 ^0 g! l: w, e
& k7 M% O$ F) a4 u/ A6 X
|
|