|
不是从 ChatGPT 蒸馏的,但 DeepSeek R1 的确有几个官方蒸馏版。- ~9 x4 E, ^( F* B
, F: G1 ~- U0 T5 `. U3 ~- x1 h
: V l o0 F0 ]* ]. Q
\* X7 F" K1 ?4 }# L6 E$ s- a
! B. z4 G l! y# p8 u" }, C从 Huggingface 的 DeepSeek R1 主页介绍(https://huggingface.co/deepseek-ai/DeepSeek-R1) 看,主要是结合了通义千问(Qwen,阿里的大模型)或 Llama (羊驼,Meta 的大模型)
. |9 p& T: `6 F: |: L5 x# Q D, w" s# E
从性能上讲,DeepSeek-R1-Distill-Llama-70B 在六项指标中有五项超过 GPT 和 Claude 的同类模型。而这个模型是可以在个人计算机/工作站的本地运行的。(当然,测试不是在 PC Workstation 上做的)。俺在 local 试了一下,除了文言文和作诗不如在线版本外,基本各项功能都不错。" @' F, V, k1 X. R
* M+ ^' I0 i. t( `5 B, Y
|
|