TA的每日心情 | 开心 2020-4-8 10:45 |
---|
签到天数: 227 天 [LV.7]分神
|
晨枫 发表于 2025-3-19 13:304 d1 G( ~2 D: C; R4 l, d1 k3 W, }
不知道有没有必要弄到那么复杂的份上。3 B8 E+ _6 z+ q
" L! D. `, v- E3 [6 o2 @6 j
战斗机气动控制面只有那么些:襟翼、副翼、前缘襟翼、平尾、方向 ... 6 h4 D( s9 ^! v; R' D
晨大好。0 |( s& b* w. N4 f. y
& e/ n; E+ b' l& d5 l6 e* }
我说把yolo换成基于多模态大模型的解决方案,其实是简化,而不是复杂化。
$ T4 T: c$ r, ]" B6 b3 Z( T" D& P
这个问题的关键是在于yolo自身的定位是传统的图像检测分类识别,这个是需要进行监督学习的。而多模态大模型在具备泛化能力的前提下,有推理和理解能力,这个可以在一定程度上采取强化学习甚至是无监督学习的模式。4 M. L. u, f2 O% a* b
( L$ |- Y8 T& k+ N- e不过这个论文本身应该是远远达不到南华早报说的那个功能强度的。 |
|