TA的每日心情 | 开心 2020-4-8 10:45 |
|---|
签到天数: 227 天 [LV.7]分神
|
晨枫 发表于 2025-3-19 13:303 A& Z1 O/ X1 P# g5 W
不知道有没有必要弄到那么复杂的份上。& [2 u: K4 {, r& e
1 G O( ^1 @, e, \9 R
战斗机气动控制面只有那么些:襟翼、副翼、前缘襟翼、平尾、方向 ...
& h- z0 j- C% S3 K3 {晨大好。0 E: U" J% k! [& ^; v5 N
4 a, T5 T: R1 I9 [
我说把yolo换成基于多模态大模型的解决方案,其实是简化,而不是复杂化。
8 I' B1 \, Q. S6 @; x" g, {
5 s& l7 N9 c6 v: ^2 ~& z5 @这个问题的关键是在于yolo自身的定位是传统的图像检测分类识别,这个是需要进行监督学习的。而多模态大模型在具备泛化能力的前提下,有推理和理解能力,这个可以在一定程度上采取强化学习甚至是无监督学习的模式。
; N+ h/ l- W5 p$ [/ U" T9 H9 [" u! l2 V$ @3 n
不过这个论文本身应该是远远达不到南华早报说的那个功能强度的。 |
|