第1186章 批评和进展(1 / 2)
“陈总,我说一个我们团队的例子。
上半年我们投入了很多资源去开发一个超高擬真度的极端场景模擬器,目標是復现一些现实中极难遇到的corner case(极端情况)。
想法是好的,但实际开发过程中发现,对算力需求极大,构建成本很高,而且生成的场景在多样性上还是有限制。
反观另一个小组,他们聚焦优化现有的仿真场景库,引入了更多真实路采数据转化的场景,虽然单个场景的擬真度没那么炫酷,但对模型训练的效率和效果提升非常显著。
回头看,我们那个『高大上』的项目,投入產出比可能確实不如后者。”
陈默认真地听著,追问了一句:
“那么,现在那个超高擬真度项目状態如何?后续计划是什么?”
负责人回答:
“我们已经暂停了进一步的大规模投入,转向研究如何將其中部分技术,比如更精细的传感器物理模擬,拆解应用到现有仿真平台中,提升整体保真度,而不是追求单个场景的极致。”
“嗯,及时调整方向,把资源用在刀刃上,这个决策是对的。”陈默肯定了这种反思和调整。
这时,首席算法专家顾南舟也举了举手,他虽然年轻,但在技术上有一种纯粹的执著:
“陈总,我觉得在模型叠代上,我们有时候过於追求刷榜了。
(指在公开数据集上取得更高排名)
为了在某个榜单上提升零点几个百分点,可能会耗费团队几周的时间去调参和集成。
但这些提升,很多时候在真实路测中感受並不明显,甚至可能因为过擬合导致在未知场景下表现更差。
我觉得,我们的评价標准,应该更贴近实际用户体验和系统整体表现,而不是单纯的榜单分数。”
“说得好!”陈奇惊立刻表示赞同。
“这就是典型的『过程』和『结果』错位。
我们优化的是榜单分数这个『过程指標』,但真正的『结果』应该是路上开得更好、更安全。
我建议,以后模型叠代的评价,权重应该向大规模影子模式测试、闭环仿真测试和关键场景通过率倾斜,降低公开数据集刷榜的权重。”
李鹏飞也深有感触:
“南舟和奇惊提到了一个关键点。
我们做研究出身的人,容易陷入对单项技术指標的极致追求。
但在工程化、產品化的过程中,必须要有系统思维和用户视角。
一个单项99.9%优秀的模块,如果与其他模块协同不好,可能最终系统表现还不如一个各项都95分但协同顺畅的方案。
我们的『结果』,最终要体现在整车智能驾驶系统的综合体验和安全性能上。”
討论再次深入。
大家结合具体项目,反思了是否存在为了追求技术先进性而偏离用户真实需求的情况,是否存在为了满足內部考核指標而做了“偽工作”的现象。
↑返回顶部↑