- 32
- 评论
- 收藏
当AI学会触类旁通:上海市政协委员徐立详解商汤日日新V6
来源:政协联线 | 2025-04-14 17:05
字号


图片来源:商汤科技
今年,“具身智能”首次写入《政府工作报告》中,人形机器人何时能进入家庭、如何在创新场景应用成为关注焦点。与大语言模型等人工智能形态相比,具身智能意味着什么?为我们勾勒出怎样的未来图景?
具身智能,赋予人工智能物理载体,让其像人一样拥有感知、学习和与环境动态交互的能力。通俗地说,把大模型和机器人结合在一起,就形成了具身智能。
近年来,得益于人工智能大模型的出现与不断迭代,具身智能取得了飞速进步,成为新一波人工智能浪潮的重点方向。
在这场全球竞速中,上海既有大手笔的魄力,亦有久久为功的定力。去年,上海人工智能产业规模突破4500亿元,累计完成60款生成式AI大模型备案。根据《关于人工智能“模塑申城”的实施方案》,到今年底,要构筑起一个覆盖算力、语料、模型、应用等层面,“四梁八柱”齐全且坚实的世界级人工智能产业生态。
4月10日,商汤科技举办2025技术交流日活动,重磅推出全新升级的“日日新SenseNova V6”大模型体系,通过多模态长思维链训练、全局记忆、强化学习的技术突破,形成领先的多模态推理能力,并突破成本边界。
多模态大模型可以成为机器人的大脑和眼睛,增强感知能力,像人一样进行深入思考和自然表达,还有更强的记忆力。基于SenseNova V6 Omni,傅利叶的机器人可以通过融合图像、视频、语音和文本信息理解环境,进行思考与表达,洞察用户的需求与情绪,与人类进行交互。机器人在输出语音的同时,还能同步生成与语义相匹配的动作,实现语言与行为的统一。
“商汤自研技术可将视觉信息、听觉信息、语言信息和时间轴逻辑进行对齐,形成多模态统一时序表征。”上海市政协委员,商汤科技董事长兼首席执行官徐立表示,“在此基础上通过细粒度级联信息压缩和内容敏感的动态过滤,实现长视频的高比例压缩,10分钟视频可以压缩到16K tokens,仍然保留关键语义。”
“从人类学习的路径来讲,即使知识的含量一样,多模态的学习方式效率也会更高。”徐立说,“当AI聚集了人类现有的大量平均水平的知识之后,它就能够运用触类旁通的能力,为开放问题形成一种真正意义上的确定性,完成从模型到客户使用的‘最后一公里’。”
通过与商汤的合作,傅利叶GRx实现了更生动、更智能的人机互动体验,显著增强了其在导览咨询、医疗康复、教育培训等多样化应用场景中的表现。伴随大模型技术的进步与演进,GRx将完成更多元任务的能力,加速人形机器人更广泛地融入日常生活,为用户提供智能化、个性化和多元化的服务体验。
“AI之道,在于百姓之日用。”徐立表示,“商汤日日新V6将跨越多模态边界,释放推理与智能的无限可能。”
责任编辑:张希喆

- 32
- 评论
- 收藏
相关推荐