| 
 | 10月22日南洋理工大学王子为具身智能领域学术报告预告 
        作者:
        发布日期:2025-10-21
        浏览次数:
         报告主题:VLA on Wheels: Empowering Vision-language-action Models for Mobile Manipulation 报告人:王子为 报告时间:2025年10月22日(周三)下午15:00-16:00 报告地址:计算机大楼D501 
 报告摘要: 视觉-语言-动作(VLA, Vision-Language-Action)模型凭借庞大的参数规模和大规模训练数据,展现出极强的泛化能力与高成功率。然而,在许多实际应用场景中,如家庭服务与仓储管理,机器人需要具备移动操作能力,即在不同位置与物体交互。目前的VLA模型多为固定基座操作设计,因此在移动操作任务中的应用仍然受限。 为赋能VLA模型适用于移动操作,提出了一种高效的适配方法,包括: 1.全身运动规划框架,用于从VLA模型输出中生成理想的操作轨迹; 2.几何场景图表示,用于辅助选择底座停靠点。 该机器人操作系统显著拓展了VLA模型的应用场景,使其能够在需要移动性的任务中高效完成复杂操作。 
 报告人简介: 王子为老师现为南洋理工大学(NTU)电气与电子工程学院助理教授。加入NTU之前,他曾在卡内基梅隆大学机器人研究所担任博士后研究员。他分别于2023年和2018年获得清华大学自动化系博士学位与物理系学士学位。 他的研究目标是构建面向机器人的基础模型(Foundation Models, FMs),包括将FMs与物理场景对齐(grounding)以及在资源受限的机器人平台上部署FMs。他已在人工智能、机器人学与计算机视觉的顶级期刊与会议上发表50余篇论文,并担任多个国际会议与期刊的常任审稿人。 | 



