浙江工业大学计算机科学与技术学院（软件学院、人工智能学院）

学术动态

首页/

学术动态/

10月22日南洋理工大学王子为具身智能领域学术报告预告

作者：发布日期：2025-10-21 浏览次数：

报告主题：VLA on Wheels: Empowering Vision-language-action Models for Mobile Manipulation

报告人：王子为

报告时间：2025年10月22日（周三）下午15：00-16：00

报告地址：计算机大楼D501

报告摘要：

视觉-语言-动作（VLA, Vision-Language-Action）模型凭借庞大的参数规模和大规模训练数据，展现出极强的泛化能力与高成功率。然而，在许多实际应用场景中，如家庭服务与仓储管理，机器人需要具备移动操作能力，即在不同位置与物体交互。目前的VLA模型多为固定基座操作设计，因此在移动操作任务中的应用仍然受限。

为赋能VLA模型适用于移动操作，提出了一种高效的适配方法，包括：

1.全身运动规划框架，用于从VLA模型输出中生成理想的操作轨迹；

2.几何场景图表示，用于辅助选择底座停靠点。

该机器人操作系统显著拓展了VLA模型的应用场景，使其能够在需要移动性的任务中高效完成复杂操作。

报告人简介：

王子为老师现为南洋理工大学（NTU）电气与电子工程学院助理教授。加入NTU之前，他曾在卡内基梅隆大学机器人研究所担任博士后研究员。他分别于2023年和2018年获得清华大学自动化系博士学位与物理系学士学位。

他的研究目标是构建面向机器人的基础模型（Foundation Models, FMs），包括将FMs与物理场景对齐（grounding）以及在资源受限的机器人平台上部署FMs。他已在人工智能、机器人学与计算机视觉的顶级期刊与会议上发表50余篇论文，并担任多个国际会议与期刊的常任审稿人。

首页

学院概况

学科建设

科学研究

人才培养

师资队伍

党建和工会

学生工作

学院校友

国际合作

专业认证

实验中心