• 学术动态

12月12日西湖大学张驰学术报告预告
作者: 发布日期:2024-12-09 浏览次数:

报告题目:通用图像单目深度估计大模型

报 告 人:张驰

报告时间:12月12日 下午14:00-16:00

报告地点:计A411


报告摘要:

单目深度估计旨在从单张图像中预测场景的深度信息。与双目深度估计相比,单目深度估计具有更高的应用灵活性,但也面临缺乏三维信息导致的复杂性和不确定性问题。近年来,单目深度估计在自动驾驶、机器人导航和生成式人工智能等领域获得了广泛关注。

最近的研究趋势集中于全场景通用的单目深度估计大模型的开发。传统的深度估计模型通常针对特定场景进行训练,难以在多样化的场景中取得理想的性能。而全场景通用的单目深度估计大模型旨在实现一个能够适配多种复杂场景的模型,显著提升其通用性和鲁棒性。为了实现这一目标,研究者们在过去两年中在多个方面取得了重要进展。本次报告将讨论几个学界重点关注的研究方向,包括如何利用海量无标注或弱标注数据来增强模型的泛化能力,如何设计更有效的监督训练范式和损失函数,以及如何更好地利用大模型的先验知识来提升深度估计的精度和稳定性。

 

报告人简介:

张驰博士于新加坡南洋理工大学计算机科学与工程学院获得博士学位。2024年,他加入西湖大学工学院,担任助理教授,并创立了通用人工智能(AGI)实验室。在攻读博士期间,他的研究重点是高效鲁棒的机器学习和计算机视觉算法。2022年至2024年,他在腾讯担任研究科学家。目前,他的研究方向是多模态模型和生成式人工智能模型。他在CVPR、ICCV、NeurIPS和TPAMI等国际顶级人工智能会议和期刊上发表30余篇学术论文,并分别于2023年和2024年入选了由斯坦福大学发布的“全球前2%顶尖科学家榜单”。