搜索网站、位置和人员
王东林博士
Donglin Wang, Ph.D.
机器智能实验室
王东林博士
Donglin Wang, Ph.D.
机器智能实验室
“简简单单做人,全心全意科研。希望能为西湖大学的崛起和腾飞贡献自己的一份力量。期待西湖大学未来能够成为矗立在西子湖畔的世界一流研究中心。”
个人简介
王东林博士,博导,国家科技创新2030重大项目首席科学家。2003年和2006年获西安交通大学电信学院工学学士和硕士学位,2010年获加拿大卡尔加里大学电子与计算机工程系博士学位。2011年起担任美国纽约理工学院电子与计算机工程系助理教授,2016年晋升副教授。2017年9月加盟西湖大学,现任特聘研究员,终身副教授,机器智能实验室PI。曾担任西湖大学工学院人工智能领域主任,现在担任工学院人工智能系副主任。
学术成果
致力于提高机器人通用行为智能水平,机器智能实验室(MiLAB)长期从事强化学习和机器人具身智能方向研究,从机器人具身大模型、深度强化学习、仿真真实环境差异及部署等三个维度构建了一套机器人行为学习方法体系,研发了一套机器人强化具身智能系统(包括四足机器人和人形机器人)。聚焦研究机器人大小脑的同时,自主研发了四足机器人和人形机器人本体及智能系统,从而实现机器人软硬件深度耦合。在NeurIPS、ICML、ICLR、RSS、Nature子刊等人工智能和机器人顶会顶刊发表论文150余篇,获得了Best Paper Runner Up of RRC 2021。首创研制机器人强化具身智能导盲犬,受邀在Nature 子刊撰写综述,获得了CCTV 13和人民日报等主流媒体广泛报道。综上所述,实验室主要聚焦以下研究方向:
1. 深度强化学习;
2. 机器人具身智能。
1. 国家科技创新2030-重大项目(数千万级项目),“面向类脑芯片的深度增强学习方法”,2022年-2027年,项目负责人。
2. 国家自然科学基金委面上项目,“强化学习在四足机器人行为智能上的关键技术理论及应用”,2022年-2025年,项目负责人。
代表论文
[1] S. Lyu, Z. Wei, D. Wang*, "The Robotic Guide Dog for individuals with visual impairments", Nature Reviews Electrical Engineering, Accepted 2024.
[2] P. Ding, H. Zhao, W. Song, W. Zhang, M. Zhang, S. Huang, N. Yang, D. Wang*. "QUAR-VLA: Vision-Language-Action Model for Quadruped Robots", The 18th European Conference on Computer Vision (ECCV), 2024. (第一个足式机器人VLA大模型)
[3] Y. Liu, P. Ding, S. Huang, M. Zhang, H. Zhao, D. Wang*. "PiTe: Pixel-Temporal Alignment for Large Video-Language Model", The 18th European Conference on Computer Vision (ECCV), 2024 (ECCV Oral: 2.3%).
[4] S. Lyu, X. Lang, H. Zhao, H. Zhang, P. Ding, D. Wang*, "RL2AC: Reinforcement Learning-based Rapid Online Adaptive Control for Legged Robot Robust Locomotion", Robotics: Science and Systems (RSS), 2024.
[5] Z. Zhuang, D. Peng, J. Liu, Z. Zhang, D. Wang*, "Reinformer: Max-Return Sequence Modeling for offline RL", International Conference on Machine Learning (ICML), 2024.
[6] J. Liu, X. Guo, Z. Zhuang, D. Wang*, "DIDI: Diffusion-Guided Diversity for Offline Behavioral Generation", International Conference on Machine Learning (ICML), 2024.
[7] Z. Zhuang, K. Lei, J. Liu, D. Wang*, Y. Guo. "Behavior Proximal Policy Optimization," In Proceedings of The International Conference on Learning Representations (ICLR), 2023.
[8] J. Liu, L. He, Y. Kang, Z. Zhuang, D. Wang*, H. Xu, "CEIL: Generalized Contextual Imitation Learning", Thirty-seventh Conference on Neural Information Processing Systems (NeurIPS), 2023.
[9] Y. Kang, D. Shi, J. Liu, L. He, D. Wang*. “Beyond Reward: Offline Preference-guided Policy Optimization,” In Proceedings of the Fortieth International Conference on Machine Learning (ICML), 2023. (第一个奖励无关人在回路强化学习方法)
[10] J. Liu, H. Zhang, D. Wang*, "DARA: Dynamics-Aware Reward Augmentation in Offline Reinforcement Learning," International Conference on Learning Representations (ICLR), 2022.
[11] J. Liu, H. Shen, D. Wang*, Y. Kang, Q. Tian, "Unsupervised Domain Adaptation with Dynamics-Aware Rewards in Reinforcement Learning," Thirty-Fifth Conference on Neural Information Processing Systems (NeurIPS), 2021.
[12] H. Zhao, M. Zhang, W. Zhao, P. Ding, S. Huang, D. Wang*. "Cobra: Extending Mamba to Multi-Modal Large Language Model for Efficient Inference", Thirty-Ninth AAAI Conference on Artificial Intelligence (AAAI), 2025.
[13] S. Huang, B. Gong, Y. Pan, J. Jiang, Y. Lv, Y. Li, D.Wang*. "VoP: Text-Video Co-operative Prompt Tuning for Cross-Modal Retrieval," IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2023.
[14] Z. Chen, J. Ge, H. Zhan, S. Huang, D. Wang*, "Pareto Self-Supervised Training for Few-Shot Learning," IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2021.
[15] T. Wang, Z. Wu, D. Wang*, "Visual Perception Generalization for Vision-and-Language Navigation via Meta-Learning," IEEE Transactions on Neural Networks and Learning Systems (TNNLS), 2021.
* 发表论文列表详见实验室主页:https://milab.westlake.edu.cn/。
联系方式
电子邮箱:wangdonglin@westlake.edu.cn
实验室长期招聘岗位及要求:
1. 招聘副研究员、助理研究员、博士后:要求具有深度学习、强化学习或机器人研究背景,协助指导博士生;
2. 招聘科研助理:计算机、通信、控制等相关专业硕士(或优秀本科生),要求具有深度学习或机器人研发经验,程序能力强;
3. 招聘实习生或访问学生:了解深度学习,要求程序能力或数学能力好。
请有意向者发简历到MiLAB实验室邮箱:mi_lab@westlake.edu.cn。合适的申请人我们会及时联系;三个月内没有收到面试通知者可自行放弃等待。因接待能力所限,谢绝自行来访。