Resume


头像

📧 邮箱:1023010418@njupt.edu.cn 📞 电话:+86 15212147511

个人评价

面试官您好,我是 梁宇恒,南京邮电大学信号与信息处理专业,在智能信息处理与通信技术省高校重点实验室(智通实验室),研究生期间获得研究生学业一等奖学金。

科研方面,主要研究方向为多模态情感识别,所提出方法在2025年第八届CVPRworkshop国际竞赛中获得第六名(全球75支队伍),论文被收录CVPRworkshop。同时以第一作者身份发表多模态情感识别相关成果论文3篇

实践方面,有过两段AI算法实习经历,熟悉主流的深度学习框架(PyTorch)、编程语言(Python/C++)、开发工具链(Linux、Shell、Docker),能够独立完成从方法设计、训练优化、微调到部署上线的完整流程。具备良好的问题分析能力、说明文档撰写能力、部门协作能力。

本人衷心热爱人工人工智能领域研究与实践,具备扎实的计算机视觉多模态大模型多模态RAG等实践经验,具备从理论研究到工程化落地的能力链。下面是我科研成果与实践项目的详细说明,期待与您进一步沟通。


实习经历

鼎捷数智股份有限公司(南京研发中心)-AI算法工程师 | 2025.05-2025-09

基于大模型的复杂工程图纸解析

框架图


多模态 RAG 问答系统

框架图


深研人工智能(深圳)有限公司-初级算法工程师 | 2024.07-2024.09

基于YOLOv5道路病害检测


项目经历

国家自然基金项目-多模态情感识别算法(研究生课题) | 2024.09-至今

模型框架


CVPR 2025 workshop算法竞赛-基于Mamba的连续情感识别算法 | 2025.01-2025.04


学术成果

  1. 📄 Mamba-VA: A Mamba-based Approach for Continuous Emotion Recognition in Valence-Arousal Space
    • 第一作者, Computer Vision and Pattern Recognition Workshops(CVPRw)已发表
    • 查看论文
    • 第八届 ABAW VA Estimation Challenge 提交队伍名称:Charon
    • 排行榜
    • 代码仓
  2. 📄 LightMamba: A Multimodal Audio-Visual Framework for Continuous Emotion Recognition
    • 第一作者, 2025 China Automation Congress(CAC)已录用
    • 查看论文
  3. 📄 Enhancing Audio-Visual Affective Analysis via Bidirectional Dynamic Cross-Modal Attention and Masked Autoencoding
    • 第一作者, 2025 Wireless Communications and Signal Processing (WCSP)在投
    • 查看论文

专业技能


从理论到工程,我的目标是让研究走向真实应用。