简介
我于2016年毕业于华中科技大学自动化专业并获得学士学位。2016-2022年在中国科学院计算技术研究所计算机应用技术专业攻读博士学位,导师为高文教授和马思伟教授。2022年取得博士学位后加入复旦大学担任博士后研究员,合作导师为郑立荣教授,随即获得"上海市超级博士后"激励计划资助。2023年初加入京东集团担任CV/NLP算法工程师。2023年11月加入美团,研究大语言模型技术及其应用。我的研究方向为AIGC相关前沿技术及其落地应用,包括大语言模型、图像生成、多/跨模态生成等。
新闻
2023.11
加入美团点评担任高级算法工程师,主要关注大语言模型相关技术及其应用。
2023.11
获得第一届全国数字健康创新应用大赛医学人工智能主题赛二等奖。
2023.08
一篇关于跨模态压缩的论文被IEEE TMM接收。
2023.08
两项专利获得授权。
2023.05
加入京东集团,担任CV/NLP算法工程师。
2023.04
一篇关于跨模态生成和压缩的论文被IJCV接收。
2023.02
一篇关于跨模态生成和压缩的论文被IEEE TCSVT接收。
2022.12
获得上海市"超级博士后"激励计划资助。
2022.07
加入莱陆科技担任技术总监,加入复旦大学担任博士后研究员。
2022.06
取得博士学位。论文被ACM MM 2022接收。
2021.07
论文被ACM MM 2021接收。
2020.06
论文被IEEE JSTSP接收。
2018.12
创业公司"维境视讯"被字节跳动收购,进入字节跳动实习。
工作经历
2023.11 -至今
美团点评 高级算法工程师
2023.05 - 2023.11
京东集团 CV/NLP算法工程师
2022.07 - 2023.04
莱陆科技 技术总监
2022.03 - 2022.06
京东集团 算法实习生
2018.09 - 2020.09
字节跳动 研发实习生
2016.09 - 2018.09
维境视讯 算法实习生
论文
Cross Modal Compression with Variable Rate Prompt
TMMSCISemantic-Aware Visual Decomposition for Image Coding
IJCVRethinking Semantic Image Compression
TCSVTConsistency-Contrast Learning for Conceptual Coding
ACM MM 2022Cross Modal Compression: Towards Human-comprehensible Semantic Compression
ACM MM 2021Direct speech-to-image translation
JSTSPLearning to Fool the Speaker Recognition
TOMMUniversal adversarial perturbations for speaker recognition
ICME 2020一种鱼眼视频全景拼接中的亮度补偿算法
中国科学专利
- 基于语音的图像生成方法、装置和电子设备 (授权)
- 数据压缩的方法、装置、设备及存储介质 (公开)
- 音频对抗扰动的测试方法、设备及存储介质 (公开)
- 一种全景视频处理制作系统及方法 (公开)
- 一种系统延时确定方法、装置、设备和存储介质 (授权)
- 声音识别方法、装置以及存储指令的计算机可读存储介质 (公开)
- 一种基于因素分解的从文本到图像的跨模态生成方法 (公开)
获奖荣誉
- 2022.12 - 上海市"超级博士后"激励计划
- 2017.10 - 第17届中国虚拟现实大会最佳论文奖
- 2017.12 - 2017年AVS产业创新奖
- 2015.10 - 国家奖学金
- 2014.10 - 国家励志奖学金
- 2013.08 - 全国大学生智能汽车竞赛华南赛区一等奖
社会服务
- IEEE T-CSVT 审稿人
- IEEE Multimedia 审稿人
- CVPR, ICASSP, ICME 审稿人 (2020-2023)