="BET体育365投注官网"

吴松

2020-12-04 10:04 作者:本站编辑 审核: 浏览:

个人简介

  名:吴松

  箱:songwuswu@swu.edu.cn

毕业院校:荷兰莱顿大学

研究方向:计算机视觉;人工智能;大数据分析;

  位:bet体育365官网正规 BET体育365投注官网 副教授

 

教育经历:

1.       2012/09-2016/09,荷兰莱顿大学,先进计算机科学学院,博士,导师:Prof. Joost Kok, and Prof. Michael S. Lew

2.       2009/09-2012/06,bet体育365官网正规,计算机与信息科学学院 软件学院,计算机科学与技术,硕士,导师:肖国强教授;

3.       2005/09-2009/06,bet体育365官网正规,计算机与信息科学学院 软件学院,计算机科学与技术,本科;

科研与学术工作经历:   

1.      2017/04-至今,bet体育365官网正规,计算机与信息科学学院 软件学院,副教授,硕士生导师;

2.      2018/01-2018/10,原重庆市经济和信息化委员会大数据局,干部挂职;

3.     2016/09-2017/04,美国德克萨斯大学西南医学中心,医学影像研究中心,博士后,合作导师:Prof. Joseph Maldjian and Prof. Albert Montillo

主持或参加科研项目(课题):

1. 教育部中央高校基本科研业务费,基于隐属性图网络及持续学习的跨媒体检索算法研究2022/04-2025/04,主持,30万,在研;

2.   重庆市博士后项目特别资助,基于可解释语义属性学习的行人重识别研究,二等资助,2022/05-2024/05,主持,10万,在研;

3.   重庆市教委第十一期雏鹰计划项目“基于深度学习的智能问答系统设计” ,2023/06-2024/05,主持,2万,在研;

4.   国家自然科学基金青年项目基于深度语义哈希的大规模图像检索算法研究2018/08-2021/12,主持,23万,结题;

5.   教育部中央高校基本科研业务费,基于深度学习的大规模图像检索算法研究”,2017/05-2020/05,主持,20万,结题;

6.    重庆市留创计划创新类项目基于深度学习的课程智能答疑系统算法设计与分析2018/10-2019/10,主持,5万,结题;

人才计划项目情况:

1.       重庆市第四类人才(海外高层次人才计划),2018年,计算机科学与技术;

重要学术组织任职:

1.       2023/10-至今,重庆市电子学会理事;

2.       2022/11-至今,数字化学习技术集成与应用教育部工程研究中心专家委员会委员;

3.       2022/05-至今,中国计算机学会(CCF) YOCSEF重庆学术AC委员;

4.       2021/01-至今,重庆市计算机学会理事;

5.       2021/01-至今,重庆市电子学会青少年信息技术与人工智能专委会常务委员兼专家组成员;

学术研究基础:

本人的主要研究方向是计算机视觉,同时涉及机器学习深度学习自然语言处理等多个前沿领域。具体研究工作包括持续学习(递增学习,终身学习,半监督学习),小样本/零样本学习(目标检测/分割,行人重识别),多模态学习(图文匹配,视频检索,视觉问答系统)等。累计发表学术论文20余篇,学术专著 “Large Scale Visual Search” ISBN: 9789463321174) 一部,并发布了基于深度学习的自然图像分类以及理解的 Demohttp://destiny.liacs.nl/,其中2016年合作发表的深度学习综述论文:“Deep Learning for Visual Understanding: A Review”入选ESI高被引用论文(谷歌引用2000余次)。2018年入选重庆市第四类人才(海外高层次人才计划)。

 

代表性研究成果和学术奖励情况:

l  期刊论文

[1]. Xu Xiaohui, Liu Shan, Zhang Nian, Xiao Guoqiang, Wu Song*. Channel exchange and adversarial learning guided cross-modal person re-identification[J]. Knowledge-Based Systems, 2022, 257: 109883. (SCI-1).

[2]. Yu Zhenyang, Wu Song*, Dou Zhihao, Bakker M. Erwin. Deep hashing with self-supervised asymmetric semantic excavation and margin-scalable constraint, Neurocomputing, 2022, 483: 87-104. (SCI-2).

[3]. Zou Xitao, Wu Song*, Zhang Nian, Bakker M. Erwin. Multi-label modality enhanced attention based self-supervised deep cross-modal hashing[J]. Knowledge-Based Systems, 2022, 239: 107927. (SCI-1).

[4]. Zou Xitao, Wu Song*, Bakker M. Erwin, Wang Xinzhi. Multi-label enhancement based self-supervised deep cross-modal hashing[J]. Neurocomputing, 2022, 467: 138-162. (SCI-2).

[5]. Chen Shubai, Wu Song*, Wang Li, Yu Zhengyang. Self-attention and adversary learning deep hashing network for cross-modal retrieval[J]. Computers & Electrical Engineering, 2021, 93: 107262. (SCI-3).

[6]. Chen Shubai, Wu Song*, Wang Li. Hierarchical semantic interaction-based deep hashing network for cross-modal retrieval[J]. PeerJ Computer Science, 2021, 7: e552. (SCI-4).

[7]. Zou Xitao, Wang Xinzhi, Bakker M. Erwin, Wu Song*. Multi-label semantics preserving based deep cross-modal hashing[J]. Signal Processing: Image Communication, 2021, 93: 116131. (SCI-2).

[8]. Wang Xinzhi, Zou Xitao, Bakker M. Erwin, Wu Song*. Self-constraining and attention-based hashing network for bit-scalable cross-modal retrieval[J]. Neurocomputing, 2020, 400: 255-271. (SCI-2).

[9]. Wu Song, Ard Oerlemans, Erwin M. Bakker, Michael S. Lew*, Deep Binary Codes for Large Scale Image Retrieval, Neurocomputing, 2017, 257: 5-15. (SCI-2).

[10]. Wu Song, Ard Oerlemans, Erwin M. Bakker, Michael S. Lew*, A Comprehensive Evaluation of Local Detectors and Descriptors, Signal Processing: Image Communication, 2017, 59: 150-167. (SCI-2).

[11]. Yanming Guo, Yu Liu, Ard Oerlemans, Songyang Lao, Wu Song, and Michael S. Lew*. “Deep learning forvisual understanding: A review.”, Neurocomputing, vol187, 2016. (Google Citations: 2000).

 

l  会议论文

[1]. Luo Pinjun, Xiaoguo Qiang, Gao Xinbo, Wu Song*. LKD-Net: Large Kernel Convolution Network for Single Image Dehazing. In Proceedings of 2023 IEEE International Conference on Multimedia and Expo (ICME) 2023. (CCF-B).

[2]. Shan Shihao, Xiong Enyuan, Xiang Yuan, Wu Song*. A Knowledge-Driven Enhanced Module for Visible-Infrared Person Re-Identification. In Proceedings of 2022 International Conference on Artificial Neural Networks (ICANN) 2022, pages:441-453. (CCF-C).

[3]. Liu shan, Xiao Guoqiang, Xu Xiaohui, Wu Song*. Bi-directional Normalization and Color Attention-guided Generative Adversarial Network for Image Enhancement. In Proceedings of 2022 IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP) 2022, pages:2205-2209. (CCF-B).

[4]. Chen Shubai, Wu Song*, Chen Yu, Yuan Yuan. Deep similarity preserving and attention-based hashing for cross-modal retrieval. In Proceedings of the 33rd International Conference on Software Engineering and Knowledge Engineering (SEKE) 2021, pages: 405-410. (CCF-C).

 

l  学术专著

Wu Song, Large Scale Visual Search, Leiden University Press, 2016. 12. 22. (ISBN: 9789463321174)

https://openaccess.leidenuniv.nl/handle/1887/45135

发表论文代码下载链接:http://github.com/SWU-CS-MediaLab/

团队已毕业同学(深造/就业):

     珊(硕士),计算机科学与技术,20236月毕业,就业,就业单位:重庆长安汽车股份有限公司(重庆);

    徐孝辉(硕士),计算机科学与技术,20236月毕业,直博,深造学校:同济大学(上海);

    熊恩圆(本科),网络工程,20236月毕业,硕士留学,深造学校:佐治亚理工学院(美国);

    陈述白(本科),电子商务,20226月毕业,硕士推免,深造学校:中国科学院计算技术研究所(北京);

    唐子豪(本科),计算机科学与技术,20226月毕业,硕士推免,深造学校:东南大学(南京);

    王鑫祉(本科),计算机科学与技术,20216月毕业,就业,就业单位:腾讯公司(深圳);

    余政阳(本科)自动化,20206月毕业,博士留学,深造学校:澳大利亚国立大学(澳大利亚);

国际学术期刊及会议审稿人:

l  国际期刊:

IEEE Transactions on Image Processing.

IEEE Transactions on Neural Networks and Learning Systems

IEEE Transactions on Multimedia.

Knowledge-based Systems.

Engineering Applications of Artificial Intelligence

Pattern Recognition.

Neurocomputing.

Signal Processing: Image Communication.

 

l  国际会议:

Conference of British Machine Vision Conference (BMVC), 2014~.

AAAI conference on Artificial Intelligence (AAAI), 2015~.

International Conference of ACM Multimedia (MM),2016~.

International Joint Conference on Artificial Intelligence (IJCAI), 2018~.

 

我们多模态深度学习理论与应用团队针对多尺度复杂数据处理问题,研究多尺度表示的跨模态人工智能框架,适用于视频、语音、自然语言、三维点云、地理数据等不同模态的数据,实现小样本、可解释、跨模态和感知决策一体化方法,并应用到以视觉为中心的真实生活场景中。热烈欢迎有志于投身此前沿科学领域的硕士生报考咨询,同时常年招收本科生参与团队科研项目,一起探索未知!