最新消息

2016年11月21日学术报告:Neural Aggregation Network for Video Face Recognition


添加时间:2016-11-15 19:27:07



题目:Neural Aggregation Network for Video Face Recognition

时间:2016年11月21日(周一),下午2点

报告人: Jiaolong Yang

地点:研究生楼306

 

Abstract: We present a Neural Aggregation Network (NAN) for video face recognition. 
The network takes a face video or face image set of a person with a variable 
number of face images as its input, and produces a very compact and fixed-dimension feature representation. The whole network is composed of two modules.
The feature embedding module is a deep Convolutional Neural Network (CNN), 
which maps each face image into a feature vector. The aggregation module 
consists of two attention blocks driven by a memory storing all the extracted 
features. It adaptively aggregates the features to form a single feature inside
the convex hull spanned by them. Due to the attention mechanism, the aggregation 
is invariant to the image order. We found that NAN learns to advocate high-quality face images while repelling lowquality ones such as blurred, occluded and 
improperly exposed faces. The experiments on IJB-A, YouTube Face, Celebrity-1000 video face recognition benchmarks show that it consistently outperforms 
standard aggregation methods and achieves state-of-the-art accuracies.
 
Bio:
Jiaolong Yang is currently an Associate Researcher at the Visual Computing Group of
Microsoft Research Asia (MSRA). He received dual PhD degrees from The Australian 
National University (ANU) and Beijing Institute of Technology (BIT) in Sep 2016. 
He was also a visiting PhD student at Harvard University, and a research intern at MSRA. 
His research interests include computer vision, pattern recognition and image processing. 
He has been publishing papers as the first author in prestigious journals and conferences 
including IEEE TPAMI, CVPR, ICCV and ECCV, and been serving as reviewer/program committee 
for them.


作者:宋浩