yl9193永利官网系列讲座名家讲坛第4期——2D and 3D Recognition with Transformers
报告题目(Title):2D and 3D Recognition with Transformers
时间(Date & Time):2023.7.13 下午3:30-4:30
地点(Location):理科二号楼2135
主讲人(Speaker):王井东
邀请人(Host):张史梁
报告摘要(Abstract):
Transformer已经成为视觉识别的主流网络,可以用作编码器和解码器。本报告首先介绍探索transformer编码器和卷积编码器的关系的工作DWNet。然后介绍基于query的transformer解码器在语义分割中应用OCRNet。最后,分享基于transformer解码器的目标检测的方法Group DETR、以及多视图3D目标检测方法CAPE。
主讲人简介(Bio):
王井东,百度计算机视觉首席科学家,负责计算机视觉领域的研究、技术创新和产品研发。加入百度之前,曾任微软亚洲研究院视觉计算组首席研究员。2001年和2004年在清华大学获得学士和硕士学位,2007年在香港科技大学获得博士学位。研究领域为计算机视觉、深度学习及多媒体搜索。他的代表工作包括高分辨率神经网络HRNet、基于transformer的图像语义分割网络OCRNet、以及基于近邻图的大规模最近邻搜索SPTAG(最早把近邻图的方法用于实际搜索和推荐业务,是Bing搜索底层向量搜索的核心技术)等。在微软工作期间,科研成果10多次转化到微软的关键产品和业务中去,包括搜索、广告、OCR、小冰聊天机器人等。在百度带领团队研发的技术已经广泛应用于百度的搜索、智能云以及自动驾驶等重要产品和业务中。
他曾担任过许多人工智能会议的领域主席,如 NeurIPS、CVPR、ICCV、ECCV、AAAI、IJCAI、ACM MM等。他现在是IEEE TPAMI和IJCV的编委会成员,曾是IEEE TMM和IEEE TCSVT编委会成员。因在视觉内容理解和检索领域的杰出贡献,他被遴选为国际电气电子工程师学会和国际模式识别学会会士 (IEEE/IAPR Fellow)、国际计算机协会杰出会员 (ACM Distinguished Member)。
欢迎关注yl9193永利官网微信公众号,了解更多讲座信息!
永利集团