首页   注册   登录
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
ifulikeweirdo
V2EX  ›  推广

AI 领域掀起 ReID 研究热,未来有哪些新的探索方向?

  •  
  •   ifulikeweirdo · 85 天前 · 384 次点击
    这是一个创建于 85 天前的主题,其中的信息可能已经有所发展或是发生改变。

    KhUqzt.md.png

    谈到人工智能,大众最耳熟能详的当属人脸识别技术,它已经渗透到了我们生活的方方面面。但在计算机视觉领域,另一项技术的重要性也不遑多让,那就是行人重识别( ReID )技术。

    ReID:计算机视觉研究的新风口

    行人重识别( Person Re-Identification,简称 ReID )也称作跨镜追踪技术,是当前计算机视觉领域的热门研究方向。顾名思义,这项技术可以根据行人的衣着、体态、发型等一系列特征检索不同摄像头下的同一个目标人物,以此描绘出他的行进轨迹。

    近年来越来越多的研究人员和机构开始投身到 ReID 技术的研究中来。这一趋势从历年计算机视觉顶会发表的 ReID 相关论文数量就可窥见一斑。2013 年,计算机视觉顶级会议 CVPR 上发表的 ReID 相关论文数量只有 1 篇,到 2018 年已经增加到了 32 篇。同一时间,另外两大计算机视觉顶会 ECCV 和 ICCV 发表的 ReID 相关论文数量也都从 3 篇增加到了 19 篇。

    ReID 技术发展道路上的三重大山

    在众多科研人员的共同努力下,近年来 ReID 技术已经取得了长足的发展。但必须承认的是,现阶段 ReID 技术的研究仍然面临着不少的现实挑战,主要有几个方面:

    首先是数据,和其他视觉任务相比,ReID 的数据规模是非常小的。目前 ReID 领域的公开数据集所含的 ID 数量不超过 6000 个。相比之下,人脸识别的公开数据集 ID 数量已经超过了 100 万,而企业私有的 ID 规模更在此之上。

    导致 ReID 训练数据缺乏的主要原因在于,行人数据集需要采集同一个人在一段时间内同时出现在多个摄像头下的画面,如此严苛的条件无疑对行人数据集的构建造成了巨大挑战。

    除了数据缺失,数据标注也是一个不小的挑战。数据标注是一件工作量特别庞大的事情,要知道大规模图像分类数据集 ImageNet 通过众包的形式,前后有 4.8 万人花了近两年时间才标注完成。此外,行人数据的标注本身有时也是非常困难的。区分猫狗非常容易,但要在视频中将两个年龄、体貌相似,穿着同样衣服的不同行人分开是比较困难的。

    其次是算法。ReID 技术的发展大致经历了两个阶段:2014 年以前主要是依靠一些传统方法,比如设计手工特征等; 2014 年以后则基本是基于深度学习的方法。众所周知,深度学习算法的训练依赖于大量的高质量数据。而 ReID 相关的训练数据不仅数量少,质量也很难保障。

    现有的视频监控设备受成像质量、分辨率等因素的制约,抓取的图像信息经常是模糊不清的。另外,相机拍摄角度差异大、室内室外环境变化、行人服装配饰更换、季节性穿衣风格差别大、白天晚上光线差异等因素,也给跨摄像头、跨地区、跨时间的 ReID 分析造成了巨大挑战。

    最后,技术落地,性价比也是一个需要特别关注的问题。在一般人看来,算法的准确率提升几个百分点或许微不足道,但背后却意味着巨额的成本提升。因此,在准确率不够完美的情况下要将技术落地,我们还必须做很多的应用创新,比如计算速度和内存开销的优化。

    总而言之,ReID 技术的突破肯定离不开两个方面——数据和方法。数据层面,一方面我们要构建更大的真实数据集,另一方面也可以通过 3D Graphics 等方法做数据生成。方法层面,业界之前往往只考虑视觉信息,其实现实世界中我们还可以对大量其他信息加以利用,比如 WiFi、GPS 等等。

    ReID 技术的几大前沿研究方向

    针对数据和方法两个层面,目前业内部分科研机构和企业已经相继有所突破。

    比如,针对数据不足的问题,有研究团队提出了数据增强与数据迁移算法。假设我们想将标注好的北京的数据用在上海的某个场景下,就可以通过迁移算法将其迁移到上海的场景中,迁移后的数据就像在上海拍摄的一样。

    再比如,为了应对非理想场景的挑战,我们可以用人体部件提取的方法来提取人体的细粒度部件,并进行矫正。值得注意的是,由于需要提取非常精细的人体部件,此类算法对遮挡以及人体关键点检测误差比较敏感。基于此,有团队提出了粗粒度部件提取方法,仅需提取三个粗粒度部件就能得到非常好的性能。

    此外,在应用层面结合人脸识别和 ReID 各自的特点及优势,也是一个值得探索的话题。比如千视通提出的卡视联动技战法,以少量的人脸卡口加大量的普通监控探头的部署,既可锁定嫌疑人身份,又能重现嫌疑人轨迹,这种创新的综合型技战法可以较大概率对监控范围进行覆盖,具有极强的实战价值。

    全国人工智能大赛为 ReID 技术发展添柴加薪

    首届全国人工智能大赛由深圳市科创委、鹏城实验室、新一代人工智能产业技术创新战略联盟( AITISA )共同承办,腾讯科技、创维集团、云天励飞、平安科技协办。这是深圳市首次主办高规格、大规模的人工智能领域权威赛事。大赛将链接全国顶尖 AI 科研平台及行业巨头,为我国 AI 大科学装置丰富数据集,并精准聚焦 AI、4K、行人识别等前沿领域,打通产学研通道,立足深圳集聚全球 AI 青年人才,为深圳建设中国特色社会主义先行示范区、建设国家新一代人工智能创新发展试验区、推动粤港澳大湾区人工智能产业发展提供重要支撑。

    大赛技术委员会主席提到,本届大赛赛题设计的目的主要聚焦于 Video 和 Vision 领域。在“Person ReID”赛道,更多的是希望解决关于场景、跨视角、光照 /分辨率影响等技术难题。

    为了进一步推动 ReID 的技术突破和落地应用,10 月 22 日启动的首届“全国人工智能大赛”专门设置了“行人重识别( Person ReID )”赛项,面向全国广泛征集来自高校、企业、科研单位等的团队和个人参赛。获奖者除获得 20 万至 100 万元奖金外,还有机会获得顶尖高科技单位招聘绿色通道、科研经费、人才政策、研发空间等全方位支持。

    了解大赛详情请点击: http://www.china-ai.ac.cn/

    目前尚无回复
    关于   ·   FAQ   ·   API   ·   我们的愿景   ·   广告投放   ·   感谢   ·   实用小工具   ·   1575 人在线   最高记录 5168   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.3 · 26ms · UTC 01:53 · PVG 09:53 · LAX 17:53 · JFK 20:53
    ♥ Do have faith in what you're doing.