为助计算机视觉实现新突破,谷歌发布全球最大的人工和自然地标数据集

长按识别二维码,报名2018十大突破性技术中国区线下解读会
图像分类技术在过去几年中取得了显著的进步,这在一定程度上体现在Imagenet 分类挑战上,机器的误差率每年都在大幅下降。
为了继续推进计算机视觉技术的先进水平,许多研究人员现在更多地关注细粒度和实例级的识别问题,而不是识别一般实体,如建筑物、山脉,当然还有猫,许多人正在设计能够识别埃菲尔铁塔、富士山或波斯猫的机器学习算法。
然而,这一领域研究的一个重大障碍是缺乏大量带注释的数据集。
而就在今天,谷歌在其官方博客宣布,发布 Google-Landmarks 数据集来推进实例级的识别,这也是世界上最大的人工和自然地标识别数据集。

Google-Landmarks 将作为 Kaggle 网站上地标识别和地标检索挑战发布,这将是 CVPR 18 地标研讨会的重点。
该数据集包含二百万多幅图像,描绘了来自世界各地的三万处独特的地标,数据集类别的数量比常用的数据集大 30 倍。此外,为了促进这一领域的研究,我们是开源的深度本地特征( DELF ),我们认为这是一种非常好的本地特征描述方法,特别适合于这类任务。
地标识别与其他问题有一些显著的区别。例如,即使在大型带标注的数据集中,对于一些不太热门的地标,也可能没有太多的训练数据。此外,由于地标通常是不动的物体,所以内部变化很小(换句话说,地标的外观在不同的图像中变化不大)。

因此,变化只会由于图像捕获条件而产生,如遮挡、不同的视角、天气和光照,这与其他图像识别数据集不同,其中特定类别的图像(如狗)的变化可能更大。这些特征也与其他实例级识别问题(如艺术品识别)有共同之处,
因此,谷歌希望这个新的数据集也能对其他图像识别问题的研究有所帮助。
这两项 Kaggle 挑战将为研究人员解决这些问题提供了获取带标注的数据的途径。识别轨迹挑战是在测试集中建立识别正确地标的模型,而检索挑战则要求参与者检索包含相同地标的图像。通过 Kaggle 网站就能访问到这个新的数据集。
-End-
编辑:LXQ 校审:黄珊
参考:
https://research.googleblog.com/2018/03/google-landmarks-new-dataset-and.html?m=1


关注公众号:拾黑(shiheibook)了解更多
[广告]赞助链接:
四季很好,只要有你,文娱排行榜:https://www.yaopaiming.com/
让资讯触达的更精准有趣:https://www.0xu.cn/
关注网络尖刀微信公众号随时掌握互联网精彩
- 1 习近平听取李家超述职报告 7904852
- 2 收入分配制度或迎重大改革 7808536
- 3 福建舰入列后首次通过台湾海峡 7714524
- 4 回顾山东舰硬核名场面 7619185
- 5 健美冠军王昆去世 曾获职业赛8连冠 7522231
- 6 女教师新婚坠亡一楼业主要求赔偿 7424173
- 7 日本遗孤:从小恨自己为何是日本人 7330667
- 8 4400万粉丝网红直播泳池派对被处理 7237726
- 9 亚运冠军称举报领导后不敢再呆在家 7137643
- 10 感染甲流后该如何科学调养 7047587

![外星皮皮虾521抖音又小黑屋了…[泪] 福利这里发喽~~[哈哈] ](https://imgs.knowsafe.com:8087/img/aideep/2022/5/10/b8ceb89b3d281f54a5fa925058ef71ba.jpg?w=250)





DeepTech深科技
