酷应用

新闻
- 看点
- 观点
- 读点
- 热点
科技
- 数码
- 软件
- 应用
- 极客
企服
- 电商
- 运营
- 移动
- 访谈
- 动态
- 招聘
- 访谈
- 百家
安全
- 业界
- 快讯
- 技术
- 校园
- 工具
文娱
- 明星
- 影视
- 音乐
- 网娱
- 韩娱
- 词典
游戏
- 手游
- 页游
- 端游
好货
- 报道
- 值得买
- 健康

为助计算机视觉实现新突破，谷歌发布全球最大的人工和自然地标数据集

百家作者：DeepTech深科技 2018-03-02 11:21:44

长按识别二维码，报名2018十大突破性技术中国区线下解读会

图像分类技术在过去几年中取得了显著的进步，这在一定程度上体现在Imagenet 分类挑战上，机器的误差率每年都在大幅下降。

为了继续推进计算机视觉技术的先进水平，许多研究人员现在更多地关注细粒度和实例级的识别问题，而不是识别一般实体，如建筑物、山脉，当然还有猫，许多人正在设计能够识别埃菲尔铁塔、富士山或波斯猫的机器学习算法。

然而，这一领域研究的一个重大障碍是缺乏大量带注释的数据集。

而就在今天，谷歌在其官方博客宣布，发布 Google-Landmarks 数据集来推进实例级的识别，这也是世界上最大的人工和自然地标识别数据集。

Google-Landmarks 将作为 Kaggle 网站上地标识别和地标检索挑战发布，这将是 CVPR 18 地标研讨会的重点。

该数据集包含二百万多幅图像，描绘了来自世界各地的三万处独特的地标，数据集类别的数量比常用的数据集大 30 倍。此外，为了促进这一领域的研究，我们是开源的深度本地特征( DELF )，我们认为这是一种非常好的本地特征描述方法，特别适合于这类任务。

地标识别与其他问题有一些显著的区别。例如，即使在大型带标注的数据集中，对于一些不太热门的地标，也可能没有太多的训练数据。此外，由于地标通常是不动的物体，所以内部变化很小（换句话说，地标的外观在不同的图像中变化不大）。

因此，变化只会由于图像捕获条件而产生，如遮挡、不同的视角、天气和光照，这与其他图像识别数据集不同，其中特定类别的图像（如狗）的变化可能更大。这些特征也与其他实例级识别问题（如艺术品识别）有共同之处，

因此，谷歌希望这个新的数据集也能对其他图像识别问题的研究有所帮助。

这两项 Kaggle 挑战将为研究人员解决这些问题提供了获取带标注的数据的途径。识别轨迹挑战是在测试集中建立识别正确地标的模型，而检索挑战则要求参与者检索包含相同地标的图像。通过 Kaggle 网站就能访问到这个新的数据集。

-End-

编辑：LXQ 校审：黄珊

参考：

https://research.googleblog.com/2018/03/google-landmarks-new-dataset-and.html?m=1

关注公众号：拾黑（shiheibook）了解更多

[广告]赞助链接：

四季很好，只要有你，文娱排行榜：https://www.yaopaiming.com/
让资讯触达的更精准有趣：https://www.0xu.cn/

*文章为作者独立观点，不代表爱尖刀立场

本文由 DeepTech深科技发表，转载此文章须经作者同意，并请附上出处( 爱尖刀 )及本页链接。

原文链接 https://www.ijiandao.com/2b/baijia/94267.html

谷歌 Google

图库

DeepTech深科技

公众号

关注网络尖刀微信公众号
随时掌握互联网精彩

赞助链接

百度热搜榜

排名热点搜索指数