研究 | YOLO一眼就能认出你:看一个神经网络如何全视野实时检测目标

作者 | Joseph Redmon的 & Ali Farhadi
编译|AI100(rgznai100)
YOLO全名You only look once(你只需要看一眼),是一个用于摄像头的实时目标检测系统。它能分辨出6000种物体,可在Titan X显卡上以40-90FPS的帧率处理视频。
007跑得再快,它看上一眼也能记住:

YOLO的作者是华盛顿大学(保罗·艾伦母校)的Joseph Redmon和保罗·艾伦AI研究所的Ali Farhadi,该项目目前已经开源,代码用C和CUDA写成,还有训练好的参数供你下载。
YOLO在原理上不同于过往的目标检测系统,人们过去只是把分类器和定位器的模型重用到目标检测上,用以监控摄像头视野中的多处位置和区域,得分最高的区域就被认为是发现目标。
YOLO的神经网络则可以监控摄像头的整个视野,如下图所示,它把整个视野的图像分成13×13的方格细胞:

每个方格细胞负责预测5个目标框,并以目标框来描述神经网络所检测到的物体:

不过,YOLO所输出的置信度数值,并非针对它所要识别的目标,而是目标框形状的契合程度。置信度越高,目标框就越粗:

目标框确定后,方格细胞便据此来预测目标的分类。以PASCAL VOC图像数据集为例,YOLOh很轻松就能辨别出20种不同的目标:自行车、船、汽车、猫、狗、人……
与基于分类器的老式系统不同,YOLO仅运行一个神经网络就能实时检测目标,相比要运行数千个神经网络才能检测目标的R-CNN系统,它能快上1000倍。

YOLO项目的详细信息如下:
论文 - https://arxiv.org/abs/1612.08242
项目页面 - https://pjreddie.com/darknet/yolo/
模型代码 - https://github.com/pjreddie/darknet
258M参数下载 - https://pjreddie.com/media/files/yolo.weights
参考内容:
http://machinethink.net/blog/object-detection-with-yolo/
热文推荐
程序员想搞机器学习?看看Nodejs之父这一年摸爬滚打的心路历程


课程结合实例介绍使用TensorFlow开发机器学习应用的详细方法和步骤,着重讲解了用于图像识别的卷积神经网络和用于自然语言处理的循环神经网络的理论知识及其TensorFlow实现方法,并结合实际场景和例子描述了深度学习技术的应用范围与效果。 所有案例均来自讲师团队工作中的亲身实践,所选案例均是深度学习的经典应用,非常具有代表性。
据说
向AI转型的程序员都关注了这个号...
▼▼▼▼▼▼

点击下方“阅读原文”查看更多内容。
关注公众号:拾黑(shiheibook)了解更多
[广告]赞助链接:
四季很好,只要有你,文娱排行榜:https://www.yaopaiming.com/
让资讯触达的更精准有趣:https://www.0xu.cn/
关注网络尖刀微信公众号随时掌握互联网精彩
- 1 习近平将发表二〇二六年新年贺词 7904141
- 2 2026年国补政策来了 7808738
- 3 东部战区:开火!开火!全部命中! 7712893
- 4 2026年这些民生政策将惠及百姓 7616985
- 5 小学食堂米线过期2.5小时被罚5万 7519709
- 6 解放军喊话驱离台军 原声曝光 7428214
- 7 为博流量直播踩烈士陵墓?绝不姑息 7327605
- 8 每月最高800元!多地发放养老消费券 7238391
- 9 数字人民币升级 1月1日起将计付利息 7141831
- 10 2026年1月1日起 一批新规将施行 7040675




![六二二同学带上半框眼镜瞬间OL化了[馋嘴]](https://imgs.knowsafe.com:8087/img/aideep/2021/9/11/054aa7d9a6bda2847d38097124db554d.jpg?w=250)



AI100
