资源 | 吴恩达推荐:斯坦福放出最大放射影像数据集,在4万张X光片上完成ML挑战赛

百家 作者:大数据文摘 2018-05-25 06:13:57

大数据文摘作品

编译:闫雨莹


斯坦福大学ML Group昨天发布了一个新的数据集——MURA。据官网信息,这一数据集由自12,173名患者的14,863项研究组成,总共包括了40,561张多视角肌肉骨骼X光片。


MURA官网链接:

https://stanfordmlgroup.github.io/competitions/mura/


此外,斯坦福还在这个数据集的基础上发布了举办深度学习挑战赛的消息,目的十分明确:你的算法能不能打败放射科医生?


不管是数量还是质量,这一最新发布的数据集都非常优质,斯坦福教授吴恩达也在推特上推荐了这个比赛。



目前,肌肉骨骼疾病影响全球超过17亿人,斯坦福这一数据集旨在帮助医学影像技术取得重大进展,从而改善世界上许多缺乏放射科医生的医疗机构的状况。


关于MURA


据官网介绍,MURA是肌肉骨骼放射照片的数据集,由来自12,173名患者的14,863项研究组成,总共包含40,561个多视角放射图像。


图片囊括了七种放射科主要研究对象:手肘,手指,前臂,手,肱骨,肩膀和手腕。



这些数据的搜集横跨十年:2001年-2012年,斯坦福大学医院的放射科认证医生们对每个研究对象,都手动标记下了正常或异常的标签。


为为了评估模型以及放射科医师的表现,斯坦福ML Group从测试集上六名斯坦福放射科医师那里重新收集了额外标签,其中包括207项肌肉骨骼研究。使用PACS系统,放射科医师对这些研究进行了逐个回顾性检查,并将测试集中的每项研究标记为,临床阅读室环境中的正常或异常的DICOM文件。


这些放射科医师的平均工作年限为8.83年。我们随机选择了这些放射科医师中的3位,创建了一个“医生黄金标准”。


那么,如何报名参加比赛呢?


MURA将使用非公开的测试装置对你的代码进行官方评估。参赛团队可以在Codalab上提交他们的可执行代码,然后运行在不公开可读的测试集上即可。这样的设置保留了测试结果的完整性。


ML Group还发布了一个官方评估代码的教程。

教程链接:

https://worksheets.codalab.org/worksheets/0x42dda565716a4ee08d61f0a23656d8c0/


一旦模型被正式评估,你的分数就将被添加到右侧排行榜上。


目前,在这一排行榜上列出的是斯坦福专业放射科医生的成绩。


【今日机器学习概念】

Have a Great

关注公众号:拾黑(shiheibook)了解更多

[广告]赞助链接:

四季很好,只要有你,文娱排行榜:https://www.yaopaiming.com/
让资讯触达的更精准有趣:https://www.0xu.cn/

公众号 关注网络尖刀微信公众号
随时掌握互联网精彩
赞助链接