您好!欢迎访问leyu乐鱼体育!
专注精密制造10载以上
专业点胶阀喷嘴,撞针,精密机械零件加工厂家
联系方式
0866-642276578
您当前的位置: 主页 > 案例展示 > 汽车行业 >

汽车行业

leyu乐鱼体育官网入口-2021人工智能深度研究:机械学习最终是否会取代人类医生?

更新时间  2022-09-01 21:39 阅读
本文摘要:杭州健澜科技有限公司今天的话题:机械学习最终是否会取代人类医生?我们要探讨的这篇论文,它接纳的方法,绝对可以比以往任何一种方法都好。原来我想在一篇博客里讨论好几篇类似的论文,惋惜每一篇论文都有许多值得人们深思的地方(这篇文章就已经占了3000字了),所以每一篇论文我将花整个篇幅去深度探讨和明白。然后我将在几周里离开讨论这些文章,于是就发生了我博客中关于医疗人工智能这个系列专题。

leyu乐鱼体育官网入口

杭州健澜科技有限公司今天的话题:机械学习最终是否会取代人类医生?我们要探讨的这篇论文,它接纳的方法,绝对可以比以往任何一种方法都好。原来我想在一篇博客里讨论好几篇类似的论文,惋惜每一篇论文都有许多值得人们深思的地方(这篇文章就已经占了3000字了),所以每一篇论文我将花整个篇幅去深度探讨和明白。然后我将在几周里离开讨论这些文章,于是就发生了我博客中关于医疗人工智能这个系列专题。对于本次话题,我很是谢谢 Lily Peng博士,这篇论文的作者之一,他对我提出的许多问题做出了很是充实的解答。

这里先送上一份简朴的总结:TL:DRgoogle(和他们的互助者)训练了一个系统,可以检测糖尿病视网膜病变(全世界5%的失明由它引起),该系统能够像一个眼科医生一样做出诊断。这是一个有用的临床任务,它可能不会节约许多的用度,也不会在医疗自动化以后取代医生,可是它的提出有很大的人文情怀。他们使用了13万个视网膜图像举行训练,比公然的数据集大了1到2个数量级。

他们使用阳性案例富厚了他们的训练集,在某些水平上抵消了不平衡的数据漫衍带来的影响。由于大多数深度学习模型都是针对低分辨率的图像,所以原数据被下采样处置惩罚,抛弃了90%以上的像素值,然而我们无法评测这样做是否有利。他们雇佣了一组眼科医生来对图像举行标注,可能会花费数百万美元,这样做的目的是为了使标注更准确,制止泛起误判。第5点和第6点是造成当前所有深度学习系统错误率高的原因,而且这个问题很少被谈及。

深度学习之所以比医生更有优势,是因为它们可以在各个“操作点”上运作,相同的系统可以执行高敏捷度筛选和高特异性诊断,不需要再加分外的训练。这是一个很棒的研究内容,人们能够很容易的明白,而且在文本和增补中有许多有用的信息。这项研究似乎切合现在FDA对510(k)批准的要求。

虽然这项技术不太可能通过,可是该系统或衍生物在未来的一两年内很可能加入光临床的实践当中去。免责声明:本文主要针对普通化的群体,包罗机械学习领域的专家、医生等。相关专家们可能会以为,我对一些观点的明白很肤浅,可是我还是希望他们能在自己研究领域之外找到更多有趣的新想法。

另有一点要强调的是,如果这篇文章里有任何说错的地方,请读者告诉我,我会实时纠正。研究现状在讨论之前,我想提醒大家,虽然从2012年开始,深度学习就逐渐生长成一种研究者经常使用的方法,可是五年之内我们并没有在医学中使用这种方法,为了宁静起见,我们的医疗人员也通常比技术的生长落伍一步。大家相识到这个配景以后,就可以想象到现在取得的一些结果更是令人难以置信,而且我们应该客观地认识到,人工智能对医疗的生长只是一个开始。在论文中提出了,医疗自动化已经实现了突破性的希望,我会在本文中简朴回首一下,也适当地增加了一些有用的知识。

我会进一步先容这个研究,在先容之前先花几分钟时间说明几个关键性的问题:任务——这项任务是临床任务吗?如果实现自动化,在医疗实践历程中碰面临多大的滋扰呢?为什么选择这项特定的任务呢?数据——如何收集和处置惩罚需要的数据?数据怎么处置惩罚才气切合医学实验和羁系的要求呢?我们需要深入相识医疗人工智能对大数据的要求。效果——人工智能将战胜医生还是打成平手?他们究竟测试了什么?我们还能有什么其他的收获吗?结论——这个效果有多大的影响力?我们还可以进一步获得其他的结论吗?Google的最新研究任务:糖尿病视网膜病是造成失明的一个重要病变,其成因是由于眼睛后部的细小血管损伤的造成的。医生可以通过视察眼睛后部的血管举行诊断,这其实是一项感知任务。图一 例如,DL系统能够学会如何识别“棉花状黑点”一样的白斑图案他们训练了一个深度学习系统,可以完成和评估与糖尿病视网膜病变相关的几项事情,主要的结果是对一组糖尿病视网膜病变的病例举行评估,这些患者有着中度或者更严重的眼睛疾病(这组患者的治疗方式和非对照组的患者的治疗方式差别)。

他们还测试了深度学习系统对其他严重的视网膜病变的识别能力,以及黄斑是否水肿的能力。数据:他们使用13万张视网膜图片对设计的深度学习系统举行训练,每个级别由3到7名眼科医生来投票确定,最终的效果以多数票来决议。图像是从四个地方的医院(美国EyePACS和3家印度医院)收罗的可追溯的临床数据,由差别的相机拍摄出来的。

他们在两个数据集上验证了这个系统(在医学中,术语“验证”是指不到场到系统开发、训练环节的患者,与机械学习中的测试集是一个意思)。其中的一个数据集是对EyePACS数据集随机采样获得的,另一个数据集来自3家法国医院(Messidor-2)的公然数据集。第二个数据集中的所有图片是由同一个相机拍摄的。

这些测试集由7-8个眼科专家举行分级,同样接纳多数表决机制。用来开发、训练的数据集中,视网膜病变的患病率占比55%,恶化率占比8%,验证数据中患者的患病率远远低于一般患者的患病率,在19.5%的患病率中,只有1.7%的严重或恶化。

这样的数据集是研究者刻意设计的,训练集中有许多阳性病例(他们增加了病例,比通常发生在临床人群中更多)。对于数据集的质量,视网膜图片的分辨率通常在1.3到350万像素之间。

这些像素被缩小到299*299的分辨率,也就是0.08百万像素(整整少了94%到98%的像素!)。这是他们设计的网络结构的特性,其他巨细分辨率的图像不能使用。神经网络:他们使用了 Google Inception-v3 深度神经网络的预训练版本,这也是到现在为止使用效果最好的图像处置惩罚系统之一。

预训练意味着这个网络已经拿来训练过一些非医疗的物体(例如猫和汽车的照片),然后再在这个基础上对特定的医疗图片举行训练。这也是网络只接受229*229分辨率图片输入的原因。效果:我认为这篇论文是深度学习在医学人工智能领域取得的第一大突破。

机械与眼科医生拥有险些相同的疾病判断能力,甚至可以与“中级”眼科医生举行较量,体现也相当不错。图二 这是所谓的ROC曲线,是判断疾病诊断系统的最佳方式之一。通过盘算曲线AUC下方的面积,能够将敏捷度和特异度联合在单一的指标中。

99.1%是很是好的。彩色点是专业眼科医生的诊断效果,黑线是所训练的深度学习系统的诊断效果。正如你所看到的,如果我们将所有的彩色点毗连起来,就可以获得眼科医生诊断效果的ROC曲线*,与深度学习系统的ROC曲线相似。

如果你不相识ROC曲线,你可以相信我,这绝对是一个证明两种诊断效果相同的有效方式(食品药品监视治理局将同意我的看法)。他们的系统可以很准确的检测出黄斑水肿,但在一些严重的视网膜病变方面,它的绝对值(AUC值)数据有些差距,但与眼科医生的正面比力没有说明这些。讨论:关于这项研究,这里有一些有趣的事情要讨论一下。

leyu乐鱼体育官网入口

用度:他们招聘了一组眼科医生来标注他们的数据,一共有50万个标签需要去标注。如果根据正常的看病价钱去支付医生,或许需要数百万美元。这笔用度比大多数创业公司的成本还要多,而且他们肯定无法接受只有一个单一数据集的标注任务。从统计的角度思量,数据就是气力。

对于医疗人工智能来说,只有款项才气发生这么多数据。换句话说,款项就是气力。任务:他们能够从眼睛的照片中检测到两类以上的“可视眼病”(中度或者重度视网膜病变),甚至更严重的视网膜病变和黄斑水肿。

这些都是临床上很是重要的任务。最重要的是,这些任务涵盖了大多数医生在看糖尿病患者眼睛时在做的事情。固然,这个系统检测不出稀有的视网膜玄色素瘤,可是对于日常的眼睛检查,这是一个可以很好模拟医生的系统。

数据:数据是很有趣的方面,原因有两个:质量和数量。从他们举行的系列实验中,我们可以看出来他们需要的图片的数量。他们还用差别数量的训练样本对系统的性能举行了测试。

图三 数据集中图像的数量(单元:千)这幅图像给我们展示了一些很是有趣的工具,他们的训练集中图像的数量上限为6万例,这些图像至少在97%的敏捷度事情点。值得关注的是,这比已经公然的数据集大了一到两个数量级,如果你的实验能凌驾97%的敏捷度,毫无疑问你的数据需求也一定会增加。这个效果也向我们转达了关于数据集巨细的其他内容。

当他们努力复制眼科医生的事情时,对常见眼科疾病的敏捷度能够到达90%,可是对于重度或者更严重的疾病的敏捷度只有84%。可能是因为识别重度疾病的任务比力难题。另外,我还注意到“中度或者重度”疾病的训练数据是普通的3到4倍。绝对数据较少(约9500例vs 34000例),而且关于盛行眼病的数据也较少(9%为阳性,30%为阳性)。

机械学习需要训练漫衍不平衡的数据,可是不平衡的数据并不容易获得。以我的履历看来,不平衡的情况比低于30/70,机械学习会很难举行下去。

这样的数据不仅使训练越发难题(较少的案例=较少的学习),而且也会让实际地诊断变得越发难题(系统在预测多类问题时会有一些滋扰)。不外,我们发现研究小组也在试图解决这个问题。

在筛选人群的历程中,“参考”疾病的患病率在10%以下,所以这是一个高度不平衡的任务。因此,他们接纳了分外的阳性病例以扩增训练数据集,令患病率到达30%。这样,训练效果获得了提升。而且,系统对其临床普遍性约为8%验证数据体现的较好。

可是,这种扩增较少的数据类型的方法只有在有更多的阳性案例情况下才有效,这种情况并不常发生。现在已经有了一些解决不平衡数据的方法,可是仍然没有找到一个解决不平衡数据的最佳方式。

这里另有两个关于数据质量的有趣的现象。首先是数据的下采样。这个系统在比人类观察到的图片少98%像素点的情况下,能否观察效果和人类一样呢?我们可以肯定的说,这个系统真的可以做到。

固然前提是大部门抛弃的像素必须是无用的噪声信息,否则会使深度学习系统训练的历程越发艰难。人类比盘算机更善于忽视视觉噪音。

这个意义实际上更深远,因为深度学习系统已经在许多场所用来处置惩罚小型图片,但对于百万像素的大型图片**的处置惩罚,还从没有过很好的效果。实际上,高分辨率图像可能包罗更多有用的信息,可是并不能适用于深度学习系统。下采样的设想引发了一系列的问题讨论:深度学习能对高分辨率图像有更好的训练效果吗?低分辨率的图像是否适用于所有的医疗任务呢?从技术的角度来看,我们是否可以在深度学习中接纳高分辨率图像呢?我不知道这些问题的谜底,可是在接下来的几个星期,我们会通过阅读其他的论文来明确这些问题的谜底。

关于数据的质量的第二个有趣的内容就是标注的质量问题。在机械学习中,我们需要很是准确的信息。也就是说,我们希望训练数据能够被正确的标注。好比视网膜病变的训练数据就应该是真正的视网膜病变。

leyu乐鱼全站官网

这些理论说起来很容易,但在实际操作中,医生们对疾病的诊断意见经常会泛起分歧。所以,论文作者只是提供了数据。你可以从这幅图中看到,对于中等或中等以上水平的疾病,有80%的概率,至少有一个医生得出了与其他人纷歧致的结论!所以,使用一致的标签就是为了淘汰可能泛起的人为错误。然而数据集中的标签错误很难制止,而且危害着模型的性能。

深度学习可以学习到任何你给它的工具。反过来说,如果标注泛起问题,深度学习机械很容易做出误判。有一个告竣共识的标注并不是解决这个问题的唯一方法。一些任务可能有更准确的信息,例如我们下周会看到的一篇关于皮肤病变的论文。

这篇论文中的每个病变都有病理学家给出的活检证实的诊断,可是变化不大。在极端的情况下,一些任务有很是完美的标签。我自己的一个项目就在关注着一个不能被误解的标签——死亡率。

我认为标签的关键在于你能获得的和你所投入的工具成正比。如果你使用个体医生的标签,至少你能和这个医生一样优秀。如果你使用共识性的数据,你将会比其中的任何一小我私家更厉害。

如果你完整的使用校正信息,你可能会完美地完成任务。影响:我对作者提出将医疗机械人作为疾病筛查工具的想法表现衷心的佩服。

他们展示了机械和眼科医生一样的运行效果(假阳性率较低,但缺少一些阳性病例),同时还显示了系统优化筛选时的效果(识别险些所有阳性病例,但另有几个假阳性)。这些系统和医生相比有一个主要的优势:人类医生在假设的ROC曲线上有一个单一的操作点,这是基于他们履历的敏捷度和特异性的平衡,而且很难用任何可预测到的方式去改变。

相比之下,深度学习系统可以在ROC曲线的任何地方运行,不需要再加分外的训练。你可以在诊断模式和筛选模式之间举行切换,而且不需要分外的用度,这种灵活性真的太酷了!在实际的临床测试中很是有用。思量到羁系部门,这项研究已经靠近于临床使用的水平。他们验证了从真实医疗中筛选的数据集的模型,而且每个案例都有多个到场者。

这项称为MRMC研究,也是FDA用于盘算机辅助检测系统的一般证据尺度。只管我们并不清楚这项研究和诊断系统的关系,可是如果这个系统或者类似的系统在最近两年里取得了FDA批准,我并不惊讶。

这项任务在医疗用度方面还是很可观的。眼科并不是医学的一大部门,在成本方面,眼睛检查也并不会很昂贵。

如果这个用人工智能举行眼部病变筛检的技术能获得推广,那么它人类的影响会很是大。在许多生长中国家,糖尿病病情日益严重,可是眼科专家奇缺。

鉴于图像处置惩罚在低分辨率的图片上上乐成率跟高,如果能将该系统与低成本且易于使用的手持式视网膜摄像机联合起来,可以挽救数百万人的生命。然而,纵然人工智能可以取代医生对视网膜病变举行评估,这对医疗事情的影响还是很局限。而且,我认为视网膜病变筛查自动会很容易导致医生事情量增加,因为以前未确诊的患者现在也需要进一步地评估和治疗。

现在我们只讨论了对视网膜病变的评估,在我们再看几篇论文以后,我们将能够探索医疗自动化轨迹的生长意义。接下来我会看看斯坦福大学的论文,他们声称训练的深度学习系统可以实现“对皮肤癌举行分类”。曲线上眼科医生的效果的漫衍让我以为很是惊讶,因为差别的医生可能做出很是差别的预测。其中有的医生认为有0个假阳性,而其他的医生认为有10%的假阳性。

这是一个很大的错误规模。已经使用了一些解决方案,例如首先将图像举行切片操作。

但这通常会大量增加负面例子的数量,加剧了数据不平衡的问题。


本文关键词:leyu,乐鱼,体育,官网,入口,-2021,人工智能,深度,leyu乐鱼体育官网入口

本文来源:leyu乐鱼体育-www.jmccja.com