想用医院的数据练手神经网络,请问可以做些什么事? - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
这是一个专门讨论 idea 的地方。

每个人的时间,资源是有限的,有的时候你或许能够想到很多 idea,但是由于现实的限制,却并不是所有的 idea 都能够成为现实。

那这个时候,不妨可以把那些 idea 分享出来,启发别人。
ldd
V2EX    奇思妙想

想用医院的数据练手神经网络,请问可以做些什么事?

  •  
  •   ldd 2018-03-29 22:56:54 +08:00 7401 次点击
    这是一个创建于 2813 天前的主题,其中的信息可能已经有所发展或是发生改变。

    我是做 HIS 的,也就是医院信息系统。

    现在正在学习神经网络,学了很多了,想要实践一下。正好手边有很多家医院的数据库,想利用神经网络 + 医院大数据做个有意义、难度又不是很大的事情。

    本来想着“预测下一日 /下一小时的就诊人次”,这样难度应该不大。但是又转念一想,这样的预测做出来也没什么意义,也不值得提供给医院管理层去分析什么,所以想请各位说道说道,集思广益一下,看看有什么值得做又不是太难的。

    PS:这些数据都只是我一个人使用,不会拿来对外的。

    第 1 条附言    2018-03-30 11:29:02 +08:00
    我的这些数据都是存储在数据库的,完全结构化、标准化。包含所有运营数据、就诊数据、病人信息、消费明细……

    大家的思路可以再开拓一些,比如:
    1.本身医院也是一家企业,可以站在企业角度来分析这些运营数据。
    2.其实可以有三个面,目前第 2)的回帖比较多一些
    1 )患者:自助导诊
    2 )医生:辅助诊断
    3 )管理层:分析本院人源画像、主要收入来源……


    PS:数据不外给,请自重。
    67 条回复    2018-04-09 23:04:23 +08:00
    imn1
        1
    imn1  
       2018-03-29 22:58:52 +08:00
    什么数据?
    ldd
        2
    ldd  
    OP
       2018-03-29 23:01:01 +08:00
    @imn1 所有的运营数据,包括医嘱、诊断、处方、计费等等等等
    murmur
        3
    murmur  
       2018-03-29 23:01:41 +08:00   1
    能拿到一些高清的 ct 或者核磁片子可能做一些图像处理的东西
    其余的似乎没卵用。。。
    SorryChen
        4
    SorryChen  
       2018-03-29 23:02:23 +08:00   1
    现在医疗很多结合机器学习,当年很早的时候,贝叶斯网就在国外来诊断结核病,现在也有很多用医疗影像结合深度学习做辅助诊断的,还有很多用病例记录做预测的,记得读过一篇论文,很诡异的名字:DeepDeath = =预测你怎么死
    hinate
        5
    hinate  
       2018-03-29 23:03:55 +08:00 via iPhone   1
    可以做推荐,根据病人的描述给出初步的诊断及治疗方案...之后不断优化推荐算法.(胡思乱想)
    ldd
        6
    ldd  
    OP
       2018-03-29 23:05:45 +08:00
    我是楼主。

    除了图像分析,有没有其他的点?我的这些数据都是存在数据库的,完全结构化、标准化。包含所有运营数据、就诊数据、病人信息、收入明细。

    我的初衷是用神经网络分析出来点什么结论、或者预测出点什么趋势,来提供给医院管理层参考
    murmur
        7
    murmur  
       2018-03-29 23:06:21 +08:00
    @SorryChen 肺结核确诊不是靠细菌培养么。。
    feverzsj
        8
    feverzsj  
       2018-03-29 23:08:20 +08:00
    预测人次,那是统计学的事情,要自己训练神经网络没这么简单的,你如果以为拿一堆数据塞进去就能出结果,那是天方夜谭
    hcymk2
        9
    hcymk2  
       2018-03-29 23:09:18 +08:00   1
    其实可以试下做分类。
    murmur
        10
    murmur  
       2018-03-29 23:09:38 +08:00
    @ldd 个人外行的感觉现代医学特别依赖仪器检验 有了检验科的结果你靠百度也能诊断
    但就是这种牛逼的仪器和靠谱的检验科难找
    小时后肺炎误诊的路过
    真的。。牛逼。。小医院拍 X 光愣是没看出肺部有问题来

    患者是不会按课本生病的 何况你用神经网络预测出的结果和医生首诊的结果也差不了多少。。。
    yu099
        11
    yu099  
       2018-03-29 23:15:45 +08:00 via Android
    之前谷歌的那个 ai 公司不是刚搞出来心脏的一个图像诊断分类的吗?似乎有九十几的准确率,人类七十几,但似乎那样也没用,疑难杂症还是得有经验的医生,结果出来医生还是得自己复核一遍,似乎还没什么卵用
    ldd
        12
    ldd  
    OP
       2018-03-29 23:24:18 +08:00
    @hcymk2 分类这个点提醒了我,可能有搞头,比如根据就诊情况,提前判断某个门诊病人是否会住院……还不够有意义,我再深入想想,可能这个方向是对的
    SorryChen
        13
    SorryChen  
       2018-03-29 23:28:14 +08:00 via iPhone
    @mumur 如果你学学贝叶斯网就知道了,根据很多症状来判定
    murmur
        14
    murmur  
       2018-03-29 23:29:22 +08:00
    @ldd 这个是没法提前判断的啊,判断病人会不会住院要等诊断结果出来再说
    而且有的病是可以住院可以选择每天来门诊的
    或者是有钱人选择比较刺激的治疗方法。。比如全麻拔牙。。一次搞定所有智齿。。刺激不

    所以判断某个门诊病人是否会住院其实就 3 点:1、钱够不 2、床位有不 3、病多重

    1 和 2 不用 AI 也能判断出来 3 的话没诊断结果也预测不了
    。。。所以还没卵用
    murmur
        15
    murmur  
       2018-03-29 23:30:14 +08:00
    @SorryChen 你忘了一点,病人的主诉是不准的,甚至有时候有的病人看了百度会胡说八道
    但是诊断结果是不会撒谎的
    所以症状只能是医生做什么检查的参考
    最终还是以仪器诊断为准
    murmur
        16
    murmur  
       2018-03-29 23:31:22 +08:00
    有句话说叫,内科怕发烧,外科怕腹痛,症状就摆在这,你的贝叶斯去诊断吧
    SorryChen
        17
    SorryChen  
       2018-03-30 00:05:39 +08:00 via iPhone
    @murmur 不是啊...我只是举了个贝叶斯诊断结核的例子...这是个很有名的例子啊……节点都是表示的类似去没去过亚洲,咳不咳嗽这种很明确的特征了,那你要说我咳嗽到要死我非给医生说我不咳嗽,那什么都不管用。这个诊断系统微软开发的人在国外比较知名了。
    327beckham
        18
    327beckham  
       2018-03-30 00:08:09 +08:00
    看一下最近的 kaggle 上正在进行中的 data science bowl 喽
    jowuIM
        19
    jowuIM  
       2018-03-30 00:35:25 +08:00
    一个医院的数据集太小了,你以为能做什么?不是大数据,不如 excel ?
    shoaly
        20
    shoaly  
       2018-03-30 07:51:42 +08:00
    可能 最有戏的就是 分析 CT 照片的图像了...
    murmur
        21
    murmur  
       2018-03-30 08:09:56 +08:00
    @SorryChen 知乎那个我是看了的
    根本不需要那么麻烦
    直接一个 DR 一个痰培养一个抽血就搞差不多了
    如果说为啥国内这几年才搞什么 AI 诊断 国外是因为诊疗成本太高 等的太慢才靠患者主诉搞什么贝叶斯诊断 国内不确诊一个痰培养做出来就完了么 还要那么多主诉干嘛

    真的国内 X 光太便宜了 抽血拍片一套搞定就 100 来块钱 一个 DR 片社区报销才七八十块钱 胜过千言万语
    贝叶斯这种东西也就停留在理论研究 在国内落地乘上患者巨大基数能把任何一个医院告破产
    有些东西永远是技术解决不了的
    一是检查是要花钱的 有些检查是小医院做不出来的
    二是某些诊断真的是金字指标 但是这些东西大多数都是创伤检查 比如穿刺活检
    三是某些病例即便是诊断出来了,你也无能为力,典型的就是癌症,太小了拍片拍不出来,等拍出来已经扩散了
    binux
        22
    binux  
       2018-03-30 08:10:15 +08:00
    @feverzsj 你把 (星期几+时间=>就诊人数) 扔给神经网络它也能训练出来的,我觉得和统计的没区别。神经网络会把结果记下来。。
    Felldeadbird
        23
    Felldeadbird  
       2018-03-30 08:19:03 +08:00 via iPhone   1
    可以分析季度流行病?
    ldd
        24
    ldd  
    OP
       2018-03-30 08:39:02 +08:00   1
    @murmur 纠正几个误区
    1.仪器是用来确定和排除病情的,具体的治疗方案和程度拿捏还是靠医生。
    2.跟据拍片结果做出诊断,除了和仪器精度有关,也和技师的知识库有很大关系。
    3.病人的主述是公认的确定病情的有效依据,更何况记录下的主诉都是医生再整理的,有一定的参考价值。
    4.癌细胞是由病理切片分析,不是拍片,初期就可以确认。
    omph
        25
    omph  
       2018-03-30 08:49:23 +08:00
    更适合用统计学吧,神经网络不是包打一切的
    murmur
        26
    murmur  
       2018-03-30 08:53:01 +08:00
    @ldd
    1、但是的却是高端仪器的普及让误诊率下降了不少,以前我在校医院做尿检就那么一个小纸条,现在密密麻麻能打满半张 B5 纸,当然有一部分是尿沉渣有一部分是镜检复查,不过的却首先,你得有仪器啊,尤其是几百万几千万的 CT MRI 不是想有就有的起的
    2、这个同意,但是我也怀疑
    3、靠谱的主诉当然有效,但是现代仪器检查能让肚子疼、发烧这些主诉落到具体某个病或者某些病上,尤其是对于表达能力有限或者查阅百度胡思乱想的患者
    4、同意,但是病理切片不是随便做的啊,有的可以穿刺有的要做术中病理,但是没有拍片检查哪里有上来就穿刺或者开刀的
    murmur
        27
    murmur  
       2018-03-30 08:53:47 +08:00
    @murmur 2 打漏了,我从来没质疑或者认为高端技师会失业
    green15
        28
    green15  
       2018-03-30 08:54:34 +08:00 via iPhone
    我知道的,IBM 和 Google 就是在做楼主说的这套东西……
    Len1133
        29
    Len1133  
       2018-03-30 09:06:54 +08:00   2
    识别处方上的汉字。。。算了,难度太大了
    ldd
        30
    ldd  
    OP
       2018-03-30 09:08:16 +08:00
    @Len1133 汗……现在都电子化了,都在电脑里录处方,用第三范式存储,我的数据库就包含这些
    ldd
        31
    ldd  
    OP
       2018-03-30 09:17:19 +08:00
    @Len1133 哈哈哈,刚看明白,玩笑啊。确实,难度太太太太大了。
    murmur
        32
    murmur  
       2018-03-30 09:28:37 +08:00   1
    有点水了 总结一下我认为可能落地的方面
    1、影像诊断,理由不说了,很多大厂也都在投资,不过这个对数据要求很高,我看一个文章说参加数据标注的都是高年资医生,确保图像清晰、标注准确、诊断无误,也就是要求每一个训练数据都做到金字指标的要求,这个怕是楼主做不到吧
    2、知识库,就是让医生不要忘记那种罕见病的可能性,不过现在怕是中小医院诊断不了直接让转大医院,因为就算诊断出罕见病也不好治疗
    3、罕见病、癌症、基因相关,这个也是楼主搞不了大厂加名医才能联合做的,常见病都有金字诊断指标,不需要什么 AI 只要检查到位可以几乎不误诊,但是癌症这个就难治了,有的诊断出来化疗甚至是进口药都不好使,所以国外一些机构貌似在研究基因和治疗效果的关系,这种没有成文的、需要探索的才是机器学习大显身手的地方
    barble
        33
    barble  
       2018-03-30 09:48:32 +08:00
    我觉得可以根据病人陈述去追溯一些不明原因的疾病的病因,比如川崎病、突发性耳聋等
    Morriaty
        34
    Morriaty  
       2018-03-30 10:08:28 +08:00
    楼主愿意分享下数据吗
    murmur
        35
    murmur  
       2018-03-30 10:24:13 +08:00
    @Livid 已经有人开始跟楼主要数据了 涉及隐私的还是先删一下吧 虽然楼主可能真是自用 但是不经允许使用患者数据总归不好
    anteros
        36
    anteros  
       2018-03-30 11:10:33 +08:00
    根据妇产科孕妇的 x 光片的各项指标值,配合产后婴儿性别做分析与筛选。最后要求得出结论,哪几项指标决定了胎儿的性别。凭借这个,财务自由没问题的。
    murmur
        37
    murmur  
       2018-03-30 11:13:29 +08:00
    @php01 这东西还用的到 AI b 超的是个医生都能看出来 这不是大陆法律禁止的问题还要机器学习干嘛
    或者不在大陆做 去香港做就行 不在香港很多小诊所都偷着可以做性别鉴定
    anteros
        38
    anteros  
       2018-03-30 11:20:03 +08:00
    @murmur 做个网站还能用 0 和 1 敲出来呢,只是每人这样做而已
    murmur
        39
    murmur  
       2018-03-30 11:22:42 +08:00
    @php01 在 V2EX 的讨论都要在法律允许的范围内进行
    awenxjtu
        40
    awenxjtu  
       2018-03-30 11:40:24 +08:00 via Android   1
    从病例入手,分析症状是哪些,比例多少,什么症状容易忽视导致恶果,用了什么药,效费比如何
    Phox
        41
    Phox  
       2018-03-30 11:58:19 +08:00   1
    可以帮助更多人,比如根据大数据分析年龄,体温,心跳,用药,等分析出未来一两天内晚上可能需要急救的病人
    Doodlister
        42
    Doodlister  
       2018-03-30 12:08:31 +08:00 via Android
    @Morriaty 违法的兄弟。
    murmur
        43
    murmur  
       2018-03-30 12:12:54 +08:00
    @Phox 未来需不需要急救在他入院的时候基本就知道了,还需要预测么
    另外不可能因为你预测出未来没有患者需要急救就给医生护士放假
    预测失败就是人命关天 成本太高了 没人敢用预测给急诊科或者重症科安排排班表
    hcymk2
        44
    hcymk2  
       2018-03-30 12:15:43 +08:00   1
    其实也先试下分诊辅助,这个风险最小。
    zhouyou457
        45
    zhouyou457  
       2018-03-30 12:39:01 +08:00 via iPhone   1
    流行病学统计?根据患者描述与检测报告,再加上患者的各类疾病的患病风险,给予医生辅助分析诊断,还可以提供医疗建议...
    easylee
        46
    easylee  
       2018-03-30 12:42:10 +08:00
    “ PS:数据不外给,请自重。”
    点赞!
    zeraba
        47
    zeraba  
       2018-03-30 12:43:51 +08:00 via Android   1
    优化诊断流程方面,医院可以想象成一个工厂,每个科室是一条流水线,它们公用了几个车间,分别是血常规,B 超之类的检验科,在资源有限的情况下,如果一个病人需要做多重检测,可以根据每种检测所需时间做个推荐,先去某某窗口做 A 检测,再去某某窗口做 B,做为一个病人不可能跑去不同的地方先去看看排队情况,他们也不了解每个检测的所需时间,这个可以帮助更快的诊断。当然还有很多思路,大体方向一个是提高总体营收,提升效率,另一个可以是减少成本,比如药品库存的控制等等
    zhaojjxvi
        48
    zhaojjxvi  
       2018-03-30 12:45:52 +08:00 via iPhone
    先考虑清楚这部分数据能不能用
    idler
        49
    idler  
       2018-03-30 13:25:26 +08:00   1
    外行好奇问一句,楼主将这些数据用于未知用途不用经过患者同意吗?还是已经经过同意了?因为我感觉这件事里,医院如同 Facebook,楼主如同 Cambridge Analytica。
    ayumilove
        50
    ayumilove  
       2018-03-30 13:25:46 +08:00   1
    对于公立三甲医院,HIS 当中 取得的数据,目前 大部分 还是被用于 医院评价科室 医保(自费)药品、器材比例 分析上。
    领导需要的 这些数据 基本用不到神经网络。
    ayumilove
        51
    ayumilove  
       2018-03-30 16:16:54 +08:00
    除了 AI 自动根据 PACS 影像诊断病情以外,
    以上提出的 功能 在 通过 HIMSS 7 级认证的 医院都基本具备。
    logOo
        52
    logOo  
       2018-03-30 16:21:07 +08:00
    我擦,感觉到了一丝丝恐惧啊,icloud 迁到贵州就被喷成那样,您这随随便便就生产数据了?
    XinLake
        53
    XinLake  
       2018-03-30 16:48:40 +08:00
    美图不是号称 AI 发现生病么。

    拿一堆疾病皮肤图片数据集训练,然后自拍图跑神经网络模型,看看能不能检测出疾病。
    csx163
        54
    csx163  
       2018-03-30 16:50:54 +08:00
    觉得这个帖子是违法的,而且不道德
    northisland
        55
    northisland  
       2018-03-30 16:54:56 +08:00
    依照年龄、生病部位、身体状况什么的,做个聚类

    然后,别人可以根据自己情况,查看自己的病得花多少钱,还有几年好活
    murmur
        56
    murmur  
       2018-03-30 16:56:23 +08:00
    @northisland 这就是预后么,你想问的话医生会告诉你的,干嘛要自己根据软件查自己寿命
    ss0xt
        57
    ss0xt  
       2018-03-30 17:07:23 +08:00
    楼主是医院内部信息科的人还是 HIS 厂商的实施人员??数据这么容易拿?
    banksiae
        58
    banksiae  
       2018-03-30 17:14:02 +08:00
    国内有个新兴公司,就是做你这个的,前几天好像刚拿到融资,利用 AI 手段给医生提供诊断支持,具体的名字一时想不起了
    lekai63
        59
    lekai63  
       2018-03-30 17:16:32 +08:00
    楼主可以帮忙解答一下关于数据合规性方面的问题么?
    可能会要给社区医院做一套慢病管理的解决方案,其中会涉及病人电子病历、数据的管理。本来是想加点有意思的元素:比如采用区块链相关技术,将数据存储于联盟链上。防止医院单方面修改,在医患关系中能以不能篡改的电子病历作为一项证据。
    目前暂未实施
    有个问题就是,我作为系统开发商(即医院、病人、卫计委等之外的服务机构),是否可以存储该区块数据相当于我第三方存了这些数据,不知道会不会违规。
    qinrui
        60
    qinrui  
       2018-03-30 17:18:04 +08:00 via iPhone
    病人特征交叉分析,比如发现某类病人具有某些特征,然后筛选出符合这个特征的尚未得病的人,进行风险预警。

    我手上也有一批数据,按人头算是千万规模,时间序列的数据有 10 亿条,也想分析出一些有价值的东西,但不知道用什么工具或者方法,求指导。
    lekai63
        61
    lekai63  
       2018-03-30 17:19:07 +08:00
    至于数据应用,你跟个内行的医生聊聊就会有很多可以实操的东西拉,比如:
    横向的:同一科室不同医生的诊疗流程、给药习惯可能存在比较大的差异。
    纵向的:同一医生多年来诊疗流程、给药习惯的变化、趋势等
    只是举个例子,可能进一步分析下去会有更多的发现哦~
    goodbest
        62
    goodbest  
       2018-03-30 17:20:25 +08:00 via iPhone
    医生手写处方识别…
    lekai63
        63
    lekai63  
       2018-03-30 17:30:25 +08:00
    by the way
    不知道楼主 base 何方,患者数据的分析(即隐去敏感的患者个人信息后),尤其是心血管方面的。如有机会,希望能聊聊看。我们有技术团队以及浙江省心血管领域的权威专家,比较关注医生在诊疗和给药过程中的行为数据,研究不同行为下给病患带来的影响。(比如诊疗步骤 ABCD,有的医生走 ABC,有的走 ACD。开的药也会不太一样。需要结合病症、愈后效果等交叉分析。)
    eric1202
        64
    eric1202  
       2018-03-30 17:31:44 +08:00
    医疗软件系统 是每个地区都不一样的吗?你们数据库怎么同步?
    evanvane
        65
    evanvane  
       2018-03-30 20:43:35 +08:00 via iPad
    作为医生,只想说你这种行为还是偷偷做的好,有点令我恶心。
    letitbesqzr
        66
    letitbesqzr  
       2018-04-01 00:49:36 +08:00
    请问医院有同意你使用这些数据进行分析了吗?
    chentydev
        67
    chentydev  
       2018-04-09 23:04:23 +08:00
    自助导诊和辅助诊断都不可行。相比于模糊的就诊数据,自助导诊更依赖于基于精确医学知识构建的规则树。医学影像的计算机辅助诊断确实会用到很多数学、计算机算法的东西,但是这块门槛也比较高,本身没有扎实数学功底又不懂医学的连入门都困难,更别说创新了。以前读书的时候影像科的老师给了一个基于小世界模型的脑部 CT 还是什么分析的文章,我表示作为普通工科学生读过之后完全看不懂里面的数学模型。
    单纯就这一堆数据而言,我觉得还是做做传统的数据可视化和基础统计分析比较靠谱,比如 XX 病种平均开销 17 年 X 元,18 年涨到 Y 元; XX 科室中药开得多; XX 科室自费病人多。这些数据就算强行弄弄预测什么的,也没什么实际意义啊。
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     3035 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 31ms UTC 12:37 PVG 20:37 LAX 04:37 JFK 07:37
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86