故事一:
1992年,抗抑郁药物帕罗西汀(Paxil)获准上市;1996年,降胆固醇药物普拉固(Pravachol)正式开售。两种药品生产企业的研究证明:每种药物在单独服用时是有效且安全的。可是,患者要是同时服用两种药是否安全,没有人知道,甚至很少有人想过。美国斯坦福大学的研究人员应用数据挖掘技术分析了数万例患者的电子病历后,很快发现了一个出人意料的答案:同时服用两种药物的患者血糖含量较高。这对于糖尿病患者来说影响很大,过多的血糖对他们来说是一种严重的健康威胁。科学家还通过分析血糖检测结果和药物处方,来寻找隐藏的规律。
对于单个医生来说,他所经历的同时服用这两种药物的病人是很有限的,虽然其中可能有少数的糖尿病患者莫名其妙地血糖升高了,但医生很难意识到这是由于病人同时服用了Paxil和Pravachol造成的。因为这是一种掩藏在大数据中的隐含规律,如果不是有人有目的地专门研究 Paxil 和Pravachol联合用药的安全性的话,个体医生是很难揭示这个规律的。但是,临床药品成千上万,我们怎么可能对任意组合的两、三种药联合应用的安全性和有效性进行逐一研究呢?数据挖掘很可能是一种有效的、快速的、主动式的探索多种药联合应用问题的方法!
研究者不必再召集患者去做临床试验,那样做的话花费太大了。电子病历及其计算机应用的普及为医疗数据挖掘提供了新的机遇。科学家不再局限于通过召集志愿者来开展传统的课题研究,而是更多地从现实生活中的实验中,如日常的大量的临床案例中,筛选数据并开展虚拟科研,这些并非来自计划的课题立项的实验数据,保存在许多医院的医疗记录中。
类似本案例,应用数据技术使得研究人员可以找出在药物批准上市时无法预见的问题,例如一种药物可能对特定人群产生怎样的影响。另外,对医疗记录的数据挖掘不仅将为研究带来好处,还会提高医疗服务系统的效率。
故事二:
上海的柴先生今年55岁,两年前因为冠心病放了4个心脏支架,之后一直服用 阿司匹林 、 氯吡格雷 、 美托洛尔 、 他汀 、 欣康 这5种药。柴先生听说放支架后氯吡格雷服用1年就可停掉,但是咨询了医生说法不一,柴先生很疑惑放支架后抗凝药到底要吃多久,而且长期吃会不会有药物副作用。冠心病其实就是冠状动脉狭窄或闭塞,引起闭塞血管远端的心肌缺血。所以,冠心病发作就要马上“打通”血管,改善心肌缺血。而“打通”血管有两个办法,就是不少患者都听过的“心脏搭桥”和“心脏支架手术”。不过,放了支架不等于后顾无忧,由于发展到冠心病的病人身体仍然存在多种危险因素,所以术后需要服用一些药物。
无独有偶,柴先生同时还患有糖尿病,经常需要服用 格列美脲降 糖药。治疗糖尿病的药物很多:①磺脲类胰岛素促泌剂:如格列齐特、格列美脲;②格列奈类促泌剂:如瑞格列奈;③双胍类:如二甲双胍;④糖苷酶抑制剂:如阿卡波糖;⑤胰岛素增敏剂:如吡格列酮;⑥DPP-4 抑制剂:如沙格列汀;⑦GLP-1受体激动剂:如利拉鲁肽等。
突然有一天,柴先生因为低血糖晕倒在家中,后来送医院急救才恢复过来。这一现象引起了研究人员的注意,因为已经有多起上述6种药一起吃而快速导致低血糖的案例。研究人员用SQL语句调取了上海5家三甲医院心内科行支架手术并糖尿病的患者、医嘱用药中6种药物一起用的患者并大量的随访资料数据,最后发现 6 种药物长期同时服用会导致低血糖的突然出现,病人马上晕倒,生命垂危。这又是一个很好的数据挖掘案例,如果没有大数据佐证 6 种药物的关联性,也许这一现象会被当成偶然事件而忽略,正是因为数据技术的出现,一个药物冲突的事件真相才被还原与发现。