电子科技大学33岁教授用大数据预测老年痴呆症

20.12.2015  08:35

邵俊明(右)与德国总统高克(中)合影。

  判断是否患有老年痴呆症需要经过哪些程序?

  做认知度的调查问卷、抽血检验、脑部核磁共振……然后医生在这些资料的基础上凭经验判断患者是否得了老年痴呆症。

  不过,以后检查这样的疾病就不用那么恼火啦!

  33岁的牛人教授,把大数据和神经科学结合在一起,仅凭一张大脑的核磁共振图像,就能辅助医生提前预测出老年痴呆症。

  这位牛人名叫邵俊明,是电子科技大学计算机学院教授、德国“洪堡学者”、从事数据挖掘、概率论与数理统计的全英文教学。

  目前,他把类似技术也运用在了其他精神疾病诊断上,可通过患者脑部的核磁共振图片,成功判别出忧郁症、精神病、精神分裂等各种病症。

   /跨学科/

   留学慕尼黑 门外汉研究大数据与脑神经

  为啥子人家年仅33岁就是教授了,又为啥子能够有这种创新性的成果,看下履历,人家可是从德国慕尼黑大学数据挖掘中心学成归来的,要知道,那可是全欧洲最好的数据挖掘中心。

  邵俊明是四川内江人,出身农村的他家庭情况并不是很好,此前并未想到出国求学。直到2008年,国家留学基金委启动“公派研究生项目”,在西北农林科技大学攻读硕士学位的他才在导师的鼓励下,开始申请出国攻读博士学位。“你来我们这边吧!在数据挖掘领域,我们是德国最好的团队!”一封来自德国慕尼黑大学数据挖掘小组的邀请邮件吸引了他。

  这个研究团队以数据挖掘的基础理论研究为主,原本是计算机应用领域的邵俊明需要转行,重新学习数据挖掘。而导师更是给了他一个“不可能”的任务,以大数据挖掘为基础,参与神经医学的合作研究。

  除非用非常高倍的显微镜,不然是看不到脑神经的,但它又密切影响着人脑的各种功能。

  把大脑里面的神经纤维“可视化”,通过大量的案例数据,分析出不同大脑疾病之间大脑神经纤维的不同,从而可以对神经疾病做出预测,简单来说,这就是他需要研究的内容,但是这对于“数据挖掘”和“脑部医学”都是门外汉的邵俊明来说,当时完全“傻眼了”。

  他用了整整两年时间恶补这两方面的知识。2012年,研究成果终于面世。

   /开脑洞/

   仅凭一张大脑图像 就能预测老年痴呆症

  邵俊明向记者展示了几张图片,“你看,这是用核磁共振拍摄出来的大脑图像,仔细观察这几张图片,它们是不一样的。

  邵俊明介绍,这是用当前无创的神经影像技术拍摄出来的几张大脑画面,黑白色的脑部图像,不尽相同。通常,在研究的时候,一个大脑案例,邵俊明会拍摄32张核磁共振图像。大脑中的水分子,会沿着脑神经纤维扩散流动,磁场的梯度不同,水分子的流向也会不同。对比分析这32张图像,就可以看到大脑中水分子的流向,也就构建出了整个大脑神经纤维的三维立体图像。

  此后,就需要用到大数据挖掘的内容了,邵俊明需要用各种数据算法,把功能相似的神经纤维归类成束,并理清各个神经纤维束的功能,这样在某区块的神经纤维发生异变的时候,就能预测到患者将患什么样的疾病。

  而邵俊明研究的是老年痴呆症,他把50名老年痴呆症患者和50名健康人的脑神经纤维数据进行对比,成功找出老年痴呆症患者脑神经病变规律,基于此,通过一个人的大脑图像,便可辅助医生,成功预测老年痴呆症。“即便病变初期,病症不明显的时候,也能判断出来。”目前,邵俊明还利用这种方法在分析忧郁症、精神病和精神分裂症。

   创新性提出系列数据挖掘算法

  还记得你的微博、微信会莫名其妙地跳出一些广告吗?你是不是还搞不清楚为什么每次去超市都会多买很多用不上的东西?人家可不是乱发广告、乱摆放货物的,这都是大数据分析和运用的结果。

  “其实,脑神经纤维的项目只是我研究中很小的一个部分,我的研究方向偏理论一些,主要是做数据挖掘的算法。”邵俊明说。

  海量数据、高维数据和复杂数据不断涌现,传统的数据挖掘算法面对以视频、图片、文字等非结构化数据为主的大数据时,往往束手无策,缺少有效的分析工具和方法。如何让算法更加优化?邵俊明受自然同步现象启发,首次将其原理引入数据挖掘领域,创新性地提出了一系列数据挖掘算法。这种算法的优越性得到国内外同行的广泛认可,美国国际数据挖掘领域鼻祖之一的Philip S. Yu教授评价他提出的Sync算法是目前最先进的聚类算法之一。

  “只要有‘网络数据’的地方,就需要数据挖掘。”以社交网络为例,从繁杂的参与者中,通过数据挖掘算法,把兴趣爱好相投的人聚类在一起,这就是数据挖掘;对商场的顾客群体进行分析,采取精准营销;运用大数据模拟和预测,提高投入的回报率等等,都需要用到数据挖掘。

  “处于信息化飞速进程中的四川,在开发利用大数据的市场上,也存在着巨大的发展前景。”邵俊明说。