课题四(基于情景感知的知识导航)
课题负责人:陈恩红:中国科学技术大学计算机学院教授、博士生导师,国家杰出青年基金获得者。现任计算机学院副院长、语音及语言信息处理国家工程实验室副主任、安徽大数据应用协同创新中心主任、安徽省计算机学会理事长,中国计算机学会理事。2014年全国数据挖掘会议程序委员会主席、2015年中国计算机大会(CNCC 2015)程序委员会共同主席、2015年全国大数据会议程序委员会主席等。承担了与阿里巴巴、华为、科大讯飞等的多项合作项目,在包括TKDE、TMC、TKDD、TIST,以及KDD、SIGIR、ICDM、CIKM等在内期刊、会议上发表论文100余篇,获KDD 2008最佳应用论文奖、ICDM 2011最佳研究论文奖、SDM2015最佳论文提名,2012年教育部自然科学二等奖。
课题骨干成员:何晓丰、刘淇、沈抖、张进、李春、许晶、周树忠
何晓丰:男,华东师范大学计算机科学与软件工程学院教授,博士生导师。2002年毕业于宾夕法尼亚州立大学计算机科学与工程系,获得博士学位。毕业后先后工作于美国能源部劳伦斯•伯克利国家实验室、雅虎实验室、微软搜索技术中心等。于2012年10月 加入华东师范大学。研究方向为机器学习,数据挖掘,信息检索,在线广告,知识图谱等。
刘淇:博士,中国科学技术大学计算机学院副教授。主要研究数据挖掘与知识发现、机器学习方法及其应用,着重于针对用户行为数据(如消费数据、社交数据、教育数据等)的建模和应用研究。2011年获得数据挖掘领域顶级国际会议之一IEEE ICDM的最佳研究论文奖,还获中科院院长特别奖、SDM 2015 最佳论文候选奖、中科院优博等重要学术奖励。担任了CCF大数据学术会议BigData2015、BigData2016的宣传主席、是包括IJCAI、KDD、WWW、AAAI、ICDM等国际会议的程序委员会委员以及国际期刊TKDE、TKDD、TC、TSMC-C等的审稿人和FCS青年AE。
沈抖:1997年至2007年先后在华北电力大学、清华大学、香港科技大学获得学士、硕士、博士学位;2007年至2010年在微软AdCenter实验室(AdCenter Labs)担任研究员、科研项目经理;2009至2011年在美国创办了Buzzlabs公司,后被CityGrid公司收购;2011至2012年任CityGrid Media高级技术总监;2012年回国并入职百度,目前任百度公司金融服务事业群组研发负责人,全面负责FSG的研发管理工作。入选了“北京市海外高层次人才”,被聘为“北京市特聘专家”,在数据挖掘、信息检索、自然语言处理、人工智能、大数据等领域的多个国际顶级会议(SIGKDD、SIGIR、WWW、AAAI、IJCAI)和期刊(JMLR、TKDD、TOIS、TKDE、CACM)中担任主席、组委、评委、编委,担任第22届国际数据挖掘大会(SIGKDD 2016)的工业程序委员会联合主席,第18届国际数据挖掘大会(SIGKDD 2012)的副主席、第21届国际信息和知识管理大会(CIKM 2012)工业程序委员会联合主席,创办了国际学术研讨会ADKDD并连续8年担任主席,先后发表了40余篇学术论文,拥有10多项美国专利,受邀在RecSys、ICDM等国际学术会议上发表主题演讲,合著了《大数据革命--理论模式与技术创新》。
张进:男,医学博士、执业医师,毕业于中南大学湘雅医学院神经内科专业,曾在浙医二院神经科从事临床工作五年,先后负责完成多个个国家级科研课题研究;现任杭州丁香健康管理有限公司(丁香园)CEO。
李春:副研究员,北京中科院软件中心有限公司副总工程师。曾在多家企业担任研发主管,带领团队从事智能手机操作系统核心及framework、移动应用平台和app的研发工作。曾参与多项国家重点项目,在嵌入式操作系统、协同工作环境、数据挖掘、企业信息系统和电子商务系统等方面有丰富的研发经验。
许晶:高级工程师,现任北京中科院软件中心有限公司知识管理总监。主要研究方向是嵌入式操作系统及其应用、企业信息系统等方面,参与过多项国家重点研发项目,曾获得北京市科技进步一等奖1项,获得国家科技进步二等奖1项。近年来致力于科技成果的转化及应用推广工作。
周树忠:男,执业药师、高级工程师,毕业于中国药科大学药剂专业,曾从事制剂新药研发与注册十五年,先后负责完成多个个国家级新药制剂研究和报批工作,入选杭州市新世纪“131” 优秀中青年培养项目;2005年开始从事互联网医药信息服务工作,现任杭州丁香健康管理有限公司(丁香园)副总裁。
课题参与单位:华东师范大学、中国科学技术大学、北京百度网讯科技有限公司、杭州丁香健康管理有限公司、北京中科院软件中心有限公司
任务介绍:
课题题目:基于情景感知的知识导航
课题任务:本课题主要对应科学问题中的“个性化、群体性、社会性和交互式情景感知”与“需求驱动的知识寻径”两项研究内容,旨在感知用户多样化需求与动态场景,以导航方式实现精准的问题求解。人类既具有层次性的组织行为特征,又存在认知需求的个体差异。随着知识库的动态扩展,用户情景具有的时变性使得个性化知识导航成为必须解决的问题。本课题拟结合同质性原理(homophily)和信息扩散理论,探索基于情景感知的知识寻径理论。本课题以用户的个性化、群体性、社会性和交互式情景为出发点,以构建易理解、低复杂度、可自适应的知识寻径为基本要求,研究可准确理解多层次动态用户情景的知识导航技术。
普适医疗示范应用说明、背景、预期等:
说明及背景:传统医疗专家系统需要医学专家的较高参与度,知识精度高,但缺少融合不同专家诊断结论的能力,缺乏患者个性化信息收集与分析能力,因而难以给出精准的诊断结果和康复建议。本课题研究用户情景感知下的知识导航,以糖尿病、痛风、高血压等典型疾病的辅助诊疗为示范应用,探索具有4P(Predictive、Personalized、Preventive、Participatory)特点的认知医疗新模式。该模式不仅依赖医护专家的知识,也依赖于患者病历、网络资源、医学文献等相关数据中挖掘的碎片化知识,体现出知识服务的群智性和个性化。基于大数据知识工程的认知医疗模式将为实现精准医疗的转型升级提供支持。
课题的参与单位丁香园拥有约500万生物医药专业领域注册会员,其中含超过200万医生,丁香园论积累了海量的医学信息,构建了国内公认的专业知识库丁香医生现总计有超过千万的大众用户。丁香园的参与,将有利于发挥丁香园/丁香医生的专业知识库和移动应用的价值,丁香医生的应用成果也可以作为平台产业化极具社会效益的实例。
预期目标:以丁香园与其它开放知识源为对象,融合100TB关于3个领域,即高血压、糖尿病和痛风这3种疾病的碎片化数据和知识,构建涉及这三种典型疾病的知识库。开展面向辅助诊断与培训的示范应用,建立PB级的网上数据和知识服务中心,用户数量超过200万。