联盟动态 特别推荐
联盟观点 | 大数据:助推城市公共服务升级,让城市发展更智慧
2020-11-13


      信息技术与经济社会的交汇融合引发了数据的迅猛增长,数据已经成为国家基础性战略资源。大数据在各行各业交叉编织,作为一种重要的生产要素,在全球经济中发挥着重要作用。

      通过汇集和分析大数据,模式识别和决策优化有助于降低生产成本,提高产品和服务质量。作为信息社会的重要生产要素,大数据正在不断渗透到医疗、教育等公共服务领域,催生新业态、新模式和新服务,促进产业转型变革,让城市发展更智慧。


健康医疗大数据


      健康医疗大数据技术需求凸显


      中国健康医疗大数据已进入了初步利好阶段,国家作为政策引导方,已出台了多余条“纲要”或“意见”,可穿戴设备、人工智能等技术的发展也为产品研发奠定了基础。

      医疗产业已经沉淀海量数据,且数据类型及数据量还将持续增加,但医疗数据在过去并未得到有效处理。另一方面,中国面临着慢病发病率提升、临床决策失准及医疗资源配置不均衡、重复诊疗等问题。医疗大数据治理可以在“海量数据”与“医疗问题”之间架起一条通路。数据互通可以优化各应用场景的体验,各应用场景产生的数据又可以进一步丰富数据,由此形成一个价值闭环。

      健康医疗大数据领域涉及的相关技术范围非常广,如底层数据采集中包括信息化、物联网、5G技术,处理分析中包括深度学习、认知计算、区块链、生物信息学及医院信息化建设等。据IBM统计,全球大健康数据正以每年48%的速度增长,在2020年数据量将超过2300Exabytes。BI Intelligence预估2020年,全球健康物联网设备出货量将达到161万台。院内数据方面,CHIMA在2016年统计,医院管理信息系统整体已实施比例在70-80%之间,且集中于三级医疗机构,大量健康医疗数据的积累为算法搭建提供了基础。在处理分析方面,人工智能、生物信息学需要与实际应用场景相结合,以便搭建有效模型。


      健康医疗大数据技术应用广泛


      大数据技术的应用,将从体系搭建、机构运作、临床研发、诊断治疗、生活方式五个方面给大健康行业带来变革性的改善。

      ● 医疗体系方面,通过区域信息化、在线问诊、远程医疗等技术连接上下级医院机构,实现医疗资源优化配置,电子病历共享等措施,最终提升医药供给效率和能力。制定更优的付费机制,将按服务收费转变为基于价值的付费机制,如DRGs。

      ● 机构运作方面,通过商业智能,优化供应链及患者管理,提升医院、诊所、药店等传统医疗机构的管理效率,提升就医体验。提高工作效率,加强员工培训,改善薪酬机制,调动员工积极性。

      ● 临床研发方面,通过基因测序、影像识别等技术挖掘更多维度的数据,缩短临床验证周期,提升新药研发效率。在诊断治疗方面,通过认知计算、机器学习等技术,实现精准治疗,辅助提升医生诊断治疗效率,提高医疗服务质量。在生活方式方面,通过可穿戴设备、在线问诊、远程医疗、人工智能等技术间的相互配合,为用户提供健康管理、疾病预测、提供有效的干预方案,降低医疗费用支出。

      从细分业务看,健康医疗大数据有助于个性化健康方案制定,以“大数据”作用“小个体”,实现精准干预。其核心是健康风险的评估和控制。新型健康管理系统是利用云计算、大数据信息技术充分挖掘大量人群健康状态的数据,针对不同健康状态可个性化的健康干预诊断指标体系,可成功地阻断、延缓、甚至逆转疾病的发生和发展进程,从而达到维持健康状态、“治未病”的目的。在优质数据源基础上,如能实现随访信息动态记录,则更有助于提升结果准确性、方案专业性,使得企业在这一赛道的竞争中凸显优势。

      健康医疗大数据有助于实现电子病历异地查看,提升就诊效率,消除数据分析障碍。结构化电子病历优势十分明显,❶大大降低病历出错的概率,避免用词的随意性,给今后的数据收集、研究提供了方便。❷支持电子病历查询统计和数据挖掘。❸可根据临床需要对电子病历按照模板层次结构进行查询。四是方便共享。

      健康医疗大数据有助于实现辅助诊疗,如下图所示,影像组学这一概念起源于肿瘤学领域,之后其外延扩大到整个医学影像领域,即从CT、MRI、PET或SPECT等影像中高通量地提取大量影像信息,实现感兴趣区(通常指病灶)图像分割、特征提取与模型建立,凭借对海量影像数据信息进行更深层次的挖掘、预测和分析来定量描述影像中的空间时间异质性,揭示出肉眼无法识别的图像特征。以往,医学影像前处理+诊断需要4-5名医生参与。而基于影像组学与大数据技术,训练计算机对医学影像进行分析,只需1名医生参与质控及确认环节,这对提高医疗行为效率有很大帮助。影像组学解读“数据语言”、AI辅助阅片将作用于疾病早筛及诊断,是医学影像的发展方向。


图  基于影像组学与大数据的医学影像分析流程


      健康医疗大数据构建基于海量数据的医学知识图谱,实现用户与“机器医生”的线上会话。智能问诊应用是通过采集与分析海量医疗数据、专业文献,构建医学知识库,经人工智能的产品设计实现的。智能问诊系统在该过程中收集并整理的大量症状描述,又可以作为训练数据优化机器学习成果,从而使智能问诊结果更准确。


      借助健康医疗大数据:

      ❶  企业提供服务(有些企业也可提供器械)以辅助设计临床科研、积累有价值的科研数据、将收集的数据转换成科研的成果。目前,一些企业已形成一套基于医疗大数据的医学科研解决方案,可以完成包括文献检索和系统评价、研究方案优化设计、单病种科研数据中心建设、真实世界研究、生物医学信息挖掘、药物及器械上市前临床试验设计等内容在内的一站式服务。

      ❷  目前医药研发主要存在研发周期长、研发成本高、研发失败率高等问题,大数据可以应用到医药研发多个阶段以缓解痛点。真实世界研究日益成为医药研发的发展趋势,建设合规的真实世界数据查询平台可以很大程度地提升真实世界研究效率和准确率。

      在医院管理方面,基于大数据整合的医院管理系统可从医院数据、信息分布式管理出发,集合各种异构数据,建立数据信息用户中心等方式,全面提高数据信息管理水平。另外,大数据作用于医院、经办机构、门诊特殊疾病等对象,通过分析各种指标及数据共享,实现管理手段调整、强化监督、管理稽核等目标,解决医疗保险面临的基金收支平衡压力增大、医疗服务违规行为多发、传统经验决策方式落后等问题。


教育大数据


      教育大数据获得长足发展


      一般而言,教育大数据是指在整个教育活动期间产生的、以及根据教育需要采集到的,一切用于教育发展并可创造巨大潜在价值的数据集。大数据技术对于教育行业的发展意义重大,大数据技术驱动国家教育政策的科学化,促进各地区教育均衡发展,促进学校教育质量提升。

      美国是最早进行大数据理论研究、最早推动大数据技术发展和行业应用,也是最早提出大数据战略的国家。2008年,谷歌宣布在中国大陆启动云计算学术合作计划,与中国大学共同推动云计算在中国的普及。清华大学是最早参与该项计划的高校,与谷歌合作开设了“大规模数据处理”课程。北京师范大学创建了“教育大发现”网站,它利用谷歌“云服务”工具,将教育技术领域的专家、教师和资源连接起来,形成了一个学研结合型的社区。

      在国内,2015年,国务院发布了《促进大数据发展行动纲要》,对10个大数据工程进行了规划,并在“公共服务大数据工程”中明确提出要建设教育文化大数据。2017年,《国家教育事业发展“十三五”规划》中明确提出“要支持各级各类学校建设智慧校园,综合利用互联网、大数据、人工智能和虚拟现实技术探索未来教育教学新模式”。2018年,教育部印发的《教育信息化2.0行动计划》,提出利用大数据技术为学习者提供海量、适切的学习资源服务,深化教育大数据应用,助力教育教学、管理和服务的改革发展。在社会层面,教育大数据研究院、教育大数据重点实验室等专业机构陆续成立。

      目前,教育科技企业开放大数据,结合人工智能技术进行分析反馈,可以帮助企业和学校更好完善其教学方案,提升教育质量。通过开放数据,利用AI技术进行分析反馈,企业运用自己的技术实力和数据储备,为线下教育实体提供技术支持,促进了教育行业的发展。


      教育大数据应用场景非常广泛


      总体来说,大数据在教育中的应用主要有两大领域:

      ●教育数据挖掘(Educational Data Mining)

      ●学习分析技术(Learning Analytics)

       教育数据挖掘 是基于计算机系统的学习系统,交互学习环境,模拟学习环境,现有学校学习系统等采集用户学习行为数据。在心理学和学习科学的理论指导下,利用计算机科学、数据挖掘等领域的知识,发现学生是如何学习。发现或改进表征要学习的内容和最佳教学序列的领域模型。研究学习软件可以提供的各种教学支持的效果。通过构建包含学生模型,领域和软件教学法的计算模型,推进关于学习和学习者科学知识的提升。

      在教育数据挖掘领域,主要用到预测、聚类和关联挖掘等技术。预测模型已经被应用在理解在线教育的行为上,比如通过论坛表现和参加测试等等来预测哪些学生会学习失败,以及预测学生们的教育成果。聚类是通过一些共有的特征将学生分成几个类别,比如通过学生们的学习表现和交互模式,分组推荐学习动作和学习资源。关联挖掘是指发掘数据集中各个变量之间的联系,并将其编码形成规则,以便于之后使用。例如,关联分析可以识别在线购物中产品之间的关系。

       学习分析 主要是对学生的测验成绩进行预测和监控,并提出相应的干预措施。这样的学习模式不仅可以实现个性化学习的目标,可以对每一个学生提供不同的激励机制。所有学生的进步是在自己的基础上进行的,减少了横向对比的弊端,提高了学生的自我效能感。学习分析能够为教师提供详细的学生数据,它不仅可以告诉学生投入多少、了解多少,甚至还能提供信息让系统、教师改善教学方法。

      学习分析注重基于多模态数据的分析,如眼动数据、脑电图、皮肤电反应、心电图、社交网络数据、认知活动数据等,便于更立体、更精准地呈现学习者的信息。借鉴吸收了教育数据挖掘、教育理论、工程学等多学科的相关理论,需要融合多种研究方法和分析技术与工具,以便解决教育中遇到的实际问题。例如利用LATUX(Learning Awareness Tools-User experience)可视化学生的思维过程,并建立学习者模型,促进教师深度了解学生,用数据支持教学,实现精准决策。再如为保护隐私数据,开发了学习分析设计空间模型,为隐私泄露提供最及时的解决方案。