大数据行业发展趋势及面临机遇和挑战分析
随着大数据厂商技术实力的提升,逐渐出现了能够提供多数据库模型的大数据平台技术。相比多种数据库产品的集成方案,多种数据库模型统一的大数据平台的优势包括:1)提升场景效率。同一份数据可以分别采用多种数据模型存放,解决不同场景的处理效率问题;2)统一分析管理。关联不同模型的数据,统一分析管理;3)降低运维成本。无需维护多种数据库,降低运维成本;4)降低数据持有成本,同一份数据在不同的数据模型当中不需要全量存储,不同模型只需要存储必要的数据内容即可,在查询时可以通过关联的方式获取全量信息。
未来多模型数据平台将通过不断提高计算、存储引擎的处理能力,从操作响应速度、数据并发能力、数据管理成本等多个角度优化企业的数据需求,成为多模大数据平台的重要发展趋势。
为了处理 TB 以及 PB 级别以上的数据规模,分布式的架构将数据分散在网络上多个通过高速网络互联的节点上联合计算。因为数据分布在不同节点,在进行计算任务时,任务也会被切分成多个子任务,分发到多个节点上同时进行计算,能充分利用整个集群各个节点的计算资源、存储资源和 IO 资源,可线性提升集群的存储和处理能力。因此,分布式架构能较好的处理该类问题,这也是分布式架构相对于传统单机架构的核心优势。
在大数据场景下,分布式系统在扩展性、容错性、经济性、灵活性、可用性和可维护性方面具有明显优势,能够较好的满足大数据分析的需求。此外,近年来,分布式技术不断发展,在提供高弹性、支持高并发的同时,支持关系型数据库中强事务性的特性,成为大数据技术的重要发展方向。
面对客户日益增长的海量数据、多种数据结构的实时化、智能化处理需求,云原生的大数据平台架构凭借计算存储解耦、资源池化、Serverless 等核心技术,提供了高弹性拓展、海量存储、多种数据类型处理及低成本计算分析的能力。相比传统数据库,云原生数据库及数据管理平台天然具备灵活性,能够提供强大的创新能力、丰富多样的产品体系、经济高效的部署方式和按需付费的支付模式。
当前,丰富的数据要素资源已经涵盖了政府、金融、运营商、房地产、医疗、能源、交通、物流、教育以及制造业、电商平台、社交网站等众多领域。同时,由于数据的流通和利用是数据要素价值创造的前提。而跨域、跨中心的数据融合计算需求,以及数据要素在开放流通环节中的安全需求(包括“可用不可见”、“可用不可得”、“可用不出域”等),都使得数据的安全可信流通成为数据要素的市场化配置的重要一环,也是各行业数字化转型过程中和过程后的必由之路。
随着《数据安全法》、《个人信息保护法》的实施,以安全为前提的数据开放利用将迎来新一轮发展机遇。隐私计算是在处理、分析计算数据的过程中保持数据不透明、不泄露、无法被计算方以及其他非授权方获取的一种技术解决方案,能够在充分保护数据和隐私安全的前提下,实现数据价值的转化和释放,应用前景和商业价值巨大。在国家加速数据要素市场建设和重视数据安全和隐私保护的大背景下,数据安全防护技术、隐私计算技术的应用普及和商业化在加速进行。
普华有策信息咨询《2022-2027年大数据产业深度调研及投资潜力分析预测报告》
2021 年 3 月,在我国“十四五”规划和 2035 年远景目标纲要提出,培育壮大人工智能、大数据等新兴数字产业,充分发挥海量数据和丰富应用场景优势,促进数字技术与实体经济深度融合,赋能传统行业转型升级,打造数字经济新优势。2021 年 3 月我国提出,加快数字化发展,打造数字经济新优势,协同推进数字产业化和产业数字化转型,加快数字社会建设步伐,提高数字政府建设水平,营造良好数字生态,建设数字中国。
同时,自“新基建”在2018年12月我国首次提出以来,国家和各地政府已经密集部署了一系列围绕“新基建”建设的方针和政策。2020 年 4 月,国家发改委明确了“新基建”是以技术创新为驱动,以信息网络为基础,面向高质量发展需要,提供数字转型、智能升级、融合创新等服务的基础设施体系。
国家层面的积极政策为大数据行业的快速发展营造了良好的政策环境,企业和政府大力推动数字化转型,旨在实现企业运营和社会治理的效率提升。政府和企业持续加大在 IT 产品和服务方面的投入,以满足日益增长的业务数字化需求,大数据行业作为企业及政府数字化转型的关键基础软件,有望受数字化转型趋势的推动而带来重大发展机遇。
国内数据管理软件基本被 Oracle、IBM 和微软为代表的国外关系型数据库厂商主导,国产软件产品渗透率低。随着国内客户越来越重视数据与信息安全,国产软件产品在关键领域实现替代成为其中重要环节,越来越多的客户已经开始或计划相关软硬件的采购计划。
目前,为保障国家信息安全,自主研发的国产大数据生态体系正在形成,此前国产软硬件发展面临的格局分散、生态基础不完善、规模用户群体缺乏等障碍正被逐步攻克。随着国产大数据生态体系进入快速协同发展阶段,国产大数据产品与服务迎来较好的发展机遇。
数据已成为继土地、劳动力、资本、技术之后的新一代生产要素,是数字经济发展的基础性、关键性、决定性的生产要素,对经济发展、社会治理、人民生活产生着重大而深刻的影响。
加快数字化转型,构建数据共享服务体系,促进数据与业务应用快速融合,将助力中国经济从高速增长转向高质量发展,推动数字中国建设。
大数据管理平台不仅具有存储管理海量数据能力、数据处理性能高和易于扩展的特性,还可以保持传统关系数据库支持 ACID和 SQL查询等特性,支持关系数据模型。在大数据市场发展下,大数据管理平台需求快速增长。
为了在大数据环境下快速帮助客户实现人工智能赋能的商业决策,智能分析工具将迎来快速发展机遇,在云原生、AI 工程化、低代码、隐私安全、云边一体等方面发挥更大的作用。
技术创新是推动大数据产业发展的内在动力,但是目前我国技术创新对于大数据产业的引领作用仍然不强。由于我国基础科学技术水平研发投入相对不足,大数据底层技术投入与国外存在较大差距,虽然具有大数据应用的需求,但较少通过扎实的底层技术手段来推动创新,我国大数据技术创新能力有待持续提高。
基于开源的数据库技术,或部分开源的功能方案,已经成为当前众多企业的软件技术建设重要模式,目前数据库开源体系由国外主导。众多软件开发者对于开源软件的认知较有限,甚至误以为开源软件等同于免费软件,可以不受限制地随意使用。事实上,开源软件的著作权既没有被放弃也没有过期,其修改和发行等仍然要受到版权法或者开源软件许可证的制约,开源软件知识产权风险分为版权侵权风险,专利侵权风险、商标侵权风险三大类。因此市场对待目前开源体系的法律风险意识有待提高,自主研发的国产数据库软件市场占有率有待进一步提升,降低对国外开源体系的依赖。
近年来,越来越多企业认识到数字化转型的必要性,但是对于数据管理的认知水平较多停留在收集数据、存储管理数据的层面,对于如何把数据有效运用及相关认知有待提高,对数据平台、数据技术的资源投入不足。
我国仍存在严峻的大数据人才短缺问题,尤其紧缺基础技术研发、专业咨询、数据分析挖掘等方面的专业人才以及兼具专业运营能力、行业动态理解力、解决问题能力的多学科复合型人才,难以满足大数据产业的高速发展需求。大数据人才的不足一定程度上影响到大数据产业的发展,业内公司为争取优秀人才,造成行业内人才竞争不断加剧。返回搜狐,查看更多