您的当前位置:首页正文

2015年度大数据发展10大预测

2023-01-30 来源:尚车旅游网
2015年度大数据发展10大预测

趋势一、结合智能计算的大数据分析成为热点

大数据与神经计算、深度学习、语义计算以及人工智能其他相关技术结合,成为大数据分析领域的热点。大数据分析的核心是从数据中获取价值,价值体现在从大数据中获取更准确、更深层次的知识,而非对数据的简单统计分析。要达到这一目标,需要提升对数据的认知计算能力,让计算系统具备对数据的理解、推理、发现和决策能力,其背后的核心技术就是人工智能。近些年,人工智能的研究和应用又掀起新高潮,这一方面得益于计算机硬件性能的突破,另一方面则依靠以云计算、大数据为代表的计算技术的快速发展,使得信息处理速度和质量大为提高,能够快速、并行处理海量数据。

趋势二、数据科学带动多学科融合,但其自身尚未形成体系

数据科学带动多学科融合,但是数据科学作为新兴的学科,其学科基础问题体系尚不明朗,数据科学自身的发展尚未成体系。在大数据时代,许多学科表面上看来研究的方向大不相同,但是从数据的视角来看,其实是相通的。随着社会的数字化程度逐步加深,越来越来多的学科在数据层面趋于一致。可以采用相似的思想来进行的统一的研究。数据科学是作为一个与大数据相关的新兴学科出现的,尽管真正支撑大数据发展的学科跨越还没有出现。在大数据处理的理论研究方面,新型的概率和统计模型将是主要的研究工具,学科基础理论的突破在2015年还很难出现。

趋势三、与行业数据结合,实现跨领域应用

跨学科领域交叉的数据融合分析与应用将成为今后大数据分析应用发展的重大趋势。大数据技术发展的目标是应用落地,因此大数据研究不能仅仅局限于计算技术本身。由于现有的大

数据平台易用性差,而垂直应用行业的数据分析又涉及到领域专家知识和领域建模,使得目前在大数据行业分析应用与通用的大数据技术之间存在鸿沟,缺少相互的交叉融合。因此,迫切需要进行跨学科和跨领域的大数据技术和应用研究,促进和推动大数据在典型和重大行业中的应用和落地。

趋势四、与“物云移社”融合,产生综合价值

大数据将与物联网、移动互联网、云计算、社会计算、等热点技术领域相互交叉融合,产生很多综合性应用。近年来计算机和信息技术发展的趋势是,前端更前伸,后端更强大。物联网与移动计算加强了与物理世界和人的融合,大数据和云计算提升了后端的数据存储管理和计算能力。今后,这几个热点技术领域将相互交叉融合,产生很多综合性应用。

趋势五、大数据多样化处理模式与软硬件基础设施逐步夯实

内存计算将继续成为提高大数据处理性能的主要手段。查询和分析的实时性对于人们能否及时获得决策信息非常重要,大批大数据实时查询分析系统将涌现,基于大内存的计算模式或将成为大数据实时处理的重要手段。以Spark为代表的内存计算逐步走向商用,并与Hadoop融合共存。

专为大数据处理优化的系统和硬件出现。由于大数据系统在计算、存储、高速缓存方面的需求不平衡,传统服务器与存储已经不适合构建高可靠和高性价比的大数据处理系统。硬件厂商将专门开发适合不同应用的硬件设备,大数据服务商基于现有服务器定制专用处理设备,最终用户自行定制大数据系统中的硬件设备。在大数据处理过程中,更多的过程将被标准化和模块化,因此引入硬件加速模块(GPU、MIC或者FPGA/ASIC等)成为提高系统性能的必然选择。

大数据处理多样化模式并存融合、一体化融合的大数据处理平台逐渐成为趋势。例如,支撑电信、金融、医疗、安全和电力等关键行业大数据应用的基础软件平台将呈现一体化形态,它以数据为中心,将操作系统、分布式存储、数据库等产品融合起来,对结构化、半结构化和非结构化等全数据进行高效存储与管理,并对应用提供统一的数据服务支撑接口。

趋势六、大数据安全和隐私

大数据安全和隐私问题依然是热点趋势。大数据应用所产生的隐私问题、大数据系统和体系存在的安全防范方面还没有实质性的进展和突破。有分析认为,将大数据安全作为趋势反映的是参加调研专家和用户的一种期盼、理解和关注。

2014 年,大数据安全又被专家提升到一个新的高度,认为大数据以及相关的关键资源涉及国家主权。

趋势七、新的计算模式将取得突破:深度学习、众包计算

尽管这两年深度学习大热,在一些特定的领域发挥了很大作用,但是大数据专家和企业界人士似乎更关注众包技术。

分布式计算是支撑大数据分析的必经之路。分布式计算依然存在两种形态,一种是物理资源集中式,比如具有分布式计算能力的集群、数据中心等;另一种是物理资源分散式,比如以前常用的P2P 技术等。在很多大数据的应用场合,基于物理资源分散式会有更多的应用场景。典型的应用场景比如大规模的网页爬虫,采用物理资源集中式的方式就极容易被封堵,而采用众包计算这种物理资源分散式的分布式计算平台则可以避免这个问题。

趋势八、可视化与可视分析新方法被广泛引入,大幅度提高大数据分析效能

可视化与可视分析的研究发展迅速,国内专门从事可视化的研究人员将迅速上升。在可视化研究的数据对象从传统的单一数据来源扩展到多来源、多维度、多尺度的同时,用户也从专家扩展到广泛的非特定群体,研究则更强调方法的可扩展性和开发的简捷性。革命性的新方法和原有普遍适用的可视化技术和工具、面向领域和大众的可视化工具库,以及协同与众包的可视分析方式将被更广泛地引入到各种综合分析工具和平台上,以大幅度提升各类大数据分析的易用性和有效性。

趋势九、大数据技术课程体系建设和人才培养是需要高度关注的问题

大数据技术的快速发展和行业应用需求的快速增长,使得目前技术市场上掌握大数据技术的人才严重短缺。因此,政府、高等院校和科研院所将加快建立大数据技术人才教育和培养体系,发展数据科学和工程专业,梳理和构建跨学科和领域交叉的大数据课程体系,融合计算机、数学分析统计、应用相关的学科,推动交叉学科数据分析技术的发展以及人才的培养。

趋势十、开源系统将成为大数据领域的主流技术和系统选择

以Hadoop为代表的开源技术拉开了大数据技术的序幕,大数据应用的发展又促进了开源技术的进一步发展。开源技术的发展降低了数据处理的成本,引领了大数据生态系统的蓬勃发展,同时也给传统数据库厂商带来了挑战。据统计,目前有超过150 种开源大数据平台。这个数字还在增长中。

因篇幅问题不能全部显示,请点此查看更多更全内容