IT界“潜力股” 编辑带您读懂何为大数据
人士交流的时候,仿佛不提大数据这个词就跟落伍似的。但是到底什么是大数据?大数据是单指数据量大吗?这可能是很多人会提出的问题。
笔者从和ZOL存储论坛中查了一些资料,虽然资料很多,但是相似度较大,很多资料生涩令人难懂。笔者在这里希望跟大家交流一下我对大数据学习后的一些总结,希望能让您对云计算有个全新的了解。
首先我们可以从中查看到大数据的概念:大数据(bigdata),或称巨量资料,指的是所涉及的资料量规模巨大到无法透过目前主流软件工具,在合理时间内达到撷取、管理、处理、并整理成为帮助企业经营决策更积极目的的资讯。
通过上面的定义,可能很多人依然不能够彻底的了解大数据,其实业内专家已经将大数据的特点给我们做了形象的描述,简称4个“V”:Volume、Variety、Velocity、Value。
大数据的4个“V”是目前人们形容大数据用到最多也是大家比较公认的大数据特点。这4个“V”从四个层面对大数据进行了比较形象的描述。即更大的容量(Volume,从TB级跃升至PB级,甚至EB级)、更高的多样性(Variety,包括结构化、半结构化和非结构化数据),以及更快的生成速度(Velocity)。前面三个“V”的组合推动了第四个因素——价值(Value)。
这四个“V”让用户能够更形象的了解大数据。我们可以看出大数据不但有型(数据大),而且更有财(数据价值),四个“V”虽然看起来简单、易懂,但却又是对大数据的一个总体的阐述,这4个“V”的相互作用才形成了如今的大数据。
读了这些内容,网友有可能会问,大数据为什么受到这么多的关注?怎么可以说大数据是IT界发展的潜力股呢?请看下文:
随着移动计算的发展,如今的数据呈现爆炸式的增长,但是是大数据到底有多大呢?或者是多大的数据才能被称为大数据呢?
数据呈现爆炸式增加,我们熟知的G(1G=1千兆,即2的30次方字节)和T(即1千G)已经不能衡量存储的数据,如今PB,EB甚至ZB等更多的容量单位已经出现。举例:百度首页每天就要从超过1.5PB的数据中进行挖掘,这些容量的数据如果打印出来的就将超过5千亿张A4的纸,全部摞起来的线万公里高,接近地球的同步卫星轨道,平铺可以铺满海南岛。
2012年年底,全球数据总量将达到2.7ZB,到2015年将达到8ZB,而这种增长的趋势并不是递增的方式,而是爆炸式增长。据麦肯锡预测,到2020年全球数据使用量要暴增44倍(不是生产量,而是使用量)达到35.2ZB。只需两天就能创造出自文明诞生以来到2003年所产生的数据总量,这是一个多么大的数据。
4个“V”已经非常形象的描述的什么是大数据。数量大只是之中的一个元素,而最核心的依然是价值。
“养分”,也就是我们需要发掘大数据的价值,这样的大数据才拥有意义。我们需要从数据资源中发掘我们的价值来为我们服务。
利用大数据发现价值的案例如今已经屡见不鲜,沃尔玛等零售商通过对销售额、定价以及经济学、人口统计学和天气数据进行分析,藉此在特定的连锁店中选择合适的上架产品,并基于这些分析来判定商品减价的时机。京东商城,通过对客户的浏览页面以及购买情况,来锁定用户的喜好和关注点进行产品的推荐,等等,这些都是利用大数据来实现商业价值的典型案例。
编辑点评:大数据并不仅是只是容量大的数据,大数据还拥有大价值,而且这已经是业内公认的事实。大数据时代的来临,其让整个IT产业和整个社会的商业模式正在发生的巨大的变化,接下来我们来看下大数据所引领的变革!
IT基础设施提供了更高的挑战,原有的IT基础设施以及很难满足大数据时代的需求。发现价值的过程离不开基础平台技术的创新与发展。
IBM等公司在大数据方面都已经投入相当大的资金进行研发,主要也是为了解决大数据对基础平台所带来的挑战。
/知识管理等领域的技术变革。Hadoop是近年大家经常提到了一个能够对大量数据进行分布式处理的软件框架,用户可以轻松地在Hadoop上开发和运行处理海量数据的应用程序。
Tesco为案例。Tesco收集了海量的顾客数据,并且通过对每位顾客海量数据的分析,Tesco对每位顾客的信用程度和相关风险都会有一个极为准确的评估。在这个基础上,Tesco推出了自己的信用卡,未来Tesco还有野心推出自己的存款服务。
编辑点评:谈到这里,可能大部分人已经对云计算有了初步的了解,但也有可能又要问,大数据真的那么好吗?其没有发展上的存在的一些问题?下面我们就来谈一下大数据在发展上遇到的一些问题!
Facebook还专门设立了首席隐私官这个职位。但是目前的措施并不能够完全保护个人隐私的安全,个人在大数据时代似乎总是站在被分析的地位。隐私问题是大数据亟待解决的问题。
“蛋糕”将是我们必须要考虑的事情,大数据不但影响着整个IT行业的发展,同样影响着企业商业模式。如何了利用好大数据将是决定企业未来走向的关键要素。