首页 > 企业动态 > 中科点击:何为大数据?

中科点击:何为大数据?

时间:2017-03-31 12:00:55 大数据应用大数据概念

“忽如一夜春风来,千树万树梨花开”,大数据之花已然开遍了全世界,开遍了神州大地,成为一股不可阻挡的洪荒之力。

大数据是当今公众津津乐道的一个热词,人们纷纷在探讨大数据所带来的科技进步及所蕴含的巨大价值,甚至有人把大数据形容为未来世界的石油,未来的黄金。更有人宣称掌握了大数据的人,就可以像上帝一样来俯瞰整个世界。那么,到底什么是大数据?它将带给相关产业以及普通公众什么样的影响?

因为工作的关系,我经常参加一些关于大数据的论坛与活动,有一次在成都演讲后,有一位创业者跑来问我什么是大数据,尽管我阅读了几乎国内有关大数据的书籍,以及互联网、自媒体上有关大数据的论著和文章,但我差点被问住了,现场颇有些尴尬,我也只能用“巨量数据集合”+5V来草草作答,我能感受到这位创业者一脸不知所云的状态,我顿时感觉到,大数据要普及、创业者要运用大数据创新创业,还需要将大数据的定义、原理、逻辑、应用深刻的理解后,深入浅出地转换为寻常百姓能听得懂,看得明白的内容。

不要说是普通的门外汉,即使从事大数据这个行当的人来说,要用一句话很精炼又恰到好处地来说明大数据是什么,也是勉为其难的。也许有人说,大数据本就是一门高深的学问,一门尖端的科技,注定只有少数人能懂,不需要所有人都要明白,这也许就目前来说有一定的道理。但是新鲜事物终会变成平常之物,正所谓太阳底下没有新鲜事,也许再过几年,大数据就如同现在的互联网移动互联网一样,变得太平常不过。所以有必要,给大数据下一个人人都能听得懂的定义,让数据走近生活,让数据走近大众视野。

就目前对大数据的定义而言,更多的是从数据本身以及技术层面的解读。行业术语叫巨量数据集合。麦肯锡全球研究所给出的定义是:一种规模大到在获取、存储、管理、分析方面大大超出了传统数据库软件工具能力范围的数据集合,具有海量的数据规模、快速的数据流转、多样的数据类型和价值密度低四大特征。这里面包含了我们通常听到的5V特征。

不管是行业术语还是麦肯锡给出的定义,都是从大数据本身出发,从数据的特征与处理解读,对于一般人来说是比较难以理解的,也不便于流传和记忆的。大数据成为一种趋势,必将成为一种生活和商业模式,这是毋庸置疑的现状和未来。所以,我们时常在想,有没有一种定义能够让普罗大众很清晰明白地感知大数据,让即将进入或者有意从事这一行业的人直观地了解他,走近它。对此,在长达两年的时间里,在做产品的过程中,我们一直在思考推敲这个问题,在心中打磨大数据应该是什么样子,怎样才能被普通人乐于接受和传播的定义。

大数据之所以大,是因为要处理的数据量从样本数据变成了全量数据,从存量数据变成了流式数据,人们不得不接受数据的混杂性,而放弃对精准性的追求。从数据价值来说,不管是现在还是未来,数据已经是一种战略性资产,更是一种生产资料。而大数据的价值不单单体现在数据本身的价值,更是体现在数据的关联分析上,是一个系统性的工程,而不是一堆数据的简单集合。

我们在内部通过反复的推敲,到底怎么讲大数据才能被非大数据行业的人有感知性的认可,这令我们头疼了好长时间。我们通过不同的表达方式给行业内的人和行业外的人宣讲,试探他们的回应。什么才是大数据,怎样讲大数据才能让别人听得懂,换过不同的版本,到目前为止,这是我们最满意的表达,于是我们正式给出大数据全新的定义”:

大数据是以海量多维数据为资产,价值挖掘为导向,集合数据思维、数据能力、数据应用的数据工程体系。

大数据改变了我们的思维方式,这种改变由被动改变和主动改变相互交织,外在与内在共存共生,某种程度上,大数据促进了商业生态系统的重构。

我们给出的大数据的这个定义,这里面包含了以下几层大数据属性:

1.大数据是海量多维的,而不是小数据或单一数据;

2.大数据是战略性资产,而不是记录的符号,我们将数据视为资产,而不只是被储存的数据本身;

3. 大数据不是数据的简单粗暴整合,而是充分挖掘数据的价值并加以运用;

4. 大数据是一项技术工程体系,更是一种思维模式,就像互联网之于“互联网思维”,大数据的衍生意义在于“大数据思维”,代表人类通过数据而非现象去透析本质的思维模式;

5. 大数据必须具备采集、存储、管理、分析、计算的能力,才能释放其所拥有的价值;

6.大数据重在应用,真正优化、改善、提升人类服务,而非人类的负累,也不是信息技术行业为了标新立异提出的一种概念、口号。

7.大数据是一个综合的工程体系,而不是一个单一的信息技术、数据科学。

大数据定义,要准确把握大数据的概念内涵外延。虽然大数据具有大量、海量的特征,但这只是一种相对的计量方式,大数据不等于简单的大规模数据,大数据强调的是对某一领域相关数据采集结果的覆盖面,强调数据的完整性和全貌性。另外一点是不能将大数据与数值化、数字化数据混为一谈。数据是信息的表达,信息是数据的内涵,而数据就是信息的最主要表现形式和载体。它可以是符号、文字、数字、语音、图像、视频等。数值化数据,仅仅是数据封装形态的一种,是较为初级的数据形态,其呈现方式多为数字、符号、图表。

当然了,我们总结的大数据定义都是建立在大数据特征之上的,即数据的5V特征:Volume(大量)、Velocity(高速)、Variety(多样)、Value(价值)、Veracity(真实性)。也就是在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力来适应海量、高增长率和多样化的信息资产。

大数据的战略意义不在于掌握庞大的数据信息,而在于对这些含有意义的数据进行专业化处理。大数据的意义不在于数据本身,而在于对数据的分析与应用,从而释放出数据所蕴含的巨大价值。换而言之,如果把大数据比作一种产业,那么这种产业实现盈利的关键,在于提高对数据的加工能力,通过加工实现数据的增值。大数据最重要是为国所用,为商所用,为民所用,这是根本,也是数据价值的本质。

一方面,大数据在解决我们现有的需求,释放数据的价值,另一方面,大数据又会创造新的需求,创造更大的价值,因此合理运用大数据,以低成本创造高价值,正是大数据的价值所在。

只有弄清楚了是什么,我们才知道去做什么。每一个行业都需要有人不断地去探索,不断地去试错,不断地总结经验和教训,供后来者参考和借鉴,甚至超越。每一个新兴的行业都是从模糊开始,逐渐变得清晰,逐渐变得高度垂直,大数据行业也不例外。就目前而已,大数据商业应用才刚刚开始,整个大数据市场还处于教育和普及阶段,完全没有达到成熟的阶段。所以,向市场、向民众普及大数据的知识是有必要的,也是必然要经历的一个阶段,只有当别人理解你,认同你,才会买你的单,才会和你产生价值连接,创造更大的价值,也会推动大数据这个新兴的行业不停向前,不断进步。

“雄关漫道真如铁”,大数据就如一场革命,但是这场革命才刚刚开始,需要我们每一个人为之探索,为之痴狂,才能挖到隐藏在浩瀚数据里的珍宝。

不论你接受还是不接受它,大数据就在那里,不近不远。大数据已经在我们的生活当中,给我们的生活带来了巨大影响。一方面,我们要加强个人隐私的保护,另一方面,也要充分适应大数据给我们带来的变革,享受它给每个人的生活带来的便利。

对于整个数据链来讲,大数据有其自己的数据生态,处于最底层的是数据资产,整合数据,解决数据来源;处于中间层的是大数据能力,解决数据怎么做;处于最顶层的是大数据应用,即数据做什么。这三层构成大数据的整个生态体系,而我们要做的大数据应用,也是本书重点探讨的方向。

我们为什么要做大数据应用?因为在大数据行业,只有应用才能产生更大的价值,只有应用才能创造更大的价值。不管是有多少数据,有多牛的技术能力,但是不做应用,不为国家、为企业、为民所创造价值,改变人们的生活,都等于0。所以我们选定了大数据应用这条路,并且是矢志不渝地坚持下去,致力于通过应用,为这个世界,为社会,为民众改变一些力所能及的事情,这是我们的初衷,也是我们的梦想和目标。我们相信会有更多的人参与到这项伟大而又神奇的事业中来,为之奋斗。

上一篇        下一篇