首页 > 大数据资讯 > 大数据与人才发展创新趋势

大数据与人才发展创新趋势

时间:2017-05-17 13:39:58 大数据

就在前几天 2017年5月12日,由成都市经济和信息化委员会、天府新区成都管委会支持,GBDC(全球大数据联盟)主办的第二届全球大数据峰会在成都世纪城天堂洲际酒店盛大召开。腾讯网科技总监龙兵华,四川精工伟达智能技术股份有限公司副总裁朱星伟,勤智数码董事长廖昕,成都乐为科技CEO苏方红,成都数之联合伙人、博士、副教授周俊临、UCloud战略副总裁张居衍以“大数据与人才发展创新趋势”为主题展圆桌对话。

以下是圆桌对话实录:

龙兵华:我们先请大家简单做一个自我介绍。

朱星伟:我们是从本土成长起来的企业,我们企业主要专注于三个板块的方向,第一是智能芯片,第二是智慧城市的平台,第三是大数据行业应用。智能芯片这个板块是属于企业传统业务,这个板块现在市占率在全国是前三位,西部排在第一位。比如说大家耳熟能详的行业,比如说二代身份证,手机实名卡,包括社保、银行金融卡,都是我们企业合作的产品。依托这样的基础就衍生出了比较基础的数据,基于这样的数据就衍生出了现有正在做的,以及即将做的比较多的大数据的行业应用,我们企业大致就是这个情况。

廖昕:大家下午好,我叫廖昕,来自成都勤智数码科技有限公司。我们是本土成长起来的大数据公司,我们专注于政府大数据,现在被工信部评为中国大数据50强的第42强,主要是在政府大数据上有一些独特的竞争优势。勤智很早就在参加国家大数据标准制定,现在也在参加国家区块链标准制定,一直是信标委的委员和会员单位。我们县级、地市级、省会级城市、省级都有比较多的案例,特别是政府数据共享、交换和独特应用上我们有比较多的案例,比如说四川崇州我们有城市级的政府共享交换和统一执法应用,在地级市巴中有整整60个部门的数据汇集和政府决策应用,在成都市有80个部门的数据梳理和900个处室数据汇总,在四川省有各厅级局数据目录的应用,有完整的体系。我们把政府的数据整合起来在开发上面也有一些行业的应用,比如房地产领域,我们做房产精准定位和营销,在医疗领域也有利用政府数据产生一些有价值的应用。我们认为整个政府应用,或者是行业应用上必须离不开人工智能,因为如果只是简单数据应用,那跟IT差不多,但是大数据和人工智能完全是连在一起的,我们现在有人工智能实验室,和电子科大有数据智能和人工智能的研究团队,我们现在主要是在法院这块做大数据,就是可以把法院的内容拿出来,我们现在初步正在做,但是初步只是把民法里边合同法的经济行为的法律基本做了,这是我们的基本介绍。

苏方红:我们公司最早是做存储的,2007年就在做存储,国内比较早做云计算的,在国内算是比较早做网盘的团队,从ToC到ToB,我们现在又给运营商做云网合一的项目,我们在公有云、私有云上有数据同步和数据存储,现在也是10P以上的数据存储量。我们在大数据有三个方向涉猎,我们做公安系统的数据分析和人的定位,就是线上和线下的精准数据定位。第二是在汽车市场,大数据也做了一些应用和案例。第三,在教育方面我们也做了学生画像的案例。从我创业经历来讲,从云计算到云存储到现在的大数据,我个人感觉这不是小公司玩的,我们乐为也是小的公司,我们看着很热闹,其实这个过程是很苦逼的,做好自己最擅长的事情,老老实实做就好了。现在人家问我们在做大数据吗,我说没有,我只是做了大数据很小的一个应用而已,我们更多是在做数据存储和数据同步。大数据还是要落地,还要人买单,这是很重要的。

周俊临:我来自成都数之联科技有限公司,数之联就是研究数据之关联,作为创始人我很荣幸跟国内的大数据先导人物周涛教授一起创立了这家公司,现在公司有两个核心产品,一个叫做ICU,但是我们的ICU不是重症监护室,是我们把常用的100多种算法集中到通用平台上,让有数据的人不懂技术也可以在很快的时间建自己有用的模型。第二个产品是一个可视化的平台,希望让大家在不懂技术的情况下很愉快的玩数据。具体的应用领域有三个,第一是帮助政府治理,比如食药安监的靶向抽检,还有法官的画像,还有是跟随国家的重大需求,叫工业4.0,我们做一些智能设备的故障检测,目前是跟五粮液在进行合作,还有核工业研究院。第三就是面向另外一项国家重大需求,也就是现在结合了军民融合的特点,在给军方做一些服务。我们还有另外一个身份,就是跟今天的讨论话题非常密切相关,我也是数联寻英科技公司负责人,和人才主题也非常契合。谢谢大家!

张居衍:UCloud在中立性的私有云当中我们是最大的一家,我们完成了第一轮融资9.6亿,我们在国内有四个大的布点,国际有17个节点,算是遍布全球的网,我们成长是跟客户一起的,几万家客户和我们一块。今天的主题是大数据跟人工智能,对于AI在我们战略布局当中是很重要的一块,AI、大数据、云计算是三位一体的放在我们的战略版图里边。我们也清楚战略要取舍,所以我们对大数据推出了一个产品,安全屋,要从安全的概念跟平台优势结合在一起,做一个切入点的尝试。今天虽然谈了那么多的行业形态,但是这个行业的总体形态都是在摸索期,我们都在探讨。这个点上我们还有一个概念,叫AI,就是大家都做AI,但是我们提供基础服务,让你对文本、语音、图象识别,提供一个基础模块,你们很好做算法模型,我们帮你做资源,又节约又快速,这是我们目前在做的事。谢谢大家!

龙兵华:感谢几位嘉宾的介绍。大数据之前云计算特别火,都是涉及技术的话题,大数据这个话题现在也是非常火热的概念,虽然很多公司卷入其中,但是对于大数据到底怎么定义和理解,不深入行业的人可能不一定很清楚。所以我想问问各位,各位心中定义的大数据到底是什么数据?我们现在手机上有数据,点餐也会产生数据,包括摄像头在马路上也是有数据,这些数据是有效的数据吗,怎么定义大数据,请各位谈谈。

张居衍:大数据放在跟生产要素同一个尺度来看,跟能源、土地、资本投入是完全对等的地位,但因为是新东西,大家放到大数据的角度来看它可能不单纯是大,所以如果放在生产要素的角度来,它跟所谓的生产方式、生产方法、生产力都是结合在一起的。我是觉得今天下午的讨论是比上午更有信息量的,因为我们看到好多垂直行业对数据不同的生产过程,这个反馈过来其实也展现出接下来无处不有数据,重要的是说数据跟过去讲的数字化管理完全不同。因为数据有三个特性,实时、互动、全样本,这三个要素在新的节点上跟过去完全不同,它又是整个生产要素必不可少的环节。这是我的理解。

周俊临:我是学数学挖掘的,学术上大家看起来很难,但是可以用简单的语言来描述,称之为四个V,数量巨大,结构复杂,产生速度快,它的核心是有价值的。数据挖掘讲究来了如果是垃圾,做大的数据量也不会带来价值,从我们行业定义来讲,从刚才讲的四个V,它更需要的是用新的技术来进行分析,它可能不需要我们用新的技术,它也不会带来更大的挑战,仍然是传统技术分析可以解决的。如果说这些数据非常复杂,又有巨大的价值,先天的技术又不能解决,我们要采用深度计算、云计算,最重要的还是它的价值。

龙兵华:你举几个例子,哪些有价值,哪些没有价值。

周俊临:可以从应用的角度反过来说,上一个圆桌论坛我听到大家说一个很有意思的话题,就是用大数据监控一个人犯罪是好事还是坏事,在我看来它只是一个应用领域,技术本身没有错,但是技术的应用就看谁来用,怎么样来用。如果说对于公安系统来讲他们用这项技术,我觉得是很好的,确实可以很好的进行社会治理。这个过程中间他们遇到的问题是什么?视频数据不断产生,数据量巨大,难以在短时间之内分析出有效的结果,所以就需要用新的技术。这个技术又在解决大数据的问题,所以我们可以把它定义成大数据问题,这算是有价值的,给社会安定带来了很好的价值。

苏方红:大数据之前讲海量数据,我认为海量数据是包括垃圾数据在内的,它所有的信息可能都是海量的,但是海量数据里边我们提到了一个概念,我理解的一个概念,就是大数据,我认为它是有别于海量数据的有用的数据,它这种数据可能是针对某一个行业,针对某一个应用里边去做的很精准的分类。就是大数据跟海量数据里边,人工可能有这么一个前提的划分。比如我们讲人,它每天会产生很多数据,个人认为它不是大数据,它可能是海量数据,包括录音,包括很多的女孩子也好,都喜欢拍照,吃个饭之前都先扫扫图,这样不是大数据,它仍然是海量数据。比如我们区公安做的大数据,我们可能会根据线上线下的聊天记录,或者它的行为,比如说在线上叫张三,这样的一个网民,但是线上它可能叫某某某,这样的大数据中心它才是大数据,我理解大数据一定是有别于海量数据,是很精准的行业数据。我们也有在做数据安全,它一定是具有活力的,我们一定要用好大数据。

廖昕:社会发展到现在,其他所有的事情都在数据化,包括IT系统的数据也是数据化的,我们这个社会很多物联网产生的数据也是数据化的,每个人的行为,每天在做的事情,通过大家的通信,通过大家的手机,通过你的支付,通过各种聊天,这些都是数据的一部分,数据其实是从另一个纬度把整个世界重新描述出来。只是说我们现在大数据技术的发达,它可以把这些数据都关联在一起分析,甚至通过人工智能洞察出很多东西出来。那大数据就是我们现在这个社会另外一种投射,不管信不信,这个东西都存在了,要说这个数据有没有用,只要任何数据是投射出来的,不是伪造出来的,或者是深造出来的,肯定都是有用的,只是说从哪个点去用。这里边有几个大问题,第一是我们怎么把这些海量数据和多维数据联结在一起。我们在大数据有一个定义,叫做数据和的价值远大于数据价值,这时候是很核心的,我们把这些多维数据连接起来,这是非常非常重要的问题。我们现在正在和国家有关部门做相关的体系,因为在2020年要变成中国统一的大数据平台,其实很多省和市也在说能不能建自己统一的大数据平台,这个平台不是把数据重合到一起,它其实是应该通过安全的数据键把安全的数据接入大数据体系。每个人其实都有数据,每个单位都有数据,以前我们需要把这些人的数据贡献出来,但是因为数据的可复制,容易被拷贝,数据的价值容易从拥有者身上流失到别的地方去,这时候在数据大的网络里边,我们第一是能不能让他们的数据,让每个人拥有的数据被共享和计算,社会化才能产生价值。另外还有价值互联网的问题,大家贡献的时候有价值,能不能参与价值分配,相应的数据,每个人拥有的碎片化数据,每个单位拥有的数据,能产生新的价值分配,这是我们正在研究的。有了这个体系之后,真正落到一个大数据,而不是现在叫做离散的数据,只是说单独的一类数据,这些数据应该不叫大数据,整个社会所有数据连在一起,那真正就称之为大数据时代。

龙兵华:连在一起的可能性有多大?各行各业都是割裂的。

廖昕:这里边是两个问题,一个是技术上的问题,这不是特别大的问题,因为它只是解决数据共享和数据计算的问题。另外一个是利益分配,因为数据是石油、资源,代表着未来的生产力,它不希望把价值拱手让出来,我们做数据的时候发现了一些问题,每个人都不想把数据拿出来,所以我们也在着力解决这个问题,解决这个问题之后就能把数据真正变成大数据。

朱星伟:咱们这是探讨,我是这样认为的,大数据有价值还是没有价值,我个人认为这是伪命题,我认为数据都有价值,只是当下的技术水平和商业水平前提下,我如何去能够挖掘它的问题。我认为现在评估大数据的价值,它最终一定是要和商业归口起来,如果在商业层面上数据没有变现,实际上这个数据的水准就还不够。现在提到了一个关键词叫互联互通,互联互通这个关键词里边的关键字:互、联、通,体现的价值是把老祖宗张骞所开创的丝绸之路,现在在新的历史时期,新的大背景下,把它的价值挖掘出来,而且它一定能够大放异彩,我们现有的数据概念也是一样的。我们现在很多碎片化的数据,甚至于我们的音频、视频,甚至于有些聊天记录,各种类型、各种形态、各种形式的数据,现在可能感觉没有太大的用处,但是我坚信未来有两个条件,一是技术层面上达到更高的水准,第二是商业需求达到更高水准以后,它能够在市场上体现价值的时候,我认为这个数据就一定有价值,现在我认为是金矿,只是未来怎么挖的问题。这是我的观点。

龙兵华:廖总抛出了一个很好的话题,关于数据的共享和封闭的问题,现在大家认为消费数据BAT是很强的,传统的行业,包括和政府合作,包括细分行业、农业等领域,它的数据量可能比较小。开放有可能实现吗?请张总你谈谈你的观点,你觉得这是美好的想象还是一个可实现的商业未来?

张居衍:这是我们整个考虑的重点,我们说做战略一定要考虑行业,考虑数据如果放在整个市场的角度来看,这个东西终极形态是什么,我们很愿意去对比石油、资本,那个市场是分等级的,还有分品类,如果市场格局是这样的话,我们反馈到现在说它作为生产要素,你怎么最大化开发它的使用价值。落到数据本身有两点很有意思,现在所谓的数据交易,包括联通他们讲到要开放这个平台,其实大家就很小心,安全性摆在第一位。但是同时数据不产生交易,它的价值不能得到体现,价值就打很大的折扣,这中间是一个悖论。所以我们内部就这个思考,我们推了一个东西叫“安全屋”,就很大程度要解决数据安全信任问题,我们用区块链的技术,整个过程中输入和输出全部记录,最核心的包括内存计算的东西,我们都在折磨,那个过程有没有,因为区块链好多记不住,但是这个东西会不会产生丢失。

龙兵华:中间是一个黑洞吗?输入输出。

张居衍:我们对这个产品有一个衡量标准,我们要确信提供平台的我们自己也拿不到这个数据,不能说去保证通过审计的方法或者整个平台价值去压在旁边,人家也不会信你,这是整个要点。第二块就是说整个数据你一定要通过安全的切入点让它产生交易,中间的互补性我们看到了巨大的市场空间。比如说做信用的,把这个市场做得越大越厚,市场价值才能产生出来。

朱星伟:数据开放我个人认为是早晚的事情,重要的是在中间找到一个连接的线,国家推进诚信大数据就是数据开放,如果不开放怎么做诚信大数据,工信部牵头,包括群团组织,各种类型的都加入进来,其实加入进去的背后就是数据开放,我认为开放是早晚的,只是它的规则问题,规则很重要,风险控制的问题,这个如果能控制好是肯定的,趋势是肯定的。

周俊临:我对这个是比较积极的态度,我觉得数据开放是必然的,数据的互联互通是大趋势,肯定是分步骤分权限,从大趋势来看大家很容易理解,信息化是我们的第一步,“互联网+”是第二步,信息化是打通企业内部的数据,“互联网+”就是内外数据进行整合。大数据在“互联网+”之后又可以形成更好的行业应用,比如说谷歌(微博)利用了人们查询搜索关键词的数据就可以预测流感的爆发情况,可以根据大家用电的情况来看天气温度变化情况,这就是跨界的很好方式,因此数据的互联互通一定会产生很好的应用。但是数据完全开放也会带来很大的危险性,比如国家信息中心开放了国家地理信息的数据,可能给国家的安全会带来很大的隐患,包括人口数据。但是又不是说所有场景下大家都不能用这个数据,甚至于我们现在做军民融合的一些业务也是一样,小到一个机器零件,中间到一个类似于武器的程度,大到一场战争,它都可以通过军民融合的形式做,这些东西都是可以开放出来的,该开放给民口的开放给民口,该开放给军口的开放给军口,谁能拥有全量信息也是跟他的身份和职责相关的。所以我认为数据开放一定会带来更大价值,但是数据开放过程中怎么让它符合我们的要求和规则一定是大家要探索的,对于政府而言,他们有这个期望,但是都没有找到很好的途径或者很好的分类方法、组织方法来实践这个事情,因此大家是一步一步的在做的,因为走得多或者走得远可能会带来灾难性的后果,但是往前走是肯定的。谢谢大家!

龙兵华:苏总你愿意开放出来吗?

苏方红:我觉得大数据更多是概念和统计学,大数据也有等级,我理解一定有等级,还有一些是涉及绝密的。数据的交易不是说我把钱给你,我就没有了,它是可复制的,在复制的过程中它的量化或者说数据卖得很多,比如我们讲的身份信息,每个人的身份信息可能会卖很多次,同样的数据,我理解它后边不是卖的复制或者代码,它可能是卖的数据,总结出了一个规律,是这样的。数据的交易它不具有排他性,而且数据的可复制性在数据的定价方面有很多值得探讨的东西。

廖昕:从数据开放共享来说,美国、欧洲很早就开始做数据开放的工作,不管是政府的数据还是民间的数据,包括我们自己的数据,我觉得都会发生一些共享和开放,只是这个时候要看共享开放的代价是什么,得到的价值是什么。数据是安全要分类的,数据共享之后,你愿意共享可能是想得到一些利益,这个合不合算,价值合不合适,就是它的问题,不存在不能可以开放和共享,只能说有没有得到更多的价值。开放共享有一个很重要的话题,也是这段时间大家比较关注的,就是信息泄露和个人信息隐私的问题,这是现在非常重要的问题,最近国家也出台了一定的法律,有一些规则是我们从业人员必须遵守的。现在大家也不用太担心,说这些数据开放共享之后是不是把大家的隐私,或者是企业的隐私给泄露出去了,按国家数联网这个大体系来说,大数据网络的所有数据是经过脱敏和安全认证的,而且是可靠的才会进入,这里边并不会还原到每个单独的自然人个体和单独的企业个体,大家也不用特别担心,因为整个业界在研究,一定会把共享开放和隐私保护平衡好。数据延伸应用到哪里,也是你业务延伸到哪里的边界,最后共享和开放是必然,封闭就没有空间。

张居衍:数据开放不是数据有问题,现在的数据我是有一点担心的,如果把这个东西看得太重,数据本身不能交易的原因不是数据本身,而是数据背后的利益关系,过去2015年互联网发展那么好是因为政府不重视,民间创新能源源不断创始,我很担心把数据作为国家战略制定的话,好多创新的力量就被规范的东西给掐住。不能开放的原因不在于数据本身的特性,这一点要很清楚。

廖昕:我觉得数据的开放共享不能依靠政府。

龙兵华:市场的推动可能会让它形成一定程度的足够开放,而不是一定要强制它去达到一个什么样的目的。

张居衍:在国家大战略之际出来之前大家要多尝试,把这个市场做得更好。

苏方红:昨天晚上我收到一个信息,原来讲公安或者是民警查公民的信息,现在是已经明文禁止了,虽然我们大数据发展,大家很担心个人隐私,其实反过来讲因为大家的担忧和所谓的怕,就反过来会促进我们政府立法做更多的数据保护,推进整个社会的法制和公民隐私,反过来讲是有利的,我们也可以更好更放心的应用它和把握它。

龙兵华:谈大数据都是大公司的事情,那中小企业该思考大数据这事吗?

苏方红:我09天做云计算的时候,我跟人家讲云计算,然后我讲我是做网盘的,人家不知道什么是网盘,那时候09年还没有移动互联网的概念,我们是很小的公司,就是十多号人,想做现在百度做的事。我觉得小公司要在一个行业坚持十年,要么你就在某个领域某个行业里面有非常精准的好的案例,可能就会有人买单,千万不要想到小公司做一个很牛逼的产品才有人买单,所以要先有人买单。

廖昕:我是中国中小企业协会副会长,我们中小企业协会在做数据智能研究院,中小企业怎么看待大数据?大数据是这个时代另外一种感知世界的方法,其实它是一种新的生产力,数据本身再加上人工智能其实可以改变每个中小企业所在的行业,比如利用在房地产产业。以前人工智能技术发展了60年,但是以前没有大量的数据让人工智能的算法变得成熟,所以很多人工智能变成实验室的产品,但是现在是不一样的时代,整个数据将来是会联网的,数据经过打标签都可以变成人工智能的算法和养料,这样每个行业利用人工智能和大数据技术的门槛就非常低,这是大家很大的机会,可以在这个行业里边弯道超车的机会,所以一定要把握住,创造出自己的竞争力。我认为中小企业一定要关注大数据,一定要关注人工智能,这是机会。

周俊临:我很认同廖总这句话。比如大年和小年,今年丰收了,可能明年就不一定那么好,有一位农民70多岁,每年都是大年,所以大家都很关注他的经验,专门去取经的时候碰到了一个很有意思的结果,他告诉我们他每年播种都比别人要晚那么一段时间,为什么要晚一段时间?他看政府引导大家种什么,他不种什么,他看市场上什么好卖,他就不种什么,在这种情况下他每天都可以丰收,而且每年销量都很好,这个简单的差异化是来自于对于市场的分析和处理。对于一个企业来讲你要做决策,特别是小企业,如果产品定价或者产品方向决策错了,那可能就是致命的,如何做到更好的服务,当然是需要很好的分析,现在有很多数据和建模工具,当然是很好的时代。

苏方红:我们讲到大数据的算法和建模很贵,创业者你可以做大数据,但是一定要先存活下来,我想表达这个意思。

龙兵华:现在大家认为目前在这个市场上大数据的人才到底是存在着一种什么样的状态?稀缺吗?人才都分布在哪里?引进还是自己培养?

周俊临:我们公司有全国大概3千万人才需求,除了人才供应还有需求,招聘来看大数据人才在整个行业与里是供不应求的,对于人才怎么解决这个问题,现实中间我们也遇到了很多现实的情况,有一个专家既懂得大数据又懂食药监的业务,但是这种人不存在,一个新的目标要找人去继承这是不存在的,最重要的方法是大数据人才和行业人才要结合。周涛教授讲大数据是横断决策,它并不是靠某一个行业就能决策的,大家一起学习。

朱星伟:我们企业现在对大数据人才是非常渴求的,我们也用了一些比较丰富的组合拳解决这个问题,但是解决可能也只是阶段性的,第一是内部培养,第二是从对外从猎头去寻找,第三是从公司股权期权体系去留住这样的人和吸引高端人才。大数据整个体系的人才建设,我相信不仅仅是企业有这个问题,应该说很多企业都有这个问题,我们咨询公司就提到了很关键的东西,要做大数据其实是一个门槛很高的,而且和你企业支付能力有比较大的关联。

龙兵华:支付能力是什么意思?

朱星伟:就是购买人才的能力,这样的体系上正在解决这样的问题。

廖昕:我们开始做大数据的时候也做过人才分析,大数据产业需要从下到上,它的特性不一样,底层人员是梳理、清晰做数据服务,这类的人才相对好找,我们最早的时候是自己培训,但现在也孵化出一个自己的培训公司,拿了工信部相应的牌照,现在也在快速培训,不仅是内部的人,也在培训外部的人。第二类是和大数据应用开发相关的培训,以前的工程师经过半年培训也可以变成大数据人才。有两类比较难,一类是算法,不仅是数据算法,也要懂业务,只能一部分培养,我们三年前开始做大数据做了一个机器数据和人工智能联合实验室,当时就有千人计划的专家把我们的算法架出来了。现在最难的人才,我觉得是关于大数据的战略性人才,就是他自己有大数据思维,也知道这个行业的观念,这些人才最后可能会变成牵头者,一个项目经理,他能带团队来做,这种人才现在是缺的,这种人才是香饽饽。

苏方红:大数据系统和应用是完全不一样的,大数据系统可能是平台化的产品,如果做简单的爬虫工具,就说大数据,可能还是比较幼稚的,我是这样理解的。

周俊临:90%的企业不需要自己研究大数据,它更多的是利用大数据技术来解决自己的问题,特别是行业问题,真正研究大数据的人,就像我们用操作系统一样,大家可能全世界不到万分之一的人在用操作系统。

张居衍:现在这个市场上就那么几个大头,叫数据黑洞,比如谷歌、Uber,人才都是往黑洞里边走的,国内最近的趋势,百度、乐视很多人才往外走,这时候可能企业有两个要求,一个是要有使命,第二是要有业务场景,所以只有这样才能变成小黑洞把人才往里拉。我们UCloud就希望慢慢营造这种气氛,在市场变动的时候,希望人才能到我们这边来。

龙兵华:好的,谢谢大家,我们这个环节就到这里。

上一篇        下一篇