南京服务托管满足不同阶段的需求
南京服务器托管租用-行业新闻
分论坛:大数据与云计算文字实录
发布时间:2014-4-14阅读:1056
“博鳌亚洲论坛2014年会”于4月8日-11日在海南博鳌举行。以下为“大数据与云计算”分论坛实录。


张亚勤[微博]:欢迎来到大数据与云计算的论坛。博鳌10多年了,每一年很多不同的话题,但是每一年都在高科技,特别是信息产业给我们时间探讨每年最受关注的和最火的话题。我记得前年,再早我记不住了,我记得前年的话题是云计算,去年是移动互联,今年是大数据和云计算,可能还有移动互联。的的确确过去这一年,大数据成为社会的主旋律,不管是大企业、小的企业、初创企业,不管是政府还是媒体,都在讲大数据。有些说大数据是黄金、是新货币、是竞争力,另一方面也有不同的声音,说大数据没什么新的,人家做数据库、做数据仓库做了很久,这里面的这些技术也都是做了很长时间,只是IT厂商搞出个新名词来卖产品,或者说是有些做房地产的忽悠政府去拿地、圈地,在中国是很特殊的现象。到底是怎么回事?大数据是一个真的技术趋势,有很好的产业前景,还是大数据真的是一个炒作,是忽悠?今天我们很高兴能请到这么几位特别著名的专家。

  张亚勤:欢迎参加我们这个环节的讨论,我们今天的讨论嘉宾是非常知名的一些人物,我跟大家介绍一下,实际上所有的这些嘉宾,博鳌论坛的所有嘉宾都是非常有建树的,都是有他们自己的见解和观点,在大数据这块尤其如此。首先我跟大家介绍一下嘉宾,然后再问几个问题:Allen & Overy 合伙人 Ahmed Baladi;美国 Mobile Flow 科技有限公司首席执行官 玛莎·贝佳,她讲数据和移动技术怎么来Flow;东软集团(12.81, -0.25, -1.91%)董事长兼 CEO 刘积仁,不仅仅是业界的领袖,而且是大数据方面很重要的领导人;西部数据总裁兼首席执行官 史帝夫·密立根,他们公司做大数据存储做了很多年;美银美林中国区主席暨行政总裁任克英,她不是技术专家,她这么跟我说的,她更多是大数据的使用者和践行者,金融服务的客户,我可以想象金融服务对于大数据也是非常巨大的潜在客户;Facebook 副总裁 Vaughan Smith,大家可能没有人没有听说过facebook,这是一个很特殊的公司。我很高兴也非常荣幸有这么出色的嘉宾的阵容。首先我想问大数据是真的趋势还是炒作?什么是大数据?非常简单的一个问题。请每一位嘉宾非常简要的来谈几句,不要超过2分钟。

  Ahmed Baladi:大家下午好!我想跟大家介绍我们在法务领域怎么理解大数据,实际上它可能跟风险、机遇有关的概念,那我想首先讲机遇,我们公司非常看重的,大数据是收集以及处理海量数据的一种机制,而且在这个过程中来进行一些结果的利用。很多数据采集过来都是个人的数据,这些数据能够让公司非常直接或者间接的来去判别一个个人他的行为模式。所以我觉得对于公司来说它是非常大的机遇,大家要了解它相关的风险,因为世界、欧洲、亚洲都有很多的问题、挑战,我来总结一下,第一个就是在处理大数据的时候,应对大数据的时候,你们看到的消费者他们更加的成熟,所以他们的行为更加复杂。那我作为一个消费者,我们希望能够更多的从运营公司这块来获得免费服务,才能免费的向你们提供一些我个人的数据,这是我们最近看到的变化,他们想要了解,对于他们这些数据被采集过去公司怎么用,这是一个大的挑战。第二个是监管机构现在非常具有知识,如果你没有在隐私权方面得到很好的合规,那你很有可能会被这些监管机构问责,所以很多金融、财政的责罚措施。另外还有一个趋势,讲到大数据的时候,很多的公司、很多部门都问我们,我们现在坐在很海量的数据之上,我们怎么利用起来,把它化为经济的利益,比如制药、零售有很多的数据,不一定对你是真正有关注点,而且你不是这些数据的所有者,所以你会来问,就说你是否作为这个数据的拥有者来利用它,是否会有一些权利乱用的问题。

  张亚勤:这是既有机会又有挑战的,比如讲到的隐私权还有所有权的一些问题,我们之后会来问一下各位嘉宾怎么应对这些挑战。接下来请玛莎·贝佳。

  玛莎·贝佳:我想提一个稍微不同的观点,首先大数据是非常真实的,因为信息无处不在。我们可以把它利用起来,赋予它意义,实际上更多不是讲数据本身,更多的是要在数据之上获得洞察,获得与消费者的一些互动,包括聆听他们的行为模式,所以这样的目标指引下,我们觉得对于一个企业、对于人类来说,大数据是非常有益的趋势。比如我们在美国有一个州,那里有很多石油资源,现在正在被利用起来。他们有很多设备给我们采集很多数据,我们有物联网,物联网也是跟大数据有关的发展,所以我们关于这个大数据的讨论并不是数据本身,而是说怎么聆听客户、聆听智能设备的一些声音,然后在这个基础上做出一些知情的决策,来帮助企业发展。

  张亚勤:我同意你的意见,不仅讲量,而且是讲这种洞察、讲这种数据的分析,怎么在这个基础上来提炼一些有用的信息。

  刘积仁:我认为大数据的定义是通过数据很准确、深刻的标识出来人或者是事物行为的本质,通过这些数据来产生商业的或某一种动机的目的。从这个意义上来说,至少有几个特征不属于大数据,第一个大并不意味着大数据,你有大量的数据并不能说明你是大数据,因为数据里面有意义的数据还是少数的。第二个数据之间复杂的关系往往是跨越行业的,也就是说这些数据越是超越了某个行业,越是能够更复杂的认识人的行为,那这种综合性这是一个大数据的十分明显的特点。另外一块就是它一定是不断交互和循环的。它会越来越产生,也是在不断的学习的,通过越来越深刻的、循环的过程,使这种识别、标识变得更为准确。所以它也是动态的。所以大数据在应用于识别标识行为的过程中,今天因为有了平台、有了提供者、有了人参与、有了综合和跨越,最终还在服务于商业根本的目的。这是我对大数据的理解。

  张亚勤:相当好,数据真是动态的,不断学习的。

  史帝夫·密立根:谢谢!我同意教授刚才的说法,也就是说大数据是帮助我们预测事物的。我想说的是它从某种角度上来说并不是新的概念,我们一直以来有很多的数据,不一定就是以数字的形式,我们一直希望把这些数据转化为信息知识或者智慧。现在这个基本的概念其实并没有太大的变化,变化的是什么呢?是以数字形式出现的数量或者在数字上留下的这些足迹,包括手机或者其他形式留下的足迹越来越多,因为科技在不断的进步,机器也会产生数据,比方说在生产的过程中,我们创造了大量的数据,我们要有一种低成本的方式把他们存储起来,并且加以利用或者说进行分析,比方说你有这种方式进行生产,你就可以提高这个生产的效率和收益。所以大数据这个技术的概念本身并不是全新的,现在我们产生大量数据是推动大数据走到前台最重要的因素,我们需要通过大数据更好的预测人的行为,我希望把它用在好的地方而不是坏的地方。因为有一个隐私权保护的问题。谢谢!

  张亚勤:第一个是时时、第二个是可预测性。

  任克英:在金融领域中,金融业已经成为大数据的最早的使用行业之一,包括投行和其他的一些金融机构都在使用大数据来找到投资的机会,交易员也通过大数据的分析,包括新闻和社会媒体来获得收益,所以在这一领域中,其实大数据已经广泛的使用,刚才张亚勤已经提到了,第一个是有4V,容量、速度,是由4个V打头的英语单词组成的。大数据的数量已经远远的超过了比方传统的信用卡所能够传出的数据,比方说现在智能手机的大幅使用,创造了一些新的数据流,我想企业可以追踪顾客使用手机买了什么东西,同时还可以用机器学习的工具制定自己新的营销战略,根据顾客使用的情况来做出反映。包括电子商务的渠道中,消费者的行为已经发生变化,还会继续发生变化,我们也要进行必要的调整。下一代的一些技术,比方说音频、视频的文件进一步扩大大数据的类别,而且它传输的速度也比过去快了很多,因为我认为这是大数据的重要特点,而且这个特点在未来会不断的更加重要,而且数据移动过程中也会产生很多效益,我想它会产生更多大数据的源头。最后一点我想说的是,我认为在现代的世界中,每个数据分析的问题就是垃圾的问题,只有那些精确、可以使用的数据才是对我们有用的,所以我们希望数据能够更加使用方便一些。

  Vaughan Smith:我认为大数据是经济增长的新边界,比方说我们这个脸谱公司现在有5亿多的用户,每天都上我们的网。我们并不是不断调整我们的页面,我们有一系列的内容,然后根据用户的情况来设计他们登陆的页面,我们对全世界数亿计的人在很短的时间给他们定制的登陆的页面,大数据是大家都已经非常熟悉的,很多人担心可能会出现风险的问题、消费者他们创造了很多的数据,如果你看我们脸谱的话,我们各种各样的信息就会增加100亿,包括照片、消息、状态等等。我们要了解顾客们他们感兴趣的是什么内容,所以我们就需要进行分析,所以我们需要注意两个问题,一个是我们要确保他们的数据是安全的,同时我们要给他们的数据带来价值。我们认为这方面的工作才刚刚开始。

  张亚勤:我再补充一下,大数据给我们带来了很多的希望,包括数据库存储和分析,每天分析的数据很多,大数据还可以做什么呢?

  史帝夫·密立根:有一个问题大家需要了解,数据一般的周期根据交易的情况,有些数据它会非常活跃,有些数据会不是那么活跃,在这样的情况下有一些不同的特点,比方说今天所生产出的这些数据是结构性数据和非结构性数据,非结构性数据包括图片、音频等等,而结构数据是可以放在数据库里的数据。就拿脸谱来说,他们的数据并不是一个一般的生命周期,它的生命周期是非常的短的,有时候我们通过这些数据来了解用户们的各种习惯,所以从我们这个系统的角度来说,我们为了想在市场中向他们提供服务,我们主要解决的问题是大数据的环境。包括传统的一些交易,我们还会继续关注,我们现在所需要的,我认为和云计算有关系的,比如对微软[微博]来说,我希望大家不要借以我用你们公司作为举例的例子,脸谱正在设计自己的系统,使我们满足一些独特的需求,包括像传统的企业中你可能并没有办法来低成本做到这点,微软或者其他的IT公司他们可以帮助你扩大规模或者是给你提供各种各样的网络的服务,使得你能够培养出能力,能够解决各种类型、各种发展速度的数据。

  Vaughan Smith:企业总希望从数据中获得利润,10年前没有人会发自己孩子的照片或者电子邮箱的地址,现在我女儿在玩一个足球游戏,我就把我女儿玩足球的照片放到了网上,同时我们在世界各地的亲戚们都可以看到我女儿踢球的照片,而且我觉得跟他们的互动使我感觉很好。我现在是愿意把照片放到网上,10年前我们首次在网站上设置规定什么人才能在网上看到他们发布的内容。现在顾客愿意把他们的数据放在网上,如果有价值的话。

  玛莎·贝佳:谈到最近的变革,我是工程师来自旧的技术世界,我们知道相关的学科发生了很大的变化,他们创造了大量的数据。我们关注的不应该是杂音,而应该是真正的信号,我们可以根据大数据来做出决策,根据我们现在收到的数据我给大家举个例子。比方说你做人口调查,在城市中有多少人,过去就是一家一户的访问这些人,然后来了解一共有多少人过来、有多少人离开。比方在这个城市中有1万人在这里居住,我们收集的数据可以通过这个来进行DNA测序等等,现在我们派出20个人到这个城市中去,这些调查人员也了解居民的居住情况、家庭的情况,他们通过分析、总结来了解整个城镇人口的状况。所以我们现在调查的方式也发生了变化,和传统是很不一样的,这使得我们能够更快的做出决策,使得我们的行为更加具有预测性。同时也能够使得我们决策做的有针对性。

  Ahmed Baladi:我觉得这个时点是很重要的,我之前也讲过,大的数据必定有大的海量数据,所以它的存储也需要比较大量。另外很多公司都是全球化运营的,他们主要的挑战就是来理解这样的体制适用于我的是怎样的组合。比如我们公司有在加州的客户、有在亚洲的客户,有从世界各地看到的、收集到的这些数据,我们可以看到这些不同的区域、不同的管辖区有自己的体制、监管的框架,从不同的经营者,大家可以看到我们去年斯诺登的事件给我们带来很多关于数据隐私的担忧,是否这个数据真正的安全,我们在讲大数据的时候必定要谈的是安全,所以从我的角度来讲,怎么来利用大数据的好处又来避免它的劣势。

  任克英:云计算增加大数据的相关性,而云计算在经济上也是具有吸引力的项目。而且它的成本也是比较便宜的,所以云计算的部署也能够使大数据的利用率增加,使数据分析的能力能够进一步加强。我觉得云计算实际上是为大数据形成了支撑,使它更加具有意义和价值。

  刘积仁:从技术的角度来看,事实上这是人类历史上用最低的成本让每个人都能贡献数据时代的到来,而且是自动的和主动的,这是过去从来没有的。我们过去都是花钱弄数据、买数据,今天大批量的人主动的贡献数据,今天在座你们的位置肯定有人知道你们在什么地方,甚至很多人的手机别人知道,你的E-mail都知道。当所有人带手机开车的时候,这个路的赛堵的信息也都全部知道了。如果你到飞机场,这些分散的数据如果都被综合的总在一起,在过去从来没有过用这么便宜、这么快的时间大量获得数据的时代,所以这是我们跟过去存取,单纯的存储有本质的变化,一是个性化,二是极度准确,三是准确的可以让你十分吃惊,从你的年龄、性别、行为,包括人体的特征,如果把这些东西全部综合在一起。你每天到酒吧喝酒刷信用卡和你到医院看病的数据,毫无疑问你的看病的问题是因为喝酒。今天律师在这儿,什么是隐私这个问题,未来是一个很大的挑战,因为大部分是你愿意贡献出来的,是你身上带的东西主动贡献出来的,是你为了买便宜东西把你的行为暴露出来的。你今天想买打折的,另外技术上的诱惑,事实上大家每次按一个键的时候,你都不知道背后有多少诱惑你贡献数据,不能叫“陷阱”,比如你今天买东西马上来10个东西,10个东西埋葬了各种各样的属性来试验你是否喜欢,你点看一下就明白你喜欢这个东西,你买鞋会卖包,卖包会卖机票,看了你的信用卡他卖你各种各样的东西,这是大数据时代的魅力,也是未来商业模式被冲击的技术。所以回答张亚勤和过去的不同,个性化、准确、自动暴露、收集数据信息,各种各样装置使你爱不释手的同时,把所有不想告诉别人的东西都告诉了别人。

  张亚勤:讲的很对,刚才讲大数据比较多,这个主题还有一个讲云计算,云计算这块有什么趋势呢?我们看到云计算可以做公有云或者私有云,或者说像亚马逊[微博]和facebook都用自己的私有云,有的是用开源的,还有和云计算相关的硬件。为什么你们要做自己的私有云,这个想法是什么?当然你的解答我们确保它保密,不会离开这个房间。

  Vaughan Smith:我觉得做的混合云它的思考对于中国、对于世界都是有启示的,首先我们对于开源软件是非常有热情的,我们用很多的开源软件,最近也是开源软件和开源系统的一个非常重要的贡献公司。数据中心打造我们比较靠前,我们是做的比较大的几家公司之一,另外我们看自己做数据中心的公司也是做了自己的软件和软件的优化,从开源软件这块来看,我们在想怎么把这个合作的框架也套用到硬件这块,如果你要每年花那么多的钱做数据中心、硬件的部署,实际上是非常大的投入,所以我们在想怎么来帮助像这种开放源,把资源整合起来,让公司互通有无。我想对于我们来看是有好处,过去3年中,我们大概是节省了超过10亿美元,设计以及建造方面也是非常的便捷。另外我们和百度[微博]、阿里巴巴[微博]也有合作,通过这种分享,他们也是收到好处,怎么把数据中心做的更有效、更加低成本。

  张亚勤:讲到不同云的部署策略方面,大家有什么想法,怎么利用大数据、捕获大数据?

  史帝夫·密立根:讲到开源,facebook做的工作还是有需要存储的自有的设备,因为这些数据必须存在设备上。冷数据到热数据还有可拓展性等问题都要考虑,还有适应性的问题,所以用公有云的解决方案是可以让你更好的来对于自己的架构进行优化,如果用私有云可能效率就没有那么高。如果公司想做私有云,我们也会支持。云计算是来看这些公有云的架构设计者在做什么,我觉得有些很好的应用是可以用在公有云的架构上,比如大数据就是很好的例子。另外也有一些结合之后的好处,它不是独立的概念大数据和云计算。

  玛莎·贝佳:可能我的观点有不同的侧重,确实在某些行业,像金融服务业我们有这样的需要、这样的胃口,需要有混合云的解决方案。有一部分业务需要隐私保护和比较高的私密性,那可以用私有云,其他部分用公有云,它不是二者择其一的问题。我觉得有些对任务关键性的应用,你不想放到公共云上,另外情感上,你的意识上不愿意做公有云,你就需要有公司混合云的设计,这是可以理解的。

  刘积仁:谈到公有云和私有云,我觉得大家的第一个感觉就是安全性。我认为这个问题到最后一定会转变成为以成本为计算的方向,因为公有和私有从安全这件事,从长远上一定会得到统一,并不意味着私有就安全,公有就不安全。像过去把钱放在家里,我们不敢放在银行,你埋在地下,这究竟是安全还是不安全?这不一定。我认为安全背后一定有公有云安全的提供者,根据你要求的质量,如果想最高等级,你付钱那我专门给你看着,我认为这个问题未来会得到极大的统一。但是有一个问题会变得不一样,我自己用可能买公有的便宜,那我就找自己的解决方案,所以这种结构上,我最终相信两种都是会存在的,这就像买车和租车一样。

  张亚勤:我们刚才谈到大数据也好、云计算也好,其实有一个很大的问题,就是人才的问题,我们现在叫做数据科学家或者数据工程师,这些人要懂数学、统计学、计算机科学,最好还是要对某一行业比较了解,比如懂金融行业或者健康医疗行业,人才的缺陷怎么办?刘教授不仅仅管公司,你也是教授,也是培养人才的,能不能谈谈你的看法?

  刘积仁:我认为未来这是很大的挑战,当我们谈计算的时候,事实上已经不完全是工程,它涉及的学科首先是跨越某个垂直行业的,跨越性要求人才有特别宽广的知识范围,我更认为可能不是一个人来解决,而是更应该团队来解决,因为任何一个人拥有了医学的知识、工程的知识、数学的知识,有的时候还跑到物理上,不太可能,所以也一定是团队的,这是知识的跨越。二是大数据计算过程中,有这个算法的学习性和准确性,这就要求他在工程性能力上极其优越,可能大家知道IT很绿色,大家不知道IT行业也是耗费能源的一个大户,IT大数据是耗费能源的一个大户,谷歌[微博]可能是最知道的。全世界只要大家每天用谷歌发一个文字,那电就用了很多,这就造成未来我们讲绿色环境保护,也会产生你在网上别没事老在那儿溜达,溜达人多了浪费也是很多。这个环境保护已经不仅仅是你自己不排放的事,你在网上也是这样,但是控制每个人有效的工作,这件事已经不容易了。现在的问题不是控制我们自己,我们每天不用这个东西我们有病,每天早上不看手机,特别过去用微博,现在用微信,天天不鼓动两下不行。照相机的高清晰度、存储量越来越大,从这个意义来看,算法、精确度、引导性都会变成一种新的的科学。我们的所有算法使人们减少不正当的学问,也没有人研究这个学问,但我相信未来会出一批博士和好的教授,在互联网时代找到他自己学科发展的方向。

  张亚勤:讲到数据中心、讲到吲计算的确要用很多电量和带宽,所以谷歌、微软、facebook这样的公司经常把数据中心放到冷的地方、有水源的地方、便宜的地方。在中国电费是美国的3-5倍,带宽是美国的3-5倍,我们中国发展大数据、云计算有没有什么优势我待会问。讲到清洁能源,电站或者数据中心,这里有一位专家,能不能讲一下数据中心的能效问题?

  任克英:实际上我们是在太阳发电方面是有些计划的,因为太阳能行业可能会像90年代的电信业一样快速发展,所以太阳能行业在未来的发展前景是非常好的,当然现在太阳能行业还没有解决它的电池问题。当你需要用能源的时候没有太阳和阳光,有阳光的时候你可能不需要能源,所以这是本行业需要解决的问题。总体来说,我认为太阳能行业是清洁的可替代能源。现在其他的一些可替代能源,风能、水利等等,他们也有自己的局限性。

  张亚勤:我们这个问题可能太深了,我们还是回到今天会议的主题。我们知道中国过去30年跟随其他国家的发展,包括英特网领域,但是最近几年中,中国的几个行业爆炸性的发展,他们更多的是市场的创新,而不是技术的创新,现在有这个大数据之后,中国已经有了一些优势,中国的规模很大、中国的计算能力都是中国的优势。我给大家提的问题是在这样一个大数据和云计算的时代,中国有没有可能成为领导者?包括在技术创新和市场创新方面。

  史帝夫·密立根:我想简单的说几句,这些数据中心他们需要使用大量的能源,比方到2020年使用的能源,存储数据所使用的能源将会超过IT业,比2008年IT业所有使用的能源都要多,存储数据是需要大量的能源的,包括数据中心等等。我们现在所必需做的事情就是要对数据的存储要进行设计,使它效率更高。数据在未来会越来越多,我们必须要更加关注这个问题,要消除各种障碍,使得数据的存储更有效率来减少能源的平均消耗。我们希望能源的平均消耗能够减少,我们同时也希望降温的问题可能有不同的手段,用液体的方式把它浸入式的降温,也可以使用其他的手段,比方说在比较潮湿的环境中如何进行降温,我们现在的问题就是我们在这个行业中工作的人必须要考虑到能源使用的问题,有一种创新性的角度来考虑这个问题。

  Vaughan Smith:我同意史帝夫的看法,我们要非常关注能源的增长,能源增长必须值得我们关注。我们现在就是数据中心的设计中必须要考虑能源使用的问题,这可能过去并不是非常重视。我们知道每年因为现在数据中心的设计问题,我们现在冷却了大量的能源,本来可以用在其他更好的地方。

  玛莎·贝佳:回到中国流动性的问题,我认为中国很有可能成为领先的国家,我们获得这些数据对他们进行分析,我们有数据中心这个架构,我们还有一些带宽的问题,我认为中国的很多厂商在带宽上是具有优势的,美国不见得比中国好。我给大家举一个例子,我们布置了很多设备,如果没有带宽把数据送到数据中心就不行,现在我们每天所创造的数据是惊人的。我们发现光是手机所产生的数据就超过以往的总和,所以我们必须确保我们的基础设施能很好的运输和储存数据,我认为中国是有这方面的条件的。中国在数据和电信方面都有它的优势,所以我是非常乐观的,我觉得我们应该更加乐观。

  刘积仁:刚才张亚勤问的问题,我觉得中国首先有机会,能不能有突破是另外一回事。为什么说有机会呢?因为我们遇到的问题可能是现在全世界在这方面最复杂的。互联网的用户是中国最多的,智能手机的客户中国也是最多的,我们的人口多、产生的数据量特别大,数据本身又特别复杂。我为什么说有机会呢?肯定是复杂里面才有机会,困难的背后才是机会,所以中国会遇到刚才讨论的所有问题,比如说能源问题,现在中国人文化上还不一样,中国现在很多家庭在家里建立自己的数据中心,他不愿意放在公共网上,自己家里弄了一大堆,我自己朋友家里也有100个2T的硬盘。

  刘积仁:技术的创新方面,我们发现正在产生越来越多的消息,小的手机,除了硬件之外产生越来越大量的数据。我们现在做手机对手机,聊天又开始语音,现在把手机和照相机弄在一起,越弄数据量越大,中国未来有多少能源支持每个家里准备建的数据中心,有多少能源用在这么快速发展的时髦的数据,而且中国人的年轻人怎么一年换一个智能手机,时髦的换两个,每次换都增加数据。他有这个文化,他愿意。很多人和他聊天,你和他说话他不愿意说,拿电脑说话,就是这样的文化。我们如何在技术上解决、在能源上如何解决、在结构上如何解决,因为解决这个问题可能造成在中国解决很多问题都是极其特殊的。比如我们能够发现一种算法解决很大的数据,我对微信的创新我认为就是创举。它一开始聊天的时候大家都差不多,都有,现在越弄越丰富了,又建立群,又圈,我在上面买酒,红酒开卖了,完了大家开始交流了,现在又卖符号了,很多的公司开发笑脸、小动物,都开始卖钱了,变成一个平台。过去就是交流的工具,现在变成了平台,然后变成金融,又变成销售工具了,所有的这些,我认为就是创新,未来可能在这些领域里面都会产生一些创造的结构。现在方法稍微简单一点,南方过去不知道,各个城市招商引资,欢迎数据中心,现在都不欢迎了。最近比较热门的是大庆,大庆号称是中国最适合建设数据中心的地方,最近也在发展,因为成本比较低。所以我认为有机会。

  任克英:我同意教授刚才的看法,除了能源技术结构的问题以外,我认为还有一个问题就是国有企业改革的问题,在90年代的时候,中国在电信行业中,中国移动[微博]、中国电信[微博]、中国联通[微博](3.16, -0.01, -0.32%)分家,然后开始了改革和电信业的发展,现在他们自己就面临更多的挑战。虽然中国电信、电子商务和英特网认为是吸引外资的重要领域来促进内资的消费。三网融合如何进一步快速向前发展?我认为他们各自的改革都需要解决好。

  张亚勤:刚才讲的都是激动人心的一些事情,刚才刘教授提到了我们有很多超级的应用,包括电子商务的淘宝等等,这都是很好的东西。我们现在面临的挑战,一个是能源,一个是隐私,大家发现数据的碎片化日益严重,过去大家关心的是获取数据是否容易,现在数据变得越来越有价值,就像是货币一样,可能有些人不愿意和别人分享数据。比方说你在百度上可能有些东西搜索不到,在淘宝上有些东西也搜索不到,谷歌上有些东西可能就搜索,在中国就无法登陆脸谱网站。你认为这是不是一个挑战呢?因为它可能关系到的就是开放性的问题。

  刘积仁:比如我们现在都讲我的信息是我个人的,我不想给你,但是你今天走到商店,人家说你要给我,我的商品给你打折,一定有人会把它做成交易。我们现在看到各个分割的岛也正在开始,互相能够交流,这时候就可以变成市场的行为。我觉得隐私的保护,每个人都想保护,举一个最典型的例子,医学诊断,没有大数据诊断就不准。你不贡献你的数据你还想拿到准确数据?那你得用别人的数据。如果要你的数据交给别人做诊断,你的数据也可以帮助别人,你愿意吗?你要说NO,那你就没有准确的诊断。

  张亚勤:这点讲的很对,数据本身是已经成为知识产权,它的价值是可以进行交易、可以交换的,而且对于这样的隐私数据的交换实际上是有市场的。所以从执法这块,从监管这块能不能讲怎么规制呢?

  Ahmed Baladi:大家没法回避的事实就是隐私权,很多国家都在发展隐私权的法律法规,比如说新加坡,中国现在也在做,欧洲在欧盟我们有一个新的规定马上出台,所以不仅仅是在欧盟建立注册的公司,而且包括哪些在海外建立,但是向欧洲用户提供服务的公司,实际上在美国没有类似的关于这种隐私权保护的法律,关于一些集体诉讼的法律。我觉得这是现实,你必须要接受它,你要把它变成你自己的竞争优势。我们看到很多的公司正在利用这样的隐私保护的趋势,然后来保护他们的客户、消费者的信息。只要我合规,那你是可以来用我的数据来输出这个数据,我觉得在这块有些条件是每个国家都需要来合规的,一是透明度的问题,就是你把这些个人数据收集过来怎么用,这点要跟他们说清楚。二是同意权,就是对于把数据用作互联网网上交易之外,你要向这些数据的提供者表明,这些数据拿过来我怎么保护,是否会跟第三方分享,和合伙公司进行分享。三是数据不希望丢失或者说未经授权得到其他第三方的获取。这又回到刚才的点上,我们有遗忘权新的概念,比如我今天在网上发博客,要确保他们10年之后有权利把这个东西在互联网上移除掉,这个技术现在已经有,而且会做的越来越顺畅。四是对于个人来说,我们要有数据的准入权,有一个删除权、修改权,所以这一套规则我觉得是在全球共通的,所以大家不用担心、不用害怕,不是说什么事情都可以达成,我们希望通过一些规制来解决数据方面的隐患。

  张亚勤:讲到版权的盗版这块,我们看到它的法规确实有些过时,10年前制定的需要有些更新,接下来请观众们提问。

  提问:大数据的时代如何引用?因为在座的7位有6位是服务提供商,我听了半天,我觉得你们还是以商为本,你们怎么用这个数据?作为数据的主动提供者,我也想运用这个数据,微信的朋友圈,如果哪些人和我价值观比较相似,我做生意会倾向于这些人。当我提供主动数据的时候,我希望能接触你提供给我的某些数据,而且提供软件让我运用大数据的方式来分析这些数据。服务商之间的竞争最后会打破服务商对大数据的垄断,让用户成为大数据的主人。

  南澳大学教授:我想问关于网络安全的问题,实际上澳洲政府和其他的政府在这块非常的上心,一些面部识别的技术,大家可能也知道,在英国生物识别的技术非常超前,那谁掌握数据,这是很重要的问题。这个数据托管在哪里?实际上不同监管机构的这种配合以及谁有管辖权,这个问题一直没有得到解决,能不能提一提?我觉得这是可能导致出现问题的领域,因为很多的人觉得如果放在不当的人手里,就失去了数据的保护。

  Ahmed Baladi:如果公司来收集数据进行分析、进行保管的话,至少在欧洲我们有相关的法律,关于数据库的一些权利,所以你可以参考这个。但是其他的国家,我觉得还是比较具有挑战性,而且没有明确的答案,你怎么应对这个问题?特别是一些数据使用的利益冲突。对于在一些国家,你可能没法确定是否有相应的法律框架,你必须要确保要有一个合同的这种制约,要确保这个服务提供商能够来遵守你提出的一些数据保护、数据使用方面的要求。如果这个政府、这个国家已经有相应比较完善的法律,那就不用太担心,所以我们在谈到这种权限问题的时候,对于我来说,这个问题更多讲数据以及开放数据以及在多大程度上,政府还有企业他们愿意分享数据与其他的一些企业和大众来分享数据。我觉得不同的情况要不同的看,欧盟和其他很多国家,很多国家政府是愿意分享数据的,所以他的问题就是相应的分享的范围以及分享的条件。不一定说把这些数据拿过来进行商业化的使用,来赚钱。我同意你的意见,这是很复杂的问题,很难权衡。

  提问:实际上这是超出了我们的讨论范围,那我想问一下这种预确定的问题,从数据的分析方面来看,你如果只是在这个基础上得出一个非常高的概率,会有犯罪出现的话,或者说你根据数据觉得能够跟人非常好的打交道,所以所谓的这些预测来预测人行[微博]为模式的演变,这种可能性会不会让你觉得非常可怕?

  张亚勤:这个问题提的很有意思,用数据挖掘、数据分析的工具来做人行为预测的能力,比如说一个人未来犯什么病,考虑现在的健康状况,在这个基础上可以算出你得某个病的概率有多高,或者撞车的纪律有多高,就是这种对未来预测的可能性,你觉得它可怕吗?

  玛莎·贝佳:大家做雇佣的时候都会做背景考核,如果觉得你的背景有问题,不会和人很好相处就不会雇佣你,这是很正常的。我们觉得预测性,根据数据和信息在这个基础上进行收集、分析之后,得出这样一种洞察,它可能会拿来做一些模拟的算法。比如可能用这样的算法做出预测性结果的使用,当然这块可能有合法性的问题,这个问题可能要进一步解决。把这样的预测性做的更准确方面,我们觉得还是更多的认为它是一个机会,更多的机会而不是更多的关注。

  提问:数字世界才刚刚开始,人所有的思考和行为会越来越被大数据所左右,人很多的选择未来都可能依据数据的参考来做出他的选择。在人被大数据所包围的时候,我们如何保护人类自身的、自发的、本能的自由、自主思考的能力?

  Vaughan Smith:我们认为大数据它带来更多的透明度,让这个世界看的更清楚,比如你第一次来博鳌,你不知道去哪些酒店或者是餐厅,甚至你在会场你不知道要找哪些人去沟通,我觉得用大数据就可以引导你,让你的生活安排更加贴合你的需要。我觉得在这块有些负面的效果,比如说有些电影公司说我们现在不能把电影做的太长,因为我们现在很多电影短片都会在facebook上放出来,大家就不会看电影了,所以它既有利又有弊。

  提问:您刚才说了关于零星的数据,比如信用卡刷多少次导致你的肝退化或者肝病,整合数据以后可以看出它之间的关系。我知道刘总东软也在做关于智慧医疗、智慧家居的东西,所以想让你关于以后医疗数据和零星数据整合方面多说一点。

  刘积仁:医疗是任何社会最复杂的问题,可以这么说,医生就是一个艺术家,他特别个性化,今天他个人收的数据,最简单的例子,如果你有病,十分不清楚,然后你到大医院会诊,来了8个各个科的主任,第一个说检查了不是我的问题,第二个说也不是我的问题,八个都走了,都不是他们的问题,但是病人有问题,这种问题是经常的,原因是他们用自己独立的数据和判断和方法学来看待他的病人。所以我认为医学的最大的改进在大数据的时代,就个性化和精准治疗时代的到来,就是说将来吃的药不应该是按照说明书每6小时吃一片,每个人的消化不一样。当然我是瞎说,我认为未来药厂要给不同的人制造不同的药,看病方法也不同。最重要的是所有的医生,现在张医生看病不能一个病有5、6个医生一起看吗?这样看更准确,这个过程就是大数据。今天中国医疗最大的浪费是诊断错了,再诊断又错了,反复的错造成后来的秩序全都错了,所以大数据的时代我认为在改变社会未来服务,刚才讲到怎么样为个人创造价值,其中有一个方面就是大数据在改变人的未来的健康走入个性化和精确医疗的时代。

本文来源:http://www.hh-data.com/Shownews_233.html
WWW.HH-DATA.COM,南京服务器托管第一品牌  TEL:400-025-9-467  QQ:21390019
本文由华昊数据整理发布,修订2014-4-14

Baidu
 
QQ:21390019
QQ:925493756
点击这里给我发消息
点击这里给我发消息
服务热线
025-58633651
 
友情链接:南京服务器托管 | 南京服务器租用 | 南京服务器手机版