登陆注册
2906500000018

第18章 大数据与技术变革(2)

目前,数据服务产业链上真正的大数据玩家,应该是例如谷歌之类的公司,通过重复利用数据以获得利益。谷歌成功地建立了“网页搜索+广告”的商业模式,其所有的业务都是构建在大数据之上的。因此,谷歌是大数据最大的玩家。2012年,它的总营收达到501.75亿美元,利润107.4亿美元,其九成利润来自广告。有咨询公司预测,2017年全球大数据技术的市场空间约500亿美金,约等于谷歌2012年的总营收。这其中,既包括了技术,也包括了大数据工具和相应的服务。

由此观之,在大数据时代的未来,获利最大者将是“数据为王”或者“数据驱动”的业务内涵和模式,发展大数据并挖掘大数据的新价值是其不可不为的原动力。中国也必须尽快扶植相关的产业和公司,以抗衡谷歌这样的跨国巨头,并最终实现赶超。

技术支持与发展

大数据不是口号,而是技术,同时也是技术的整合。大数据的到来,已经成为现实生活中无法逃避的挑战。无论如何,大数据已经成为新一轮技术变革的最强音。关于模式的思考,关于安全的质疑,关于应用的探索,我们必须静下心来看大数据,实实在在了解大数据目前仍然需要解决的问题。

国计民生、商业创新无不与大数据相关,大数据渐渐向人们展现了它为学术、工业和政府带来的巨大机遇。每当我们要做出决策的时候,大数据就无处不在。无论如何,我们都必须直面大数据时代的到来。

大数据给中国带来的巨大挑战,首先是三个重要的技术问题。

☆如何利用信息技术等手段处理非结构化和半结构化数据

大数据的一个重要特点就是数据分散。大数据中,85%都是非结构化的数据,结构化数据只占15%左右。大数据的另一个特点就是不确定性,表现在高维、多变和强随机性等方面。有90%的数据来自开源数据,其余的被存储在数据库中。而大数据则大量存在于社交网络、互联网和电子商务等领域。

值得注意的是,大数据刺激了大量的研究问题。但是大数据每一种表示形式都仅呈现数据本身的侧面表现,并非全貌。比如图像,如何把它转化成多维数据表、面向对象的数据模型或者直接基于图像的数据模型?

如果把通过数据挖掘提取“粗糙知识”的过程称为“一次挖掘”过程,那么将粗糙知识与被量化后的主观知识相结合而产生“智能知识”的过程就叫作“二次挖掘”。这些结构化的粗糙知识可以被主观知识加工处理并转化,生成半结构化和非结构化的智能知识,这也正是基于大数据的数据挖掘所产生的结构化的粗糙知识的一些新特征。

由于大数据所具有的半结构化和非结构化的特点,寻求“智能知识”也就反映了大数据研究的核心价值。非结构化和半结构化数据的个体表现、一般性特征和基本原理尚不清晰,要想实现从“一次挖掘”到“二次挖掘”这样类似事物量到质的飞跃,还必须通过包括数学、经济学、社会学、计算机科学和管理科学在内的多学科交叉来研究和讨论。这些都需要给定一种半结构化或非结构化数据,包括具体的经验、常识、本能、情境知识和用户偏好。

☆如何探索大数据复杂性、不确定性特征描述的刻画方法及大数据的系统建模

大数据的复杂形式导致许多对“粗糙知识”的度量和评估显得尤为重要。这一问题的突破是实现大数据知识发现的前提和关键。这里,人机交互将起到至关重要的作用。管理科学,尤其是基于最优化的理论将在发展大数据知识发现的一般性方法和规律性中发挥重要的作用。

从短期而言,学术界鼓励发展半结构化、非结构化数据之间的转化原则,以支持大数据的交叉工业应用。从长远角度来看,可以将已知的最优化、数据包络分析、期望理论、管理科学中的效用理论应用到“二次挖掘”过程中,研究如何将主观知识融合到数据挖掘产生的粗糙知识中。大数据的个体复杂性和随机性所带来的挑战将促使大数据数学结构的形成,从而导致大数据统一理论的完备。

☆数据异构性与决策异构性的关系对大数据知识发现与管理决策的影响

在大数据环境下,管理决策面临着两个“异构性”问题:“决策异构性”和“数据异构性”。大数据已经改变了传统的管理决策结构的模式。决策结构的变化要求人们去探讨如何为支持更高层次的决策而去做“二次挖掘”。探索大数据环境下决策结构的改变对管理决策结构的影响会成为一个公开的科研问题。寻找大数据的科学模式将带来对研究大数据之美的一般性方法的探究,已知的数据挖掘方法将成为大数据挖掘的工具。

无论大数据带来了哪种数据异构性,大数据中的“粗糙知识”仍可被看作“一次挖掘”的范畴。由于大数据本身的复杂性,这一问题无疑是一个重要的科研课题,传统的管理决策模式取决于对业务知识的学习和日益积累的实践经验,而管理决策又是以数据分析为基础的。大数据是一种具有隐藏法则的人造自然,如果我们找到了将非结构化、半结构化数据转化成结构化数据的方法,通过寻找“二次挖掘”产生的“智能知识”来作为数据异构性和决策异构性之间的桥梁,那么我们将能够很好地应对传统的数据挖掘理论和技术提出的新挑战。尽管这样的探索十分困难,但是研究大数据,是十分必要的。

除此之外,还有一些数据科学的问题,以上也仅仅是研究大数据挑战的一个起点。在未来,相关的问题都可以得到很好地解决。

自从人类进入到信息化时代以来,我们不断产生大量的数据,加之物联网、移动互联网应用的大规模爆发,大量新数据以每年50%的速度在增长,或者说每两年就要翻一番多。数据已经渗透到每一个行业和服务职能领域,随着互联网技术的不断发展,数据本身就是资产,这一点在业界已经形成共识。

人们对于海量数据的运用将预示着新一波生产率增长和消费者盈余浪潮的到来。在云计算时代,人类通过对海量大数据的高效分析获得商业以及社会价值。云时代的到来、移动终端普及使得数据创造的主体由企业逐渐转向个体,而个体所产生的绝大部分数据为图片、文档、视频等非结构化数据。随着云计算技术的快速普及,人类社会正在步入一个被互联网和通讯技术引爆的大数据时代。大数据技术在中国的发展前景是光明的,前提是我们能够提升和扩充自己的技术王国,建设美好的蓝图。

全球技术研究和咨询公司Gartner将大数据技术列入2012年对众多公司和组织机构具有战略意义的十大技术与趋势之一。Gartner在其新兴技术成熟度曲线中将大数据技术视为转型技术,这意味着大数据技术将在未来3?5年内进入主流。中国也不会落后,“云基地”作为国内最早根植在云计算技术及商业模式的领先者,也一直积极关注大数据带来的发展机遇。

从战略到战术层面,从理念到技术层面,中国都已开始自我的进化,更加适应这个新的时代。中国经过了几十年的积累,让不断产生的海量数据正在成为虚拟世界取之不尽的能源,而它们还远未被开发。

信息化技术的普及使得中国企业更多的办公流程通过网络得以实现,由此产生的数据也以非结构化数据为主。而其他领域的研究,如云计算、下一代分析、内存计算等也都与大数据的研究相辅相成。我们尚无法确定万物是否皆有数据,但是至少已经推开了这样一扇大门:以理性的态度思考大数据,共同保持着持续变革的动力,主动地拥抱这种变化。早在2012年时,非结构化数据就已达到了互联网整个数据量的75%以上,用于提取智慧的大数据,往往是这些非结构化数据。而现在,这个比例已变得更大,我们也拥有了足够的技术支持。换句话说,中国的大数据技术的积累已到达了突破阶段。

“脚印追踪”--个性化的数据推荐系统

如果你在自己经常网购的网站看到“猜你喜欢”之类的东西是那么符合自己的要求,不要惊讶,因为我们每一个人都已经步入了大数据时代。你可以想象一下,也许在未来,每天打开电脑,它会自动把你所有的需求列一个清单,你只需要坐在舒服的沙发上点几个确定选项,就可以轻轻松松地搞定一切了。

不要以为这种情形只发生在科幻电影中。商家只有在满足大众的需求时才能够卖出商品,而这一切都是在满足大众的个性化需求的基础之上实现的。

2011年9月,淘宝公司发起了用户定制电视的活动,2天内1万台订制电视就被抢光。在该活动中,用户可以选择电视的各种属性,包括尺寸、边框、颜色等,厂商根据用户的订制内容生产电视产品,再送货到客户的家中。

从这个具有代表性的案例中我们就可以发现,未来的商业模式正在发生着质的变化,它通过满足个性化需求来提升商业运转的效率,在为消费者提供更好服务的同时,获得更多的利润。

☆“猜你喜欢”的由来

网购中随处可见的“猜你喜欢”是怎么来的呢?事实上,这种推荐方式来源于亚马逊的技术创新。

亚马逊公司的内容起初都是由人工完成的,他们聘请了一个由20人组成的书评团队在网页上推荐有意思的新书。但是随着在亚马逊上架的图书越来越多,这样的人工操作自然越来越显得乏力低效了。

后来,亚马逊的总裁贝索斯决定尝试更有创造性的做法,根据用户的习惯来为其推荐商品。但若想实现个性化推荐,必须要将不同用户进行比较再找到用户之间的关联。但是,面对庞大的数据,这种推荐系统算法烦琐,结果也是不尽如人意。

同类推荐
  • 短线炒股100招

    短线炒股100招

    全书共分10章,包括如何根据基础理论知识寻找短线买点、正确认识并建立短线操作系统和短线逃顶等三大部分。寻找短线买点部分包括:技术指标买点、均线买点、K线组合买点、量能形态买点、黄金分割率买点和形态买点等内容。正确认识并建立短线操作系统部分包括:短线操作的概念、短线操作理念和心态、短线操作的市场环境和短线操作的基本步骤等内容。短线逃顶部分包括:K线顶、轨道线顶、均线顶和短线共振卖点等内容。
  • 旅游目的地营销

    旅游目的地营销

    本书既重视对旅游目的地营销理论的系统介绍,同时也强调了对具体营销与管理方法的分析和说明,因此对各级旅游组织、旅游企业改进和加强旅游目的地营销管理活动的较大的指导意义。同时,本书也适合作为高等院校旅游及相关专业研究生和本科阶段高年级学生的专业教材,或作为旅游研究人员的参考资料使用。
  • 带队伍的第一课

    带队伍的第一课

    本书全面介绍了信任在组织管理中的重要性,说明了只有充分的信任下属、放权给下属,才能够打造更好的执行团队。
  • 中国货币市场运作导论

    中国货币市场运作导论

    本书对我国货币市场发展的理论与实践问题进行了全面系统地研究。全书是以中国货币市场发展的历史沿革为主线,对我国货币市场发展的进程、历史经验教训进行了回顾,并借鉴了西方市场经济国家的有益经验,就如何完善我国货币市场结构与功能、提升货币政策传导效率以及如何有效地对市场进行监管规范作出了前瞻性的理论探索。
  • 从零开始读懂领导学

    从零开始读懂领导学

    生活中大多数的成功者都是各行各业中担当重任的人,他们独特而又迷人,可以兢兢业业又能一呼百应。他们也许没有过人的技术,也许没有庞大的资源,但他们有着神奇的令所有人为之倾倒、让所有人愿意追随的魅力、素质和能力。正是这种魅力、素质和能力,注定了他是一位成功者!
热门推荐
  • 亚莎年代记

    亚莎年代记

    跳海逃生的少年,在一座桃源小岛得到了创世始祖亚莎的力量,仁义礼智信忠孝,创世七神力与魔王七原罪,哪个才能继续书写历史新的篇章?“姐姐,为什么这本‘亚莎年代记’最后写着未完待续?”“花羽大人的故事,从他来到亚莎岛的时候开始,但是他的冒险,还远远没有结束……”
  • 三生缘:惹上极品妖孽男

    三生缘:惹上极品妖孽男

    因为命中注定,她跨越时空;因为三生石畔,他们缘定三生;似温柔;似邪肆;似多情;似冷酷..究竟谁才是谁的命定恋人?温柔如他说:“你就是你,我喜欢的你。”邪肆如他说:“你无法逃离我。”多情如他说:“你是我唯一的专心。”冷酷如他说:“只为你。”
  • 末世之丧尸来袭

    末世之丧尸来袭

    岁月变迁,沧海桑田。相传,杜康醉酒,沉柯烂斧,庄周迷蝶。皆不知晓时光为何物。……
  • 嗨,皇储大人!

    嗨,皇储大人!

    她要钱,他要个王妃,两人一拍即合。一年后,他站在了权力的巅峰,俯瞰众生。她拿着酒杯向他道恭喜:“大人,对你来说我这颗棋子已经没什么用了,我该走了——”结果她离开王宫后他带着行李紧随其后,她住哪他就在哪。她终于忍无可忍:"大人,你不用关心你的子民了吗?"他在床上压着她,严肃地说:“在我床上,你是我唯一的子民。”
  • 香畹楼忆语

    香畹楼忆语

    本书为公版书,为不受著作权法限制的作家、艺术家及其它人士发布的作品,供广大读者阅读交流。
  • 我成为了脑洞星人

    我成为了脑洞星人

    一个普通的学生党,在杀了人之后莫名其妙被抓走,目的是……。。。学生一枚,文笔不好。只希望有人能看看然后给我一些评论。吐槽吧(前提是看了文的哦(?-ω-`))
  • 拾光之旅

    拾光之旅

    拾光,拾起我们曾经的样子。社会中有许多我们意想不到的黑暗,它们像恶魔把你拉下悬崖。唯有遇到那个对的人才能让我们重见光明。ps:这本小说是由一篇篇虐心故事组成,所以有些情节会很模糊,进度也很快。
  • 帝女长平

    帝女长平

    当某一天,你忽然发现自己身边的人都是棋子,而命运的魔爪正在向你伸来,你只能抛去原有的天真,来迎合这个世界的现实。她是长平,一个和亲的公主,肩负着一个使命。每一个人都不简单,都有自己的故事。如果某一天当我们把浮生看淡,那个对的人还会不会在我们身边,还我们一个岁月静好,现世安稳。
  • 福妻驾到

    福妻驾到

    现代饭店彪悍老板娘魂穿古代。不分是非的极品婆婆?三年未归生死不明的丈夫?心狠手辣的阴毒亲戚?贪婪而好色的地主老财?吃上顿没下顿的贫困宭境?不怕不怕,神仙相助,一技在手,天下我有!且看现代张悦娘,如何身带福气玩转古代,开面馆、收小弟、左纳财富,右傍美男,共绘幸福生活大好蓝图!!!!快本新书《天媒地聘》已经上架开始销售,只要3.99元即可将整本书抱回家,你还等什么哪,赶紧点击下面的直通车,享受乐乐精心为您准备的美食盛宴吧!)
  • 综漫里的大反派

    综漫里的大反派

    穿越不是你想穿,想穿就能穿。在正式穿越之后白川终于是领会到了这句话的含义,可是为时已晚,等他明白的时候自己已经是大反派了。既然这样,那么只能和妹纸们嘿嘿嘿来抚慰自己受伤的心了。