大数据时代图书电商的机遇与挑战
2013-11-26 14:49:53.0 来源:中国新闻出版网 责编:陈莎莎
- 摘要:
- 随着移动互联网、物联网、云计算等新兴技术的发展,社交媒体、智能终端和视频监控等媒介设施迅速普及,全球数据量呈爆炸性增长。据国际数据公司(IDC)统计,仅2011年全球被创建和复制的数据量即达1.8ZB,相当于有史以来所有印刷材料数据量的近万倍,而这样庞大的数据量每两年将翻一番。
【CPP114】讯:随着移动互联网、物联网、云计算等新兴技术的发展,社交媒体、智能终端和视频监控等媒介设施迅速普及,全球数据量呈爆炸性增长。据国际数据公司(IDC)统计,仅2011年全球被创建和复制的数据量即达1.8ZB,相当于有史以来所有印刷材料数据量的近万倍,而这样庞大的数据量每两年将翻一番。海量数据蕴涵着高昂价值,运用新兴技术整合数据已成为惠普、IBM、微软、阿里巴巴等国际巨头战略转型的重要规划之一。著名咨询公司麦肯锡2011年发布名为《大数据:下一个创新、竞争和生产率的前沿》的研究报告,认为数据已经渗透到了每个行业和业务职能领域,逐渐成为重要的生产要素,对海量数据的运用,预示着新一波生产率增长和消费者盈余浪潮形成。2012年3月,美国政府发布了“大数据研究与开发计划”,将之列为继“信息高速公路计划”之后的又一重大科技发展部署。种种现象表明,大数据时代已经来临。
大数据时代,任何产业和企业组织都面临着新一轮的机遇和挑战。由于大数据与互联网及网民的天然接近性,IT业和营销行业首当其冲。在出版领域,图书电商是以IT身份而从事营销业务的典型代表,如何直面挑战、乘机求进,不仅事关其自身发展,也与整个出版业未来发展方向息息相关。
大数据的定义、特征与内涵
根据麦肯锡的定义,“大数据”是指无法在一定时间内用传统数据库软件工具对其内容进行抓取、管理和处理的数据集合。之所以“无法”抓取、管理和处理,缘于大数据的四个基本特征。其一,数据量巨大。数据量级已经从GB(千兆字节)和TB(万亿字节)发展到了PB(千万亿字节)、EB(百亿亿字节)乃至ZB(十万亿亿字节)计量的地步。科学家估算,如果将2013年全球存储的数据刻录在只读光盘上,可以堆成五堆,每一堆都伸向月球。其二,数据类型多样。除少量由传统数据库累积的结构化数据之外,还包括各类互联网、物联网应用所产生的文字、图片、视频、图像与地理位置信息等半结构化和非结构化数据,后者占比达75%以上。[1]其三,实时快速。数据快速产生、增长和流转,例如即时通讯工具中产生的数据流,要求实时存储和处理,如果事后追溯则价值流失。其四,价值高但密度低。大数据包含着大量冗余信息,必须披沙拣金才能有所获益。例如,社交网站中多数日常交流信息价值稀薄,但联合国的“全球脉动计划”在巨量日常信息的基础上,使用自然语言解密软件对网民进行“情绪分析”,可以预测失业率、疾病爆发等现象,有益于经济和社会发展。
原本“无法”抓取、管理和处理的数据集合,如今得以愈来愈多地运用,这是大数据时代的意义所在。因而,“大数据”的内涵,不仅止于“庞大的数据集合”,而且包含对数据的存储、处理、分享、挖掘、分析等技术与能力。大数据技术中,社交网站、物联网的应用,使用户的行为轨迹、情绪变化以至万事万物的所处状态都可以数据化;以Hadoop(能够对大数据进行分布式处理的软件框架)为代表的非关系型数据库系统使不同行业、不同类型数据之间的联系、交换和利用更加便捷;云计算等分布式运算架构技术使快速、低成本分析巨量数据成为可能。大数据内涵的核心,事实上在于如何应用大数据。这正如《驾驭大数据》的作者BillFranks(比尔·弗兰克斯)所说:“重要的不是数据,而是如何使用数据;大数据的核心是发现价值。”
大数据时代,任何产业和企业组织都面临着新一轮的机遇和挑战。由于大数据与互联网及网民的天然接近性,IT业和营销行业首当其冲。在出版领域,图书电商是以IT身份而从事营销业务的典型代表,如何直面挑战、乘机求进,不仅事关其自身发展,也与整个出版业未来发展方向息息相关。
大数据的定义、特征与内涵
根据麦肯锡的定义,“大数据”是指无法在一定时间内用传统数据库软件工具对其内容进行抓取、管理和处理的数据集合。之所以“无法”抓取、管理和处理,缘于大数据的四个基本特征。其一,数据量巨大。数据量级已经从GB(千兆字节)和TB(万亿字节)发展到了PB(千万亿字节)、EB(百亿亿字节)乃至ZB(十万亿亿字节)计量的地步。科学家估算,如果将2013年全球存储的数据刻录在只读光盘上,可以堆成五堆,每一堆都伸向月球。其二,数据类型多样。除少量由传统数据库累积的结构化数据之外,还包括各类互联网、物联网应用所产生的文字、图片、视频、图像与地理位置信息等半结构化和非结构化数据,后者占比达75%以上。[1]其三,实时快速。数据快速产生、增长和流转,例如即时通讯工具中产生的数据流,要求实时存储和处理,如果事后追溯则价值流失。其四,价值高但密度低。大数据包含着大量冗余信息,必须披沙拣金才能有所获益。例如,社交网站中多数日常交流信息价值稀薄,但联合国的“全球脉动计划”在巨量日常信息的基础上,使用自然语言解密软件对网民进行“情绪分析”,可以预测失业率、疾病爆发等现象,有益于经济和社会发展。
原本“无法”抓取、管理和处理的数据集合,如今得以愈来愈多地运用,这是大数据时代的意义所在。因而,“大数据”的内涵,不仅止于“庞大的数据集合”,而且包含对数据的存储、处理、分享、挖掘、分析等技术与能力。大数据技术中,社交网站、物联网的应用,使用户的行为轨迹、情绪变化以至万事万物的所处状态都可以数据化;以Hadoop(能够对大数据进行分布式处理的软件框架)为代表的非关系型数据库系统使不同行业、不同类型数据之间的联系、交换和利用更加便捷;云计算等分布式运算架构技术使快速、低成本分析巨量数据成为可能。大数据内涵的核心,事实上在于如何应用大数据。这正如《驾驭大数据》的作者BillFranks(比尔·弗兰克斯)所说:“重要的不是数据,而是如何使用数据;大数据的核心是发现价值。”
- 相关新闻:
- ·爱达森制版:电商思维再升级 新装备力促新格局 2013-11-21 14:12:32.0
- ·电商火爆给包装印刷带来巨大商机 2013-11-21 11:03:47.0
- ·电商虚假打折涉嫌违法经营 2013-11-17 00:19:25.0
- ·电商未能全面替代零售商业 三季度商铺空置率下降 2013-11-17 00:17:01.0
- 关于我们|联系方式|诚聘英才|帮助中心|意见反馈|版权声明|媒体秀|渠道代理
- 沪ICP备18018458号-3法律支持:上海市富兰德林律师事务所
- Copyright © 2019上海印搜文化传媒股份有限公司 电话:18816622098