回想一下,大数据分析是指大量信息的积累和分析。一个调研和咨询公司说,一个有着总共500万兆字节的商务活动数据的组织是一个有大数据的组织。百万兆字节是指100万个字节,所以一个有着500万商务活动数据的公司就是大数据公司。大数据能司提供:
更深度的洞察。大数据调研人员洞察一切个体、一切产品、一切部分、一切事件、一切交易,而不是只看到市场细分、类别、集合或其他层级划分信息。更广阔的视野。为了了解复杂的、演变的、相关的情况从而提供更精确的洞察,大数据分析考虑到一切数据,体系的和非体系的。
举个有关更深更广的洞察的例子,Cabie电视的供应商表示,95%的订购都能按时满足。这听起来很厉害,但当你知道该公司每天有3000个订单,也就是说每天有150个顾客要在家里白白浪费时间等待时,你就不这么觉得了。如果可以将遗漏的订单与呼叫中心、搜索中心和重复购买中心的数据,以及推特和脸谱网上的评论相联系,经理就能知道每年他们遭受了多少差评,还不包括重新安排时间和加快进展拜访所带来的额外的成本。
定义关系
对于科学家和市场调研人员来说,大数据分析代表了范式的转变。传统的科学方法包括得到问题信息、做假设,然后测试数据以决定接受或拒绝无效假设。假设驱动的调研,以由调研人员规定好的因素为基础,它限制了去探索思维所能想象的。数据驱动科学让我们先收集数据,再看看数据告诉了我们什么,这与传统科学截然相反。比起“为什么”,大数据更倾向于研究“是什么”。在很多环境下“为什么”得来不易,而知道“是什么”已经足够了。亚马逊公司用大数据分析销售数据从而发现有哪些是畅销书,推荐书单并不需要知道消费者为什么购买《战争与和平》或《白痴》。亚马逊公司或许并不关心为什么这两本书要合在一起推荐,但是它能这样呈现给消费者推荐他们购买,反之亦然。有时“是什么”背后的东西会浮现,这时或许就需要传统科学去回答“为什么”。例如,如果大数据告诉医疗保健方面的调研人员,走路多的人不容易肥胖,那么从逻辑上讲,下一个重要问题就是“为什么走路的人这么少”。如果我们给肥胖者一个App 使他能记录自己的身体活动会发生什么呢?这些问题都是传统科学要回答的了。