数据Mo 问题关于大数据个难以忽视的真相

在谷歌中输入“大数据”一词,你确实会得到很大的结果。其中将近十亿。 据我粗略估计,这些结果中约有三分之一将是声称要用大数据改变世界的初创公司。另外三分之一是风投,包括  引用了他们最新的大数据投资。其余的是财富 500 强的高管,他们解释了大数据如何成为他们 2013 年的头等大事。 简而言之,每个人都需要数据,而且数据越大越好。作为OpenView Labs 研究和分析团队的成员,我的工作是将数据(无论大小)转化为我们投资组合公司的见解。大数据运动的流行语及其在企业高管中普遍激发敬畏的能力无疑有助于提高人们对我们服务的兴趣。但它也产生了对大数据的深刻误解,其中最主要的是数据越多越好。这种心态实际上会阻碍公司而不是启发它们。 被这种行为所包围,我觉得发出关于大数据的局限性和危险性的警告是我的公民义务。 在解雇所有中层管理人员 并用 Hadoop 取而代之之前,请考虑以下七个不便的事实: 1)数据≠知识。数据 x 分析 = 知识 如果一位经验丰富的分析师拥有合适的工具和足够的时间,大数据集可以成为洞察力的宝库。但数据本身只是数字,数字无法经营一家公司。这是我之前在一篇关于大分析的博客中提到的主题,但我没有提到的是,反之亦然:无论你的数据科学家拥有多少高级学位和花 Argentina电子邮件列表 哨的工具,他她都不能在没有正确数据的情况下给你一点洞察力。要使项目成功,这两种输入都必须到位。 2)数据与分析争夺宝贵资源 无论您选择如何组装、存储和清理数据,大型数据集都是昂贵且耗时的。鉴于预算有限(预算不受限制),构建大数据将从对同一数据集的分析中吸取资源。由于数据 x 分析 = 知识,为一种输入留出的资源太少会削弱您做出数据驱动决策的能力。 数据似乎总是很 […]