博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
从大数据谎言中区分实际需求
阅读量:5997 次
发布时间:2019-06-20

本文共 991 字,大约阅读时间需要 3 分钟。

Gartner的Symposium/ITxpo会议上谈到,当大数据变得常见就会正常化,而作为IT专业人士在2020年大数据或变得正常化。

Gartner:从大数据谎言中区分实际需求

企业首席信息官们可以通过从大数据谎言中区分出实际需求的事实,来帮助他们的企业一步步走向正常。Gartner分析师Mark Beyer提出八个大数据“神话”:

1.100TB以上属于大数据

就大数据而言,是对数据的处理,而非数据的大小,企业不要再去寻觅大数据标准尺寸,因为大数据并没有标准尺寸。

2.大数据需更换基础设施

如果企业因为有新的需求就决定改变整个基础架构,分析师Mark Beyer表示企业是把之前所有的东西都当做赌注。对于CIO而言,IT基础设施成熟度牺牲的风险是否值得。

数据类型(图片来源csuiteinsider.com)

3.80%数据是非结构化

从数据上看,结构化和非结构化被经常引用大数据统计,但根据Beyer所谈最大的信息资产是机器数据,其并未相互关联说它们非结构化是绝对的谎言,而机器数据是结构化的数据,通常也是重复的信息。

4.工具将取代数据科学家

对于数据科学家,工具是一种工程,是对已经发现的事实的重复利用。而科学是去发现新的事实,所以工具不会取代数据科学家,至少在工具可以自行复制和发展之前不会。

5.海量数据解决质量问题

Gartner分析师Mark Beyer认为:“数据质量越低,答案质量就越低”。企业CIO们应该关注数据质量,通过手机收集的气质地理定位数据为例,有些人把手机等同于真实的个人,但对于数据质量来说有可以被不小心留在办公室,或者GPS功能可以在任何时间点被关闭。

Gartner:从大数据谎言中区分实际需求

图片来源update.com

6.实时只是速度更快而已

实时操作,并不意味着加快了当前数据的处理和分析过程,而是确保数据收集和决策之间的间隔越短越好。此外,大多数企业数据是不需要实时操作的。

7.数据量优于专业知识

对于大数据来说,那些认为可以简单地不再管业务流程的人,通常一位好的数据科学家并不能完全提供企业需求,如果没有业务流程管理,数据科学家将不能提供商业价值,需要企业有效的区分业务管理和大数据应用进而产生商业价值。

8.数据模型没有用

Gartner分析师Mark Beyer谈到,数据模型没有用这一论断很绝对。任何数字资产里的东西都有其数字模型,企业不应该因为大数据就舍弃模型。

本文作者:王迪

来源:51CTO

转载地址:http://dlhlx.baihongyu.com/

你可能感兴趣的文章
正则,String中用法,Pattern Matcher
查看>>
VS2015使用scanf报错解决方案
查看>>
保留最新N份备份目录脚本
查看>>
部署Zipkin分布式性能追踪日志系统的操作记录
查看>>
NTSC与PAL制式的转换
查看>>
Android通用流行框架大全
查看>>
一台电脑多个文件夹安装多个Redis服务
查看>>
删除有序链表中的重复结点
查看>>
【加密】对称加密算法
查看>>
DedeCms文档关键词替换,优先替换长尾关键词
查看>>
银行各交易渠道的清算方式
查看>>
Linux字符设备驱动结构(一)--cdev结构体、设备号相关知识机械【转】
查看>>
HttpURLConnection如何添加请求头?
查看>>
Intellij IDEA 一些不为人知的技巧
查看>>
spring @condition 注解
查看>>
TreeMap、HashMap、ConcurrentSkipListMap之性能比较
查看>>
apache 虚拟主机详细配置:http.conf配置详解
查看>>
微软GitHub组织
查看>>
Python爬虫学习——光学字符识别
查看>>
Shell中反引号(`)与$()用法的区别
查看>>