网易|好程序员分享:浅谈大数据时代的大数据技术与应用( 二 )


(1)、与用户的交互性强 。 用户不再是信息传播中的受者 , 还可以方便地以交互的方式管理和开发数据 。
(2)、数据显示的多维性 。 在可视化的分析下 , 数据将每一维的值分类、排序、组合和显示 , 这样就可以看到表示对象或事件的数据的多个属性或变量 。
(3)、最直观的可视性特点 。 数据可以用图像、曲线、二维图形、三维体和动画来显示并可对其模式和相互关系进行可视化分析 。

3、数据挖掘算法
数据挖掘是指数据库中的知识发现 , 其历史可以追溯到1989年美国底特律市召开的第一届KDD国际学术会议上 , 而第一届知识发现和数据挖掘(Data Mining , DM)国际学术会议是1995年加拿大召开的 , 会议上将数据库里存放的数据生动地比拟成矿床 , 从而“数据挖掘”这个名词很快就流传开来 。 数据挖掘的目的是在杂乱无章的数据库中 , 从大量数据中找到有用的、合适的数据 , 并将其隐含的、不为人知的潜在价值的信息揭示出来的过程 。 事实上 , 数据挖掘只是整个KDD过程中的一个步骤 。
数据挖掘的定义没有统一的说法 , 其中“数据挖掘是一个从不完整的、不明确的、大量的并且包含噪声的具有很大随机性的实际应用数据中 , 提取出隐含其中、事先未被人们获知、却潜在有用的知识或模式的过程”是被广泛接受的定义 。
事实上 , SEO马龙觉得该定义中所包含的信息——大量真实的数据源包含着噪声;满足用户的需求的新知识;被理解接受的而且有效运用的知识;挖掘出的知识并不要求适用于所有领域 , 可以仅支持某个特定的应用发现问题 。
以上这些特点都表现了它对数据处理的作用 , 在有效处理海量且无序的数据时 , 还能够发现隐藏在这些数据中的有用的知识 , 最终为决策服务 。 从技术这个角度来说 , 数据挖掘就是利用一系列相关算法和技术从大量的数据中提取出为人们所需要的信息和知识 , 隐藏在数据背后的知识 , 可以以概念、模式、规律和规则等形式呈现出来 。
4、大数据技术的预测性分析
预测性分析可以让分析员根据可视化分析和数据挖掘的结果做出一些预测性的判断 。 大数据分析最终要实现的应用领域之一就是预测性分析 , 可视化分析和数据挖掘都是前期铺垫工作 , 只要在大数据中挖掘出信息的特点与联系 , 就可以建立科学的数据模型 , 通过模型带入新的数据 , 从而预测未来的数据 。 作为数据挖掘的一个子集 , 内存计算效率驱动预测分析 , 带来实时分析和洞察力 , 使实时事务数据流得到更快速的处理 。 实时事务的数据处理模式能够加强企业对信息的监控 , 也便于企业的业务管理和信息更新流通 。
此外 , 大数据的预测分析能力 , 能够帮助企业分析未来的数据信息 , 有效规避风险 。 在通过大数据的预测性分析之后 , 无论是个人还是企业 , 都可以比之前更好地理解和管理大数据 。 对此大家可以通过SEO马龙博客的《解读2013年大数据应用与趋势的调研》相关介绍来具体了解 。
尽管当前大数据的发展趋势良好 , 但网络大数据对于存储系统、传输系统和计算系统都提出了很多苛刻的要求 , 现有的数据中心技术很难满足网络大数据的需求 。 因此 , 科学技术的进步与发展对大数据的支持起着重要的作用 , 大数据的革命需要考虑对IT行业进行革命性的重构 。 网络大数据平台(包括计算平台、传输平台、存储平台等)是网络大数据技术链条中的瓶颈 , 特别是网络大数据的高速传输 , 需要革命性的新技术 。
此外 , 既然在大数据时代 , 任何数据都是有价值的 , 那么这些有价值的数据就成为了卖点 , 导致争夺和侵害的发生 。 事实上 , 只要有数据 , 就必然存在安全与隐私的问题 。 随着大数据时代的到来 , 网络数据的增多 , 使得个人数据面临着重大的风险和威胁 , 因此 , 网络需要制定更多合理的规定以保证网络环境的安全 。