薇娅|薇娅如果了解这些互联网知识也许就不会以身试法了

薇娅|薇娅如果了解这些互联网知识也许就不会以身试法了

薇娅事件沸沸扬扬 , 多方人士各抒己见 。 作为见证薇娅从红到黑的数字平台 , 我们互联网界怎能闭口不言呢 。 正所谓无知者无畏 , 薇娅之所以无视相关部门多次提醒而明知故犯、不思整改 , 很重要的一个原因就是她在不知大数据之强大的情况下 , 总认为自己在偷逃税款上做得很严密 , 是不会被查到的 。 所以 , 接下来我们就一起聊一聊薇娅偷逃税款事件背后一些有关大数据的互联网知识 。 我想 , 薇娅如果当初对此有所了解 , 也许就不会以身试法了吧 。
数字的脚印:蛛丝马迹尽在于此在很多人眼中 , 互联网是虚拟的 , 是看不见摸不着的 。 所以 , 有的人就认为在这里是燕过不留声、人过不留名的 , 认为在这里做的很多事情是神不知鬼不觉的 。 于是 , 一些偷逃税款者也在这儿打起了主意 。 真的是这样吗?大错特错!我想告诉大家的是 , 你访问互联网上的每一个网站 , 打开电脑上的每一个软件 , 运行手机上的每一个APP , 都会留下数字的脚印 。 其中 , 最典型的例子就是日志:日志默默地记录着你的每一个动作 , 也许在远程的服务器上 , 也许在你自己的电脑手机中 , 也许在同步传输的光纤里 。 可以说 , 从你开始登陆互联网的那一刻起 , 你的一言一行都有迹可循的 。 正是这些点滴痕迹 , 构成了我们大数据分析的原始资源 。 有了这些资源 , 就代表你想说和不想说都已经说了 。 而在这方面 , 相关部门不仅早已驶上数据分析的高速公路 , 而且还有完善的共享机制助力加持 。 你说 , 在这种情况下那些所谓的小聪明还有漏网的可能吗?
分布式存储:多少米就有多大锅大数据资源的价值不仅在于记录的精细 , 还在于记录的规模:规模越大 , 分析越准 , 挖掘越深 。 所以 , 大量的、零散的、持续增长的数据资源就给存储技术提出了更高挑战 。 看到这里 , 你可能会说:别整得那么夸张 , 换一块更大的硬盘不就解决了吗!对此 , 我只能说这种想法太简单了!要知道 , 现在稍有些规模的数据量就已经达到了TB级别 , 一些行业巨头更是达到了PB、EB级别 , 未来还将继续向ZB、YB、DB、NB等级别迈进 , 这岂是一块硬盘能达到的量级 。 这时候 , 你可能又要说了:多加几块不就解决了!思路似乎没有问题 , 但一台计算机可以增加的硬盘也是有限的 。 所以 , 这时就引出了分布式存储的概念 , 也就是让多台计算机协调配合 , 共同完成存储工作 。 而对于上层应用来说 , 无论连接哪台计算机都可以访问整个集群的数据资源 。 同时 , 分布式存储的自由扩容缩容、数据负载均衡、双份或多份冗余备份等功能都真正满足了大数据中的各种需求!
分布式计算:比蚂蚁恐怖的军团存储的问题解决以后 , 我们就要考虑数据的分析和挖掘了 。 海量的数据分析需要超强的计算能力 。 而单台计算机的配置再高也是远远不够的 , 我们需要成百上千乃至更多的计算机分工配合、同时计算 , 也就是我们接下来要说的分布式计算 。 还记得科幻影片里那些人蚁大战的惊险场面吗:面对数以亿计的蚂蚁吞噬 , 任何貌似强大的人或动物都会瞬间只剩下一具尸体 。 这就是集群力量的经典案例 。 而分布式计算相比蚂蚁军团 , 更有过之而无不及 。 因为蚂蚁再多也还有个繁衍生殖的自然周期 , 而分布式计算的集群扩展比这要快得多!特别是在进入云计算时代的今天 , 你只需要输入一个数字、按下一个回车 , 你计算军团的规模想要多大就有多大 。 这个超级军团拥有业内顶尖专家的智慧结晶 , 将以超乎想象的速度和永不停歇的耐力不断分析、挖掘这些数据背后的东西 。 而且 , 数据还在不断增加 , 计算还在不断增强 , 智慧还在不断进化!你说 , 够恐怖吗?