文章图片
文章图片
作者|Andrew Hong
译者:GaryMa 吴说区块链
本文已获得作者Andrew Hong授权吴说区块链翻译转载
本文假设你是一个刚接触web3的数据分析师 , 开始组建你的 web3 分析团队 , 或者刚刚对 web3 数据产生兴趣 。 无论采用哪种方式 , 你都应该已经大致熟悉了 APIs、数据库、转换和模型在 web2 中的工作方式 。
在这本新指南中 , 我将尽量简明扼要地阐述我的三个观点:
1、思考:为什么开放的数据渠道会改变数据发挥效用的方式
2、工具:web3 数据栈中的工具概述 , 以及如何利用它们
3、团队:web3 数据团队的基本考虑和技能
数据思考让我们先总结一下如何在 web2 中构建、查询和访问数据(即访问 Twitter 的 API) 。 我们有四个步骤来简化数据渠道:
1、触发 API 事件(发送了一些推文)
2、更新到数据库(连接到现有的用户模型/状态更改)
3、特定产品/分析用例的数据转换
4、模型训练和部署(用于管理你的 Twitter feed)
当数据是开源的时候 , 唯一需要的步骤是在转换完成之后 。 Kaggle(1000个数据科学/特征工程竞赛)和 hugs Face(26000 个顶级 NLP 模型)等社区使用一些公开的数据子集来帮助企业构建更好的模型 。 有一些特定领域的情况 , 比如在前面的三个步骤中开放数据的开放街道地图 , 但是它们仍然有写权限的限制 。
我想声明的是 , 我只是在这里谈论数据 , 我并不是说 web2 完全没有开源 。 像大多数其他的工程角色一样 , web2 数据有大量的开源工具来构建他们的管道(dbt apache TensorFlow) 。 我们仍然在 web3 中使用所有这些工具 。 总之 , 他们的工具是开放的 , 但他们的数据是封闭的 。
Web3 也将数据开源 , 这意味着不再只有数据科学家在开放环境下工作 , 分析工程师和数据工程师也在开放环境下工作!每个人都参与到一个更连续的工作流程中 , 而不是一个几乎是黑盒的数据循环 。
工作的形式已经从 web2 数据大坝到 web3 数据河流、三角洲和海洋 。 同样重要的是需要注意 , 生态系统中的所有产品都会同时受到这个循环的影响 。
让我们看一个 web3 分析师如何一起工作的例子 。 有几十家交易所使用不同的交易机制和费用 , 允许你将代币 A 交换为代币 B 。 如果这些是典型的交易所 , 如纳斯达克 , 每个交易所将报告自己的数据在 10k 或一些 API , 然后其他一些服务 , 比如 capIQ , 会把所有交换数据放在一起 , 然后收取费用 , 让你访问他们的 API 。 也许有时候 , 他们会举办一次创新竞赛 , 这样他们就可以在未来收取额外的数据/图表功能 。
在 web3 交易所中 , 我们有这样的数据流:
1、dex.trades 是 Dune 上的一个表格(由许多社区分析工程师随着时间的推移整理而成) , 所有的 DEX 交换数据都被聚合在一起 , 所以你可以很容易地在所有交易所中搜索单个代币的交易量 。
2、一名数据分析师通过社区开源查询创建了一个仪表盘 , 所以现在我们对整个 DEX 行业有了一个公开的概述 。 即使所有的查询看起来都是由一个人写的 , 你可以猜测这是在discord上经过大量的争论 , 才准确地将其拼凑在一起得 。
3、DAO 科学家查看仪表板 , 并开始在他们自己的查询中分割数据 , 查看特定的对 , 比如稳定币 。 他们会观察用户行为和商业模式 , 然后开始建立假设 。 由于科学家可以看到哪个 DEX 在交易量中占据了更大的份额 , 他们将提出一个新的模型 , 并提议改变治理参数 , 以便在链上进行投票和执行 。
- 华硕|天选姬联动A-SOUL秀出高能 华硕天选3游戏本、天选air发布
- 小米科技|120Hz曲面屏、4500mAh,超轻薄5G手机,雷军宣布降价300元
- 安卓|谷歌发布带有主题图标、改进隐私等功能的Android13DevPreview
- AMD|功耗、超频拼惊喜的时候到了 B2步进锐龙5000处理器开卖
- 无线耳机|小米获多项专利授权,涉及拍照、显示、无线耳机等领域
- 工信部消费品工业司|工信部:推动国家集中采购品种大规模、智能化生产线建设
- 华硕天选3游戏本、天选air正式发布 天选姬联动A-SOUL秀高能
- 国电|专精特新? | 国电高科郭中甲:建造生态、服务用户、重视人才
- 掌阅|2022蓝鲸视界 | 数字阅读三分天下,阅文、掌阅、中文在线战略差异几何?
- vivo|Vivo的2022造机方法论