交易|方法论、工具与团队：如何成为一名 Web3 数据分析师？客户端

文章图片

文章图片

作者|Andrew Hong
译者：GaryMa 吴说区块链
本文已获得作者Andrew Hong授权吴说区块链翻译转载

本文假设你是一个刚接触web3的数据分析师，开始组建你的 web3 分析团队，或者刚刚对 web3 数据产生兴趣。无论采用哪种方式，你都应该已经大致熟悉了 APIs、数据库、转换和模型在 web2 中的工作方式。
在这本新指南中，我将尽量简明扼要地阐述我的三个观点:
1、思考：为什么开放的数据渠道会改变数据发挥效用的方式
2、工具：web3 数据栈中的工具概述，以及如何利用它们
3、团队：web3 数据团队的基本考虑和技能
数据思考让我们先总结一下如何在 web2 中构建、查询和访问数据（即访问 Twitter 的 API）。我们有四个步骤来简化数据渠道:
1、触发 API 事件（发送了一些推文）
2、更新到数据库（连接到现有的用户模型/状态更改）
3、特定产品/分析用例的数据转换
4、模型训练和部署（用于管理你的 Twitter feed）
当数据是开源的时候，唯一需要的步骤是在转换完成之后。 Kaggle（1000个数据科学/特征工程竞赛）和 hugs Face（26000 个顶级 NLP 模型）等社区使用一些公开的数据子集来帮助企业构建更好的模型。有一些特定领域的情况，比如在前面的三个步骤中开放数据的开放街道地图，但是它们仍然有写权限的限制。
我想声明的是，我只是在这里谈论数据，我并不是说 web2 完全没有开源。像大多数其他的工程角色一样， web2 数据有大量的开源工具来构建他们的管道（dbt apache TensorFlow）。我们仍然在 web3 中使用所有这些工具。总之，他们的工具是开放的，但他们的数据是封闭的。
Web3 也将数据开源，这意味着不再只有数据科学家在开放环境下工作，分析工程师和数据工程师也在开放环境下工作！每个人都参与到一个更连续的工作流程中，而不是一个几乎是黑盒的数据循环。

工作的形式已经从 web2 数据大坝到 web3 数据河流、三角洲和海洋。同样重要的是需要注意，生态系统中的所有产品都会同时受到这个循环的影响。
让我们看一个 web3 分析师如何一起工作的例子。有几十家交易所使用不同的交易机制和费用，允许你将代币 A 交换为代币 B 。如果这些是典型的交易所，如纳斯达克，每个交易所将报告自己的数据在 10k 或一些 API ，然后其他一些服务，比如 capIQ ，会把所有交换数据放在一起，然后收取费用，让你访问他们的 API 。也许有时候，他们会举办一次创新竞赛，这样他们就可以在未来收取额外的数据/图表功能。
在 web3 交易所中，我们有这样的数据流：
1、dex.trades 是 Dune 上的一个表格（由许多社区分析工程师随着时间的推移整理而成），所有的 DEX 交换数据都被聚合在一起，所以你可以很容易地在所有交易所中搜索单个代币的交易量。
2、一名数据分析师通过社区开源查询创建了一个仪表盘，所以现在我们对整个 DEX 行业有了一个公开的概述。即使所有的查询看起来都是由一个人写的，你可以猜测这是在discord上经过大量的争论，才准确地将其拼凑在一起得。
3、DAO 科学家查看仪表板，并开始在他们自己的查询中分割数据，查看特定的对，比如稳定币。他们会观察用户行为和商业模式，然后开始建立假设。由于科学家可以看到哪个 DEX 在交易量中占据了更大的份额，他们将提出一个新的模型，并提议改变治理参数，以便在链上进行投票和执行。