人工智能的兴起是因为有大数据的基础,那么区块链如果配上大数据,它的力量几乎是无限的。

金融服务行业的业务进入区块链是非常迫切的。想象一下这个量级的区块链,巨大的数据湖区块含有每个金融交易的全部历史,全部可用于分析。区块链提供了分类账的完整性,但不用于分析。那是大数据和相关分析工具发挥作用的地方。

区块链是大数据分析的机遇

我们再来看看区块链和大数据的关系。人工智能的兴起是因为有大数据的基础,那么区块链如果配上大数据,它的力量也几乎是无限的。

有篇文章这么提到:“按理说,最近这几年来,信息科技中最重要的发展是区块链,它有潜力去改变这个世界接近大数据的方式,它有着增强的安全性和数据质量,仅凭着这两个优势就可以支持企业使用中本聪(Satoshi Nakamoto)这具有里程碑意义的技术。”

在比特币的背景下讨论区块链时,跟大数据的联系似乎微不足道。但是如果不是比特币,区块链是其他金融交易的分类账呢?或者是业务合同?又或者是证券交易?

金融服务行业正在审视区块链技术。UBS 的 CIO,Oliver Bussmann 说,“区块链技术可以把交易处理时间从按天计算缩短到按分钟计算。“
金融服务行业的业务进入区块链是非常迫切的。想象一下这个量级的区块链。巨大的数据湖区块含有每个金融交易的全部历史,全部可用于分析。区块链提供了分类账的完整性,但不用于分析。那是大数据和相关分析工具发挥作用的地方。

区块链是大数据分析的机遇

最近,由 47 家日本银行组成的财团与一家名为 Ripple 的区块链初创公司签约,以促进利用区块链在银行账户之间进行资金转账。 这么做的主要原因是要以极低的成本进行实时转账。 传统实时转账昂贵的原因之一是因为有潜在的风险因素。 双重支出(这是两次使用相同安全令牌的交易失败形式)是实时转账的一个实际问题。 有了区块链,就可以大大避免这个风险。 大数据分析让识别消费者支出模式,并以比目前可以做到的更快的速度识别有风险的交易成为可能。 这降低了实时交易的成本。

在银行以外的行业,采用区块链技术的主要驱动力也一直是安全性。 在整个医疗保健、零售和公共管理领域,企业已开始试验区块链来处理数据,用来防止黑客入侵和数据泄露。 在医疗保健方面,像区块链这样的技术可以确保在各个级别的数据访问中寻求多个“签名”。 这有助于防止再次发生诸如 2015 年的攻击事件而导致超过 1 亿份病历失窃的事件。

区块链促进了实时分析的可能性

到目前为止,实时欺诈检测还只是一个梦想,银行机构一直依靠技术来追溯识别欺诈交易。 由于区块链拥有每笔交易的数据库记录,因此如果需要,它为机构提供了模式实时挖掘的方式。但是,所有这些可能性也引发了隐私问题。 首先,这与区块链和比特币受欢迎的原因直接相反。 一些行业专家表示担心,一项能够提供每项交易记录的技术可能被居心不良的人利用,做不好的事情。

然而,从另一个角度来看,区块链大大提高了数据分析的透明度。 与以前的算法不同,区块链的设计拒绝任何它无法验证并且被认为可疑的输入。 因此,像零售这样的行业,分析师只处理完全透明的数据。 换句话说,区块链系统识别的客户行为模式完全可能比现在更加准确。

区块链有助于揭示社交数据

Freshminds 的 Rick Burgess 的看法是:“使用社交数据来预测消费者行为并不是什么新鲜事,许多交易者一直在寻求将社交指标纳入他们的交易算法。 但是,由于定价大多数金融工具涉及的因素太多,因此非常难以预测市场会如何变化。”

幸运的是,比特币和社交媒体用户趋于一致,如果把它们都用于数据分析可能是有好处的,因为他进一步解释说:

  • 比特币用户往往和社交媒体用户是同一人群,因此他们对比特币的态度、观点和情绪都有详细记录。
  • 比特币和其他加密货币的价值几乎完全由市场需求决定,因为市场上的各种币的数量是可预测的,并且不受任何实物商品的约束。
  • 主要是个人而不是大型机构在交易比特币。
  • 影响比特币价值的事件首先并主要在社交媒体上传播。

数据分析师现在正在挖掘社交数据,以洞察主要加密货币的趋势。 这反过来有助于组织揭示强大的人口统计信息,并将比特币的表现与世界事件联系在一起。

区块链有助于揭示数据货币化的新形式

根据戴尔 EMC 服务首席技术官 Bill Schmarzo 的说法,区块链技术也“有可能通过从促进交易过程中消除中间商来民主化数据和分析的共享和货币化。”在商业界,这给了消费者更强大的与公司谈判的能力。 它允许消费者通过区块链控制谁有权访问他们的数据。 然后,他们可以要求公司给予价格折扣来换取他们在公司产品或服务上的个人消费数据。

Schmarzo 还解释了区块链如何可能形成数据货币化的新形式,因为它有以下大数据的衍生产物:

  • 参与交易的所有各方都可以访问相同的数据。 这加快了数据采集、共享、数据和数据分析的质量。
  • 所有交易的详细记录保存在单个“文件”或区块链中。 这提供了从开始到结束的交易完整概览,消除了对多个系统的需求。
  • 个人可以管理和控制他们的个人数据,无需第三方中介或集中存储库。

最终,区块链可以通过创建公司和个人之间可以直接分享、买卖和提供他们的数据和分析洞察的新市场而成为数据货币化的关键推动力。

在大规模采用比特币的带动下,区块链技术在整个商业和金融领域获得了应用。 它促进快速和安全的交易可能会彻底改变传统的数据系统。 根据毕马威和 Forrester Consulting 的调查显示,三分之一的决策者信任他们公司的数据。 但通过区块链技术,这种信任会大大加强,实时应用程序将变得更加普遍。

BigQuery 分析

https://console.cloud.google.com/bigquery?project=dgp4-v1

什么是BigQuery

BigQuery是Google Cloud Platform提供的大数据分析服务。这是一个非常方便的服务,可以在几十秒内返回数据,即使它是几兆兆字节的数据,如果你将数据放入Excel,MySQL等通常会停止计算机。使用BigQuery,以太坊区块链数据存储在公共数据中心化,并且以太坊数据可以在短时间内聚合,就像它是普通数据库一样。

image.png

image.png

使用流程

添加数据集

点击添加数据按钮

进入 BigQuery 服务后,按“添加数据”,然后按”公共数据集“。因此,如果使用以太坊搜索,将出现以太坊数据集。如果你在先前数据下方的搜索窗口中输入“ethereum”,Crypto_ethereum 下显示七个表:块、合约、日志、token_transfers、令牌、跟踪和事务。分析销售所需的只是交易数据。
Token_transfers 数据还用于检查当前令牌所有者和历史记录。
在加密货币 pells 的销售分析中,从token_transfers 检查发送卡的钱包地址,并且从交易中汇总钱包地址的存款金额。
image.png

进入数据集页面选择相应公开数据

image.png

image.png

编写查询

查询可以使用 SQL 的 Select 部分。
基本上,它写如下。
选择列名称
从表名
条件
按列名分组
按列名排序

选择列名称

指定要使用的数据库的表名
如果你使用上面上架的表名,指定为“bigquery-public-data.crypto_ethereum”。如果要聚合事务日志,请写入“bigquery-public-data.crypto_ethereum.transactions”。

条件(可省略)

陈述条件,你可以使用或连接条件。
你可以在多少天后指定数据,合约地址的数据。
通过尽可能精细地指定它,减少了执行 BigQquery 时要处理的数据量,并降低了每个操作的价格。

例如,在以下示例中,to_address是“0xb1690c08e213a35ed9bab7b318de14420fb57d8c”,block_timestamp是8月1日之后,receipt_status是1。
其中to_address =“0xb1690c08e213a35ed9bab7b318de14420fb57d8c”和block_timestamp> =“2019-08-01”和receipt_status = 1

按列名分组(可选)

在单独检查区块链游戏的销售时,分组是很重要的。
如果你未指定此项,则智能获取过于详细或收集的数据,例如整个游戏的指定时间段内的所有交易列表以及总销售额。

为了按日期、月份、钱包等进行检查,有必要在总结每个之后通过选择来指定如何进行总结。
如果要被日期汇总,请写“分组日期列”,并指定“选择日期列,总和(对应于交易量的列),技术(*)”以指定总交易量和交易你可以得到一个号码。

按列名向上和向下排序(可省略)

在日期顺序的情况下,它不是那么相关,因为它排在第一位,但是你想获得每个钱包的交易量并检查最大的交易量时,你需要重新排序它。
如果是该列是“按交易总额排序,desc”、则按顺序显示交易量最大的钱包。

型号句子

例句1:本月检查加密货币 Kitties 的游戏内容市场交易数量和交易量。

crypto kitty 市场的合约地址是 0xb1690c08e213a35ed9bab7b318de14420fb57d8c。
因为我们想要日期显示“group by block_date”
我希望在8月之后搜索成功的交易。
“和block_timestamp> =”2019-08-01“和receipt_status = 1”
由于输出是日期,交易数量和交易量,
“DATE(block_timestamp)as block_date,count(*),sum(value)/ pow(10,18)”
(以太坊交易量存储为10到18次幂。)

保存数据

如果要保存输出数据,可以将其保存为“保存结果”。
让我们输出 CSV 数据并进一步触摸它。
在其他情况下,有必要将数据保存为 BigQuery 表,将其导出到存储,然后下载。在这种情况下,需要注册信用卡。