如何利用机器学习识别加密项目风险?
本文将介绍一个分析文章并预测风险分数的语言模型,以及根据实体和来源信息汇总这些分数的方法。
作者 / LongHash Charlie Custer
泉源 / LongHash
随着比特币从一种小众的亚文化发展为一种全球性的金融征象,主流媒体渠道都在研究什么是加密钱币,他们事实该若何报道它。
效果并不总是美妙的,尤其是在两者最初交会的时刻。加密支持者经常埋怨媒体的私见。举个例子,在一个%202018%20年的%20reddit%20帖子中,发帖者主张称媒体对比特币有私见,帖子里的所有谈论都示意赞许。同年另有一个很长的讨论比特币的帖子,帖子里的大多数谈论者示意存在针对比特币的私见。
%20固然,要找到媒体对比特币的负面报道例子并不难。然则媒体真的对比特币存在私见吗?其报道是否与民众的兴趣脱节了?是否有一部门媒体看好?
%20为了找出真相,LongHash%20深入研究了主流媒体几年来的报道史。
%20 关于数据集%20我们使用的数据集包含了%202016%20年%201%20月至%202017%20年%204%20月时代%2026%20家差别的高知名度媒体公布的%20260%20万篇文章、新闻。这些媒体包罗%20CNN%20和%20CNBC%20等主要新闻网络,《纽约时报》和《华盛顿邮报》等主要报纸,以及杂志和%20Wired、TechCrunch、Gizmodo、Vice%20和%20Mashable%20等种种热门新闻网站。这次的数据集并不包罗主要报道加密手艺的媒体。
%20 媒体对比特币的报道力度有多大? %20在数据集笼罩的%20260%20多万篇文章中,有%203580%20篇在题目中提到了比特币。虽然这个比例看起来微不足道,但必须注重的是我们的数据集包含了涉及方方面面的文章。举个例子,与“美元”(%201368%20篇)和“以太坊”(%20282%20篇)相比,比特币的报道力度似乎已经相当不错了。
%20不出所料,我们的剖析发现,对比特币的报道力度与比特币的价钱走势有着慎密的关联。凭据皮尔逊相关性剖析,2017%20年,媒体报道力度随着币价的飙升一起升级。在数据集所笼罩的时间段内,天天的比特币报道数目与%20BTC%20价钱出现适度的相关性(0.39)。皮尔逊相关性得分局限为%201%20到%20-1%20,即从完全正相关到完全负相关。
%20不外若是我们把这些数据绘制成图表,我们可以看到,纵然在%202017%20年牛市之后,比特币的价钱一度猛烈颠簸,但媒体的报道力度却下降到了牛市前的水平。2019%20年年中的另一次价钱暴涨同样没能引发媒体的兴趣。
%20当我们将媒体报道趋势与同期“比特币”的谷歌趋势搜索数据举行比对时,我们发现它们的相关性异常慎密—0.88,异常强的正相关性。
但存在相关性并不一定能告诉我们什么因果关系。有可能媒体的炒作是谷歌搜索趋势的主要驱动力,也有可能是民众对比特币信息的需求推动了媒体的报道。不外当我们使用完全相同的日期将数据排开时,我们发现搜索兴趣往往会在主流媒体报道之前激增。
换句话说:主流媒体的报道似乎是随着民众对比特币故事的需求走的。
固然,并不是所有的媒体都以同样的方式报道比特币。我们剖析了每个媒体的所有文章,以确定其总报道中专门报道比特币的比例。
我们的发现并不稀奇令人惊讶。CNBC 是榜单上最专注于金融的媒体,其专门报道比特币的文章比例最高。紧随其后的是专注于科技的博客 Gizmodo ,Wired 和 TechCrunch 。CNN 和《纽约时报》等主流媒体则处于中央位置。TMZ 和 Refinery 29 等网站并没有花太多时间在比特币上,这是有原理的—它们的目的不是提供周全的金融报道。
固然,比特币什么时刻被报道,报道力度有多大,都只是故事的一部门。更主要的问题是,比特币是若何被报道的。媒体确实对比特币抱有私见吗?
为了找出谜底,我们通过两种差别的情绪剖析工具— VADER 和 TextBlob —对 3500 多篇比特币文章举行了剖析。虽然它们的运行方式略有差别,但主要都是通过拆解措词来剖析情绪。两者都以同样的方式输出效果:每篇文章的得分在 -1(完全负面)和 1(完全正面)之间。
例如,在 TextBlob 输入一句话:“今天棒极了,我爱它!” 效果是 0.71 分;“何等恐怖的一天,我憎恶它!” 获得的分数是 -1 。虽然这种机械评估远非完善,但它可以让我们领会书面文本的情绪,而不必单独阅读和评估成千上万的文章。
TextBlob 还会实验评估文章的主观性,在 0(完全客观)和 1(完全主观)之间举行打分。
当我们通过这两个工具来运行比特币相关的报道文本时,它们的评分完全差别,但都没有发现对比特币有负面私见的证据。
VADER 的剖析效果提供了一个普遍的分数局限—每个点代表一篇文章的分数—但最大的集群落在图的上半部门,靠近 1(异常努力)而不是 -1(异常消极)。
TextBlob 的情绪剖析天生的分数局限要窄得多,但总体趋势相同,情绪更倾向于正面而非负面。
TextBlob 还发现,大多数文章往往介于主观性和客观性之间,只管一定有一些异常主观的离群值(靠近图表顶部的少量粉色圆点)。
我们还查看了各媒体的情绪评分,以领会特定媒体是否存在看好或唱衰比特币的倾向。在这项剖析中,我们参考的是每个媒体揭晓的所有比特币文章的平均情绪得分,因此我们最终只采取了公布了至少 20 篇以比特币为中央的文章的媒体数据。
虽然 VADER 和 TextBlob 在详细细节上存在许多分歧,但我们依旧可以看到,在这两项评估中,所有媒体的平均得分都是正面的。
凭据这两个工具,TechCrunch、Vox 和《纽约时报》都属于最看好比特币的媒体。路透社和 Axios 在这两项剖析中的得分都靠近底部,但没有一家跌破零,因此至少凭据我们的剖析来看,给任何一家媒体贴上唱衰比特币的标签都是不公平的。
TextBlob 的主观性剖析也很值得一看,虽然分数同样相当靠近。正如人们所预料的那样,重视客观性的传统新闻机构得分较低—他们更客观。基于互联网的新媒体,如 Mashable、Vice、Vox 和 Gizmodo 则落在了更主观的一边。
在我们的剖析中,我们没有发现任何主流媒体对比特币有私见的证据。数据显示,媒体的报道力度会紧跟民众对比特币信息的需求。两种情绪剖析工具都没有发现任何定期报道比特币的媒体有任何针对比特币的证据。
固然,这些结论也存在一定的限制。数据笼罩的局限虽大,但仍然是有限的。它只席卷了 26 家媒体,参考的时间局限只有几年,但另有更多的媒体在写关于比特币的文章。基于机械的情绪剖析远非完善,而且另有其他自然语言处置工具,若是应用于这个相同的数据集,可能会发生与 TextBlob 和 VADER 差别的效果。
人类自己合理的批判头脑依旧是评估任何加密新闻文章的最好方式。但下次当你看到一篇文章指责主流媒体都唱衰比特币时,你大可不必为此劳神了。虽然一定有一些持负面看法的人,但总体看来,媒体其实是相当看好比特币的。
加入新手交流群:每天早盘分析、币种行情分析
添加助理微信,一对一专业指导:chengqing930520
上一篇:交易所搞事提前做空,守候2月行情。1/20行情剖析加入新手交流群:每天早盘分析、币种行情分析,添加助理微信
一对一专业指导:chengqing930520