

近日,云象区块链研究团队刘振广博士在国际顶级会议AAAI上发表题为《InteractiveRare-Category-of-Interest Mining from Large Datasets》的论文。该论文主要针对基于用户交互实现从大数据中挖掘探测用户感兴趣的稀有类进行研究。
近年来,区块链和多媒体等产生的大数据为提取大数据集中的有价值信息提供了巨大机遇。在对大数据进行分析的过程中,那些样本稀少的类别往往有着比主要类样本更高的价值,例如区块链网络中占比不足1%的攻击节点往往比占比99%的诚实节点更值得我们关注。当前,稀有类挖掘技术仍存在被大量无用信息淹没和计算速度慢的问题,主要表现为:(1)对挖掘到的分类没有考虑用户的兴趣,忽略了这些分类是否真正对用户有价值;(2)单次查询时间过长,无法完成与用户的实时交互。
为了解决大数据稀有类挖掘中的用户兴趣问题,本论文提出了基于用户兴趣的交互式稀有类挖掘方法,该方法分为稀有类检测和稀有类发掘两部分。稀有类检测将用户的单次查询分为在线和离线部分,通过全局的参数设置,采用了分级曲线和k近邻关系的方法,使用户在单次查询过程中只检索小范围的信息,将稀有类检测运算的时间复杂度从平方级降低到了对数级。稀有类发掘过程同时针对稀有类的紧邻性假设和用户兴趣协调重构,通过目标点的正样本和负样本的信息对其进行评分,并通过用户交互过程给出的标签,确认它的类别。论文中的方法框架如图所示。

论文改进了稀有类检测和稀有类发掘方法,解决了传统稀有类挖掘中无法针对用户兴趣进行交互的问题,通过全局参数选择减少了现有方法参数选择的随机性强、计算量大的问题,同时利用正负样本确认样本类型解决了传统稀有类发掘下对标签依赖严重的问题,并保障了得到的稀有类符合用户兴趣。论文中的方法可应用于区块链大数据中的攻击节点发现、异常数据监测等问题,具有良好的可扩展性与科研价值。
AAAI (The AAAI Conference on Artificial Intelligence) 是人工智能领域的顶级国际学术会议,每年举办一次,AAAI-2019大会投稿录取率仅为16.2%。在短短一个多月时间,从国际顶尖学术期刊《Neurocomputing》到国际会议IEEE CCIS再到国际顶级会议AAAI,从加密支付到数字版权再到“区块链+AI”领域,云象区块链研究团队已发表6篇以上重要学术论文。云象区块链一直致力于区块链技术研究与应用落地,多项研究成果被国际顶级会议与期刊认可,从学术价值层面对云象区块链的技术实力做出了充分肯定。目前,无论是应用领域还是科研水平,云象区块链已经走在了国际前沿。
添加新手交流群:币种分析、每日早晚盘分析
添加助理微信,一对一亲自指导:YoYo8abc