锁定区块链生态圈最核心环节-2018区块链技术与应用论坛盛大开启

8月14日,由北京大学深圳研究生院、深圳众享互联科技有限公司以及YOCSEF深圳联合主办,深圳市内容中心网络与区块链重点实验室承办的“IEEE HotlCN 2018 区块链技术与应用论坛”在深圳麒麟山庄举行。 北京大学深圳研究生院副教授、深圳市内容中心网络与区块链重点实验室主任雷凯;北京众享比特科技有限公司CEO、国家科技专家库在库专家严挺;远望资本创始合伙人田鸿飞;复旦大学教授、中国计算机学会区块链专委会主任斯雪明;YeeCall CTO江周平;IBM高级技术专家赵振华等嘉宾出席了当天的论坛。 “区块链从比特币底层技术中延伸发展而来,区块链技术价值的长远体现,越来越需要从基础设施、底层构架方面进行探索,区块链与未来网络的结合必然越来越紧密。上层的应用、模式需要更好的底层构架提供支撑。”雷凯表示,未来区块链技术与应用带来的变革甚至有可能超越之前互联网给社会和经济的冲击。 从基础设施到系统运维,行业大咖全方位解读区块链 作为分布式账本计算技术,区块链的特点是去中心化、公开透明,每个人都可以参与数据库记录,能够有效地降低信任成本、提高社会运行效率。被誉为信任机器和价值互联网的区块链技术,由于其展示了以较低成本解决信任与价值的可靠传递的可能性,备受政府及企业各界的关注。基于此,近一两年来,区块链在技术、应用、生态、投资方面以及金融服务、征信管理、资源共享、物联网与供应链等相关场景中呈现百花齐放的局面,更是被全球技术行业成为未来发展的突破性力量。在此背景下,“IEEE HOTICN 2018 区块链技术与应用论坛”应运而生。 当天的主题演讲环节,不同专家从不同的角度展示了区块链的技术发展和应用。严挺从运维的角度讲述了区块链的系统运维与落地应用;斯雪明从信息系统的角度诠释了区块链的未来演进;田鸿飞从资本的角度回顾了区块链的数字资产化和资产数字化的发展历程,区块链在带来巨大爆发力的同时,可能会带来商业模式和盈利模式的转变;江周平则从生产关系变革的角度出发,认为作为不可篡改、不可摧毁的分布式数据库,区块链能够在不信任的基础上建立了信任机制,试图消灭信任中介;赵振华从用户的角度阐述了超级账本 fabric 的数据隐私保护问题。 主题演讲后的圆桌论坛环节,江周平、斯雪明、严挺、田鸿飞、赵振华、雷凯等嘉宾展望了未来一年区块链技术的发展和应用。“据不完全统计,去年有456家区块链企业,但是全年产值不到2亿,整体而言产业落地还存在很大的空间。基于区块链解决信任和透明问题的特质,我比较看好供应链金融和政务区块链领域,特别是区块链在政务中的应用,不仅能加速推动这个行业的发展,也能加强政府的透明度建设,提高政府的运行效率。”斯雪明认为,基于目前的态势,区块链企业应该脚踏实地地把应用做好,有自己独特的立意点和优势,不盲目跟风。 立足创新,深圳引领区块链生态圈 作为首个国家创新型城市,深圳依托强大的制造能力和技术优势,在区块链生态圈一直保持着强大的竞争力。此外,在政策层面,深圳市也出台了多项政策扶持区块链的发展。2016年11月,深圳市金融办发布《深圳市金融业发展”十三五“规划》,文件中提到,“支持金融机构加强对区块链、数字货币等新兴技术的研究探索”;2018年3月,深圳市经济贸易和信息化委员会发布文件《市经贸信息委关于组织实施深圳市战略性新兴产业新一代信息技术信息安全专项2018年第二批扶持计划的通知》,区块链属于扶持领域之一。 基于政策的大力支持,深圳的区块链发展一直处于全国前列。8月10日,深圳国贸旋转餐厅开出全国首张区块链电子发票,打通了申领、报销等全流程,代表着深圳的区块链技术应用进入了全新的阶段。 众所周知,区块链技术发展速度迅猛,应用向越来越多的场景延伸,但不可否认的是,区块链项目存在鱼目混珠的情况。论坛的项目展示环节,让与会观众对区块链应用有了更深刻、更生动的理解。 “IEEE HotlCN 2018 区块链技术与应用论坛”的成功举行,得到了广东省区块链与分布式物联网工程技术研究中心;中科院先进院众享物联网安全创新联合实验室;链得得财经(北京)信息科技有限公司;BCAChain商信链;腾讯医疗AI实验室;广州炒米信息科技有限公司等单位的大力支持。 另据了解,除了当天的论坛,第二届2018信息中心未来网络论坛还包括“2018未来网络技术与工程国际大会”和“第一届IEEE信息中心网络国际会议”等板块。8月15日,由近十位院士领衔的“2018未来网络技术与工程国际大会”,将就未来网络及区块链技术的架构、关键技术、学术研究、人才培养以及发展趋势与产业前景等议题进行充分的对话和交流。...
Read More

17级黄济乐同学中稿ICONIP 2018

第25届 International Conference on Neural Information Processing (ICONIP 2018) 将于2018年12月13日至16日在柬埔寨暹粒举行,此前的活动取得了成功。 吴哥窟位于柬埔寨北部的暹粒附近,是东南亚最重要的考古遗址之一,是世界上最大的宗教纪念碑,被联合国教科文组织列为文化遗产。 ICONIP 2018旨在为科学家,工程师和教育工作者提供一个高水平的国际论坛,展示相关领域的研究和应用的最新技术。 会议将以世界知名学者的全体演讲,广泛报道的常规会议以及专注于热门话题的特别会议为特色,被CCF推荐为大数据与人工智能类C类论文,会议链接 https://conference.cs.cityu.edu.hk/iconip/ 17级学生黄济乐延续15级司尚春的工作,在雷凯老师和沈颖老师的指导下论文被ICONIP 2018长文录用。 论文题目:Semantic Similarity Measures to Disambiguate Terms in Medical Text 论文作者:Kai Lei, Jiyue Huang, Shangchun Si and Ying Shen 文章链接:https://www.researchgate.net/publication/327733227_Semantic_Similarity_Measures_to_Disambiguate_Terms_in_Medical_Text 论文简介:在语义网域中准确地计算单词之间的语义相似性是一项重要但具有挑战性的任务。 然而,语义相似性度量涉及知识学习的全面性和高频和低频词语的高效训练。 在这项研究中,我们提出了一种方法MedSim用于语义相似性测量,以识别医学文本中的同义词术语,其有效性和准确性得到很好的平衡。应用 中文医学文本的实验结果表明,我们提出的方法在同义词识别方面具有与现有方法相比有强大的优势。...
Read More

17级覃孟同学分别中稿SIGCOMM’18 Workshop和Knowledge-Based Systems期刊

ACM SIGCOMM 2018 Workshop on Network Meets AI & ML (NetAIM 2018) ACM SIGCOMM 2018(https://conferences.sigcomm.org/sigcomm/2018/) (CCF A)将于2018年8月20日至25日在匈牙利布达佩斯举行,SIGCOMM是计算机网络通信领域的重要学术会议,且今年为NetAI Workshop(https://conferences.sigcomm.org/sigcomm/2018/workshop-netaim.html)在SIGCOMM会议举办的第一届,该workshop主要关注如何利用人工智能技术有效应对现有网络系统的面临的挑战。 17级同学覃孟,在实验室雷老师的指导下,完成一篇长文,并已被SIGCOMM 2018 NetAI Workshop录用,论文简介如下: 标题: Adaptive Multiple Non-negative Matrix Factorization for Temporal Link Prediction in Dynamic Networks 作者: Kai Lei, Meng Qin, Bo Bai*, Gong Zhang. 英文摘要: The prediction of mobility, topology and traffic is an effective technique to improve the performance of various network systems, which can be generally represented as the temporal link prediction problem. In this paper, we propose a novel adaptive multiple nonnegative matrix factorization (AM-NMF) method from the view of network embedding to cope with such problem. Under the framework of non-negative matrix factorization (NMF), the proposed method embeds the dynamic network into a low-dimensional hidden space, where the characteristics of different network snapshots are comprehensively preserved. Especially, our new method can effectively incorporate the hidden information of different time slices, because we introduce a novel adaptive parameter to automatically adjust the relative contribution of different terms in the uniform model. Accordingly, the prediction...
Read More

17级张瑾同学参加ICISA 2018国际会议

2018年6月26日,17级张瑾同学在雷凯、沈颖老师指导下,参加了在中国香港举办的ICISA 2018 (The 9th iCatse Conference on Information Science and Applications)国际会议,将实验室的研究成果在会议上展示并且与来此全球的学者共同讨论。 ICISA至今已经举办9届,旨在寻求在信息科学和应用的各个方面呈现出新颖的研究成果的贡献。会议包括了主题演讲、教学讲座、论文发表、研发成果展示以及workshop展示等。会议邀请了来自韩国庆北国立大学的Nakhoon Baek教授和来自美国奥克拉荷马州立大学的Nohpill Park教授作为Keynote Speeker分享相关领域的最新进展。 张瑾同学于26日下午在香港沙田万怡酒店以oral形式分享了论文Improving Medical Short Text Classification with Semantic Expansion using Word-Cluster Embedding。 论文链接:https://link.springer.com/chapter/10.1007/978-981-13-1056-0_41 通过参加本次会议,解到了相关领域内最新研究进展,开拓了视野。通过做报告,认识到了语言表达的重要性。通过与参会人员的交流,受到了很多启发。感谢互联网研发中心和雷老师的资助。 ...
Read More

16级袁凯琦同学论文被KSEM 2018录用

The International Conference on Knowledge Science, Engineering and Management (KSEM) 将于2018年8月17日至19日在中国吉林省长春市举行。KSEM这个跨学科会议,其宗旨是为知识科学,知识工程和知识管理的广泛领域的研究人员提供一个论坛,以交流思想并报告最新的研究成果,被CCF(中国计算机联合会)推荐为人工智能领域C类会议。会议链接:http://ksem2018.venue.link/index.php   论文题目:MedSim: A Novel Semantic Similarity Measure in Bio-medical Knowledge Graphs 论文作者:Kai Lei, Kaiqi Yuan, Qiang Zhang and Ying Shen 论文简介:我们提出了一种基于权威的生物医学知识图和大规模语料库的新型予以相似性方法MedSim,用于研究抗生素治疗替代方案。文中中除了利用知识图谱的层次结构和语料库的信息外,MedSim还通过构建多维的医学特征向量来进行进一步解释医学特征。在实验结果评估方面,MedSim比其他语义相似性方法在由医生评分的528个抗生素对的数据集产生了统计学上显著的改进。此外,文章中还通过案例分析,探索MedSim在药物替代治疗方案和药物滥用预防方面的应用。...
Read More

16级李可可同学论文被GLOBECOM 2018录用

IEEE Global Communications Conference将于2018年12月9日至13日在阿联酋首都阿布扎比举行。GLOBECOM是通信领域的旗舰会议之一(http://globecom2018.ieee-globecom.org/)   16级李可可同学在雷凯老师的指导下,在本次会议中被录用了一篇论文,下面是论文简介: Distributed Information-agnostic Flow Scheduling in Data Centers based on Wait-Time 作者:Kai Lei, Keke Li, Jie Xing, Bo Jin, Yi Wang 简介:数据中心网络现有的流量调度方法主要是为了最小化短流的流完成时间,并没有考虑优化延时敏感的长流(比如VR视频流,AI交互式问答流)的流完成时间。此外,在现有的流量调度方法中,信息可知的方案(如L2DCT, D2TCP)在实际中难以部署,这是因为它们需要预先知道流的相关信息(如流的大小);而信息不可知的调度方案(即PIAS)虽然不需要提前知道流的大小信息,但它需要一个中央化的服务器,这就导致在网络规模很大时,PIAS的可扩展性很差。 考虑到现有方案的局限性,在本文中,我们提出一种分布式信息不可知的流量调度方法(DIAS),该方法既能优化短流的流完成时间,也能优化延时敏感的长流的流完成时间。在DIAS中,数据包是根据它们的优先级进行转发的,而数据包的优先级是根据它们在发送端的缓冲区内的等待时间决定的,数据包的等待时间越久,它的优先级越低。此外,DIAS不像PIAS一样采用一个集中化的服务器收集流量负载信息,而是采用每个交换机将流量负载信息附在ACK包中返回给发送端的方式,流量负载信息是用来调整决定数据包优先级的阈值的。ns-3模拟器中的实验结果显示,与DCTCP、L2DCT相比,DIAS分别能够降低54.7%和50.1%的流完成时间,此外,与PIAS相比,DIAS能够保证延时敏感的长流更短的流完成时间,因此比PIAS性能更好。...
Read More

16级陈道源、邓扬同学两篇长文被COLING 2018录用

COLING 2018, the 27th International Conference on Computational Linguistics将于2018年8月20日至26日在美国圣达菲举行。COLING是自然语言处理领域的重要国际会议,每两年举办一次(http://coling2018.org/)。 16级陈道源、邓扬两名同学在雷凯、沈颖老师指导下在本次会议中各被录用了一篇长文,下面是论文列表与简介: Cooperative Denoising for Distantly Supervised Relation Extraction 作者:Kai Lei*, Daoyuan Chen*, Yaliang Li, Nan Du, Min Yang, Wei Fan, Ying Shen. (* indicates equal contribution) 简介:远监督关系抽取极大地减少了从非结构化文本中提取关系事实的人力成本。但是它存在着噪声标签的问题,这会极大损害抽取性能。与此同时,知识图谱中所表达的有用信息仍未在最先进的远监督关系提取方法中得到充分利用。针对这些挑战,我们提出了一种新的协同去噪框架,该框架由两个分别利用文本语料库和知识图谱的基础网络组成,以及一个通过自适应双向知识精馏和以动态集成应对噪声变化实例的协作模块。在真实数据集上的实验结果表明所提出的方法可以有效减少噪声标签,并在最先进的方法上取得实质性的改进。   Knowledge as A Bridge: Improving Cross-domain Answer Selection with External Knowledge 作者:Yang Deng, Ying Shen, Min Yang, Yaliang Li, Nan Du, Wei Fan, Kai Lei. 简介:答案选择是一项重要而具有挑战性的任务。在大量标记的训练数据可用的领域已经取得了显著的进展。然而,获得丰富的注释数据是耗时和昂贵的过程,将答案选择模型应用到具有有限标记数据的新领域将会有很大的障碍。在本文中,我们提出了知识感知注意力网络(KAN),一个跨领域答案选择的迁移学习框架,使用知识库作为桥梁,使知识从源领域转移到目标领域。具体地,我们设计了一个知识模块,将基于知识的表示学习集成到答案选择模型中。所学的基于知识的向量表示由源领域和目标领域共享,这不仅利用大量的跨领域数据,而且还受益于正则化效应,从而导致更通用的文本表示来帮助新领域中的任务。为了验证我们的模型的有效性,我们使用SQUAD-T数据集作为源域数据集和三个其他数据集(即yahoo QA,TREC QA和insuranceQA)作为目标域。实验结果表明,KAN具有很强的适用性和通用性,在跨域答案选择方面明显优于目前最好的模型算法。...
Read More

保送/报考CIRE2019学年招生信+2006-2018年毕业生去向信息

各位同学: 大家好! 首先很高兴大家对于保送,报考2019年北京大学深圳研究生院、计算机应用技术、网络信息工程方向的研究生表示兴趣! 互联网信息工程研发中心(CIRE)(http://netlab.szpku.edu.cn)成立于2003年6月,是深圳研究生院最早成立的专注培养计算机专业的科研和教学机构。中心与北京大学网络与信息系统研究所是一脉相承的,是网络与信息系统研究所在深圳研究生院的人才培养和科技研发基地。主要招收计算机应用技术方向的理学博士和硕士生。深圳中心同北京研究所培养研究生在培养水平上完全相同,均授予北京大学理学学术型学位。2018年新获批成为首个《深圳市内容中心网络与区块链重点实验室(ICNLAB)》,主任:雷凯 副教授。 中心秉承北大“勤奋,严谨,求实,创新”的校风,继承北大“爱国,民主,进步,科学”的优秀传统,凭借深圳研究生院这个面向特区的窗口,以未来互联网体系构架、大数据、移动互联网为主攻方面,依托技术优势,科研成果的积累,采用新的教学模式和培养办法,通过开发具有独立知识产权,创建北大信息技术品牌,为国家和社会培养具有高专业素质,高文化水平,较强实际操作能力的综合型信息技术人才. 2010年获深圳市发改委、科工贸信委、财政局审批【深发改2010 1324号】,2013年完成组建验收,成为 《深圳市云计算关键技术与应用重点实验室SPCCTA》 主要依托和建设机构,实验室主任:李晓明教授、学术委员会主任:高文院士。 实验室目前科研项目信息请参读: https://www.icnalb.cn/introduction/ 目前主要研究方向大致规划如下(2019年计划招生8-10名硕士): (1)  未来网络体系结构 :围绕命名数据网络为主的未来互联网体系构架研究http://www.ndnlab.cn,与5G、内容分发、物联网、车联网结合的科学研究;参见文章:命名数据网络与互联网内容分发 和教材《信息中心网络与命名数据网络》。 目前与华为未来网络理论实验室(香港) 有合作。 (2)  医学知识图谱、文本数据处理: 文本信息处理技术、深度学习人工智能技术; 与港大、 腾讯医疗AI 实验室合作。 (3)  互联网金融科技:区块链技术。 (4)  培养上重视创新与基础并重,综合学术、技术、工程能力均衡发展,采用主(80%)、辅(20%)至少两条线路的成长路线,每位同学既需要有一个主业,也必须有1-2个以上的辅业学习、工作和研究方向。 雷 凯 副教授(新体制) – 博士、 硕导。 中心主任。 毕业于北大计算机系 94 级本科、在美国哥伦比亚大学(Columbia University)获到硕士学位,随后在美国 IBM、花旗银行、 Oracle、 Google 工作近六年,于 2005 年初回国。 主要研究方向: 命名数据网络(NDN)、 区块链、文本 AI 技术(知识图谱) 。 沈海鹏教授 - (https://sites.google.com/site/shenhaipeng/ )美国统计学会会士、国际统计学会会士、香港大学商学院终身教授、前美国北卡大学统计系终身教授、美国沃顿商学院统计学博士毕业,北大94级数学系本科。本实验室2017年度“鹏程特聘教授”,2019年招收博士生1-2名【香港大学博士学籍(可直博)+全奖,港大-北大CIRE雷凯老师联合培养),初步导师考察合格后,按照香港大学商学院录取办法申请】  基于医学文本信息的深度学习研究 1 名 大数据统计分析与处理 1 名 (金融、网络领域) 崔斌教授 网络与信息系统研究所长。中国计算机学会杰出会员,IEEE高级会员,ACM会员,于2008年获得微软亚洲研究院的“微软青年教授奖”,2009年获得中国计算机学会 “CCF 青年科学家奖”,2014年获教育部自然科学二等奖,2016年入选教育部长江学者特聘教授 。 王腾蛟教授 - 北京大学计算机科学技术系副主任、博士生导师。高可信软件技术教育部重点实验室副主任。中国软件行业协会数据库及应用软件分会秘书长,中国计算机学会数据库专委会委员。 沈颖 博士 - 2009年获北京大学语言学硕士学位。2011年获欧盟伊拉斯谟项目英法两国计算机翻译及自然语言处理硕士。2015年毕业于法国巴黎第十大学医学信息学博士项目。 此外,北京大学本部网络信息研究所的代亚飞教授、罗英伟教授、汪小林教授、陈薇副研究员、都是本实验室从创建之初一直以来的双基地指导教师。 由于大家都是初次交流,我们希望大家做以下几件事情: 为了避免被垃圾邮件过滤,邮件题目请用“2019年CIRE推免/报考-姓名-毕业学校” 。 访问 互联网中心 的网站:https://www.icnalb.cn。 给我们发一个你的个人简历、或者简单的个人介绍、成绩单等材料到 leik@pkusz+edu+cn (去掉空格,替换“+”为.) 。 比较想了解你们的有以下几个方面: 所修课程,成绩排名(年级总人数排名,班级排名),英语四,六级情况。 做过的课题项目,工程经验。动手能力,独立能力,分析能力。 个人品质、特点、特长。 你为什么选择互联网中心,对什么计算机问题感兴趣,研究生毕业以后有什么打算等。 更多阅读:请下载 致2019报考互联网中心学生招生信, 《致有意于保送/报考 2019 学年北京大学互联网信息工程研发中心(深圳)同学们的信及 2006-2018 年毕业生去向信息》,...
Read More

16级章奇超、王煜坤、楼君俊同学中稿IEEE HotICN 2018国际会议

第一届IEEE信息中心未来网络学术会议(IEEE HotICN2018)将于8月15日至17日在深圳北京大学深圳研究生院举行。会议主要围绕以下三个领域:信息中心未来网络、区块链技术和知识图谱。HotICN2018致力于解决未来网络系统的设计、构建、管理和评估等研究问题。它是研究人员、从业人员、开发人员和用户探索尖端思想,交流技术、工具和经验的前沿论坛。   会议题目:2018 1st IEEE International Conference on Hot Information-Centric Networking (HotICN) 会议主页:https://www.hoticn.com   论文题目:Performance Comparison and Evaluation of WebSocket Frameworks: Netty, Undertow, Vert.x, Grizzly and Jetty 论文作者:Yukun Wang, Lei Huang, Xiaoyou Liu, Tao Sun, Kai Lei 论文作者(中文):王煜坤,黄磊,刘晓酉,孙涛,雷凯 文章链接:https://hoticn.com/files/hoticnPapers/003-paper%209.pdf 中文摘要:WebSocket协议的出现是为了替代现有的双向通信技术,这些技术使用HTTP作为传输层。目前,有许多网络应用框架支持WebSocket协议,但在不同方面等表现各异。为研究和对比常见WebSocket框架的性能,如Netty,Undertow,Vert.x,Grizzly和Jetty,在本文中,我们使用并发测试,流量测试,连接测试和资源占用测试。实验结果表明Netty和Undertow在高并发环境中表现更好,而Grizzly适用于大流量场景。结果还表明,在使用持久连接的情况下,Netty的性能远优于其他框架,Vert.x和Undertow能在短时间内处理大部分请求。此外,与其他框架相比,Netty和Vert.x占用更少的CPU和内存资源。   论文题目:Research and Application of BFT Algorithms Based on Hybrid Fault Model 论文作者:Qichao Zhang, Zhuyun Qi, Xiaoyou Liu, Tao Sun, Kai Lei 论文作者(中文):章奇超,齐竹云,刘晓酉,孙涛,雷凯 文章链接:https://hoticn.com/files/hoticnPapers/019-paper%2037.pdf 中文摘要:最近在区块链上爆发的兴趣使许多对于共识算法的研究涌现。相比于比特币衍生的共识算法,拜占庭容错(BFT)算法在联盟链中更为适用。然而,BFT算法存在它的局限,3f+1个节点的系统只能容忍f个故障节点,这将导致较高的网络通信量和开销。依靠可信组件协助的混合故障模型被提出用于降低节点最小量至2f+1,并且可以提高系统整体的性能。本文分析了可信组件的不同抽象和实现方法,我们提出了对于抽象和方法的最优选择,并提出了针对BFT算法设计选择的通用框架。最后,我们讨论了混合故障模型和可信组件在区块链领域有前景的应用。 ...
Read More

16级陈道源、邓扬同学参加SIGIR 2018国际会议

美国时间2018年7月8-12日,16级陈道源、邓扬同学在雷凯、沈颖老师的指导下,参加了在美国密歇根安娜堡(Ann Arbor Michigan)举办的ACM SIGIR 2018 (Special Interest Group on Information Retrieval)国际会议,将实验室的研究成果在会议上展示并与来自全球的学者共同讨论。 ACM SIGIR会议创始于1971年,至今已有40多年历史。ACM SIGIR会议是信息检索领域的顶级会议,被中国计算机学会(CCF)列为A类会议,专注于展示与信息检索基础理论、技术与应用有关的研究,在信息检索领域具有很高的国际影响力(http://sigir.org/sigir2018)。 陈道源同学在本次会议上发表了一篇短文“Ontology Evaluation with Path-based Text-aware Entropy Computation”,并在会议上做了海报论文展示。 邓扬同学在本次会议上发表了一篇短文“Knowledge-aware Attentive Neural Network for Ranking Question Answer Pairs”,并在会议上做了海报论文展示。 通过参加本次会议,了解了相关领域内最新研究进展,开拓了视野。通过做报告,认识到了语言表达的重要性。通过与参会人员的交流,受到了很多启发。感谢互联网研发中心、雷老师和沈老师的资助。   以下是论文列表及简介: Ontology Evaluation with Path-based Text-aware Entropy Computation 作者:Ying Shen*, Daoyuan Chen*, Min Yang, Yaliang Li, Nan Du, Kai Lei(* indicates equal contribution) 文章链接:https://dl.acm.org/citation.cfm?id=3210067 简介:随着知识交换的重要性日益上升,本体已成为知识交换和语义集成等语义驱动应用程序共享知识模型开发的关键技术。使用熵来测量知识碱基的可预测性和冗余性,特别是本体的可预测性和冗余,已经取得了重大进展。然而,目前用于评估本体的熵应用只考虑单点连接,而不考虑路径连接,为每个实体和路径分配相等的权重,并假定顶点是静态的。针对这些不足,本文提出了一种基于路径的文本感知熵计算方法PTEC,该方法考虑不同顶点之间的路径信息和路径内的文本信息,计算整个网络的连接路径以及不同节点之间的不同权重。从基于结构的嵌入和基于文本的嵌入获得的信息乘以熵计算的连通性矩阵。基于本体统计信息(数据量)、熵评估(数据质量)和案例研究(本体结构和文本可视化),对三种真实世界本体进行了实验评价。这些方面相互证明了我们方法的可靠性。实验结果表明,PTEC能够有效地评价本体,特别是在医学领域。   Knowledge-aware Attentive Neural Network for Ranking Question Answer Pairs 作者:Ying Shen, Yang Deng, Min Yang, Yaliang Li, Nan Du, Wei Fan, Kai Lei 文章链接:https://dl.acm.org/citation.cfm?id=3210081 开源代码:https://github.com/d123y456/kablstm 简介:问答对排序由于其广泛的应用,如信息检索和问答(QA),近年来引起了越来越多的关注。深度神经网络在此任务上取得了重大进展。然而,在人类文本理解中起着至关重要的作用的文本背景信息和隐藏在上下文之外的关系,在最近取得最好结果的深度神经网络中几乎没有被深入研究。在本文中,我们提出了KABLSTM,一个知识感知的注意双向长短记忆循环神经网络,利用外部知识从知识图谱(KG),丰富了QA句子的向量表示学习。具体地,我们提出了上下文知识交互学习的体系结构,其中,我们设计了一个上下文信息引导的注意卷积神经网络(CNN),将外部知识嵌入到句子表示中。此外,提出了一种知识感知的注意机制来关注QA对的各个部分之间的重要信息。KABLSTM在两个广泛使用的基准QA数据集上评估:WikiQA和TREC QA。实验结果表明,KBLASTM具有较强的竞争优势和得到了最好的实验结果。 ...
Read More