16级李可可同学参加GLOBECOM 2018国际学术会议

在实验室雷凯老师的指导下,16级李可可同学的一篇论文被Global Communications Conference 2018国际学术会议(GLOBECOM 2018)录用。 下面是论文简介 论文题目:Distributed Information-agnostic Flow Scheduling in Data Centers based on Wait-Time 论文简介:数据中心网络现有的流量调度方法主要是为了最小化短流的流完成时间,并没有考虑优化延时敏感的长流(比如VR视频流,AI交互式问答流)的流完成时间。此外,在现有的流量调度方法中,信息可知的方案(如L2DCT, D2TCP)在实际中难以部署,这是因为它们需要预先知道流的相关信息(如流的大小);而信息不可知的调度方案(即PIAS)虽然不需要提前知道流的大小信息,但它需要一个中央化的服务器,这就导致在网络规模很大时,PIAS的可扩展性很差。 考虑到现有方案的局限性,在本文中,我们提出一种分布式信息不可知的流量调度方法(DIAS),该方法既能优化短流的流完成时间,也能优化延时敏感的长流的流完成时间。在DIAS中,数据包是根据它们的优先级进行转发的,而数据包的优先级是根据它们在发送端的缓冲区内的等待时间决定的,数据包的等待时间越久,它的优先级越低。此外,DIAS不像PIAS一样采用一个集中化的服务器收集流量负载信息,而是采用每个交换机将流量负载信息附在ACK包中返回给发送端的方式,流量负载信息是用来调整决定数据包优先级的阈值的。ns-3模拟器中的实验结果显示,与DCTCP、L2DCT相比,DIAS分别能够降低54.7%和50.1%的流完成时间,此外,与PIAS相比,DIAS能够保证延时敏感的长流更短的流完成时间,因此比PIAS性能更好。 GLOBECOM是IEEE旗下两大通信旗舰会议之一,今年12月9日-12月13日在阿联酋首都阿布扎比举行。GLOBECOM旨在促进通信各个方面的创新。会议包括了主题演讲、教学讲座、论文发表、研发成果展示以及workshop展示等;内容涵盖完整的计算、通信和网络方面。会议邀请了来自学术界(如来自Stanford University的Guru Parulkar教授等)和产业界(如来自Intel的Udayan Mukherjee,来自华为的Wen Tong等)的专家作为Keynote Speeker分享相关领域的最新进展。 李可可同学于阿联酋时间12月11日下午进行了论文分享并且与来自全球的学者进行了深入交流。 通过参加本次会议,解到了相关领域内最新研究进展,开拓了视野。通过做报告,认识到了语言表达的重要性。通过与参会人员的交流,受到了很多启发。感谢互联网研发中心和雷老师的资助。...
Read More

17级覃孟同学中稿InfoCom 2019

IEEE International Conference on Computer Communications 2019 (InfoCom 2019)将于2019年4月29日至5月2日,在法国巴黎举行。InfoCom是计算机网络通信领域的国际顶级学术会议,也被CCF推荐为计算机网络方向的A类会议。 17级同学覃孟在实验室雷凯老师指导下,完成一篇长文"GCN-GAN: A Non-linear Temporal Link Prediction Model for Weighted Dynamic Networks",并以确认被InfoCom 2019录用!中稿论文的简介如下: 论文标题: GCN-GAN: A Non-linear Temporal Link Prediction Model for Weighted Dynamic Networks 论文作者: Kai Lei, Meng Qin, Bo Bai*, Gong Zhang, Min Yang* 英文摘要: In this paper, we generally formulate the dynamics prediction problem of various network systems (e.g., the prediction of mobility, traffic and topology) as the temporal link prediction task. Different from conventional techniques of temporal link prediction that ignore the potential non-linear characteristics and the informative link weights in the dynamic network, we introduce a novel non-linear model GCN-GAN to tackle the challenging temporal link prediction task of weighted dynamic networks. The proposed model leverages the benefits of the graph convolutional network (GCN), long short-term memory (LSTM) as well as the generative adversarial network (GAN). Thus, the dynamics, topology structure and evolutionary patterns of weighted dynamic networks can be fully exploited to improve the temporal link prediction performance. Concretely, we...
Read More

15级张丽珠同学中稿Journal of Biomedical Informatics期刊

Journal of Biomedical Informatics 期刊 Journal of Biomedical Informatics(https://www.journals.elsevier.com/knowledge-based-systems/) 是人工智能领域跨学科、面向应用的学术期刊,最新的影响因子(IF)为2.882。 15级同学张丽珠,在实验室雷凯老师和沈颖老师的指导下,完成一篇论文,并已确认被Journal of Biomedical Informatics 期刊录用,论文具体简介如下: 标题:CBN: Constructing a Clinical Bayesian Network based on Data from the Electronic Medical Record 作者:Ying Shen, Lizhu Zhang, Jin Zhang, Min Yang, Buzhou Tang, Yaliang Li, Kai Lei 链接:https://authors.elsevier.com/a/1Y1Yd5SMDQYjHP 简介: 从电子病历(EMR)学习涉及疾病和症状的候选因果关系的过程是学习直接从真实医疗保健数据执行诊断推断的模型的第一步。然而,现有的诊断推理系统依赖于诸如本体之类的知识库,其通过劳动密集型过程手动编译或者使用简单的成对统计自动导出。我们探索CBN,一种用于医学本体概率推理的临床贝叶斯网络构建,直接从EMR学习高质量贝叶斯拓扑和完整本体。具体来说,我们首先从超过10,000个被识别的患者记录中提取医疗实体关系,并采用优势比(OR值)计算和K2贪婪算法来自动构建贝叶斯拓扑。然后,贝叶斯估计用于概率分布。最后,我们采用贝叶斯网络来完成本体的因果关系和概率分布,以增强本体推理能力。通过评估学习的拓扑结构与医生的专家意见和熵计算以及通过计算基于本体的诊断分类,我们的研究表明,从医疗记录中直接和自动构建高质量的健康拓扑和本体是可行的。我们的结果是可复现的,我们将在文章发布后发布该工作的源代码和CN-Stroke知识图谱。...
Read More

近年来内容中心网络与区块链重点实验室优秀文章概览(一)

实验室经过这几年的积累,发表了不少优秀的文章,现在在这做一个展示概要,包括文章的简介,pdf链接以及部分文章的开源代码github链接。 COLING 2018国际会议 Knowledge as A Bridge: Improving Cross-domain Answer Selection with External Knowledge 作者:Yang Deng, Ying Shen, Min Yang, Yaliang Li, Nan Du, Wei Fan, Kai Lei 文章链接:https://aclanthology.coli.uni-saarland.de/papers/C18-1279/c18-1279 简介:答案选择是一项重要而具有挑战性的任务。在大量标记的训练数据可用的领域已经取得了显著的进展。然而,获得丰富的注释数据是耗时和昂贵的过程,将答案选择模型应用到具有有限标记数据的新领域将会有很大的障碍。在本文中,我们提出了知识感知注意力网络(KAN),一个跨领域答案选择的迁移学习框架,使用知识库作为桥梁,使知识从源领域转移到目标领域。具体地,我们设计了一个知识模块,将基于知识的表示学习集成到答案选择模型中。所学的基于知识的向量表示由源领域和目标领域共享,这不仅利用大量的跨领域数据,而且还受益于正则化效应,从而导致更通用的文本表示来帮助新领域中的任务。为了验证我们的模型的有效性,我们使用SQUAD-T数据集作为源域数据集和三个其他数据集(即yahoo QA,TREC QA和insuranceQA)作为目标域。实验结果表明,KAN具有很强的适用性和通用性,在跨域答案选择方面明显优于目前最好的模型算法。 Abstract Answer selection is an important but challenging task. Significant progress has been made in domains where a large amount of labeled training data is available. However, obtaining rich annotated data is a time-consuming and expensive process, creating a substantial barrier for applying answer selection models to a new domain which has limited labeled data. In this paper, we propose Knowledge-aware Attentive Network (KAN), a transfer learning framework for crossdomain answer selection, which uses the knowledge base as a bridge to enable knowledge transfer from the source domain to the target domains. Specifically, we design a knowledge module to integrate the knowledge-based representational learning into answer selection models. The learned knowledge-based representations are shared by source and target domains, which not only leverages large amounts of cross-domain data, but also benefits from...
Read More

16级章奇超、17级谢英英、18级李渝中稿ICPADS 2018

第24届 International Conference on Parallel and Distributed Systems(ICPADS 2018) 将于2018年12月11日至13日在新加坡圣淘沙岛举行,此前的活动取得了成功。圣淘沙岛位于新加坡本岛南部,素有“欢乐宝石”的美誉。 ICPADS 2018旨在为全世界的科学家,工程师和教育工作者提供一个高水平的国际论坛,展示和分享关于并行和分布式系统的最新研究成果。ICPADS被CCF推荐为计算机体系结构/并行与分布计算/存储系统类C类会议,会议链接 https://icpads.sg。   16级学生章奇超延续15级徐丽妹的工作,在雷凯老师和齐竹云老师的指导下论文被ICPADS 2018录用。 论文题目:Reputation-based Byzantine Fault-Tolerance for Consortium Blockchain 论文作者:Kai Lei, Qichao Zhang, Limei Xu and Zhuyun Qi 论文简介: 实用拜占庭容错算法在联盟区块链系统中得到了广泛应用,但该类算法难以及时识别出错节点,易受针对于主节点的各类攻击,并且其共识成员的投票话语权的相同,不适用于话语权区分的场景。为了解决这些问题,本研究提出了基于信誉的拜占庭容错(RBFT)算法。我们设计了信誉模型来评估共识过程中每个成员的行为,出错节点将会被降低信誉分,并且在共识过程中获得较低的话语权。另外,我们设计了基于信誉分的主节点切换方案,高信誉分的节点将具有更多的机会成为主节点来产生合法区块。实验结果表明RBFT获得了良好的性能,并确保了系统的安全性和可靠性。   17级学生谢英英延续15级石涧的工作,在雷凯老师指导下的论文被ICPADS 2018长文录用。 论文题目:OptCaching: A Stackelberg Game and Belief Propagation Based Caching Scheme for Joint Utility Optimization in Fog Computing 论文作者:Kai Lei, Yingying Xie, Jian Shi, Haijun Zhang, Gong Zhang, Bo Bai 论文简介:雾计算将云计算的概念延伸到网络边缘,为大量有低延时要求的应用提供支持。本文研究在三层雾计算场景下,如何合理分配雾节点缓存资源使得联合优化内容提供商、网络运营商和用户的效用。本文对内容提供商、网络运营商和用户之间缓存租赁、定价、利用行为进行建模,并且定义了三者各自的效用函数;将内容提供商与网络运营商之间的缓存定价和租赁行为建模为一个Stackelberg博弈,通过理论分析找到了Stackelberg均衡点;设计了一个基于置信传播的分布式缓存放置算法,通过降低用户平均下载延迟进一步优化了用户效用。实验验证了在Stackelberg均衡点处三者效用达到联合优化的状态;相比于基于全局流行度的缓存放置策略,用户的平均下载延迟降低了33.7%。   18级学生李渝延续15级朴雪威的工作,在雷凯老师的指导下论文被IEEE   ICPADS  2018长文录用。 论文题目 :NDN Producer Mobility Management based on Echo State Network: a Lightweight Machine Learning 论文作者:Kai Lei, Yu Li, Xuewei Piao, Haijun Zhang 论文简介:命名数据网络(Named Data Networking , NDN)从架构设计上天然地支持了内容消费者移动,但是在内容生产者移动的问题上没有给出很好的解决方案,具有很大的研究空间。根据现有的研究,本文提出了一种基于回声状态网络(Echo State Network,ESN)预测的NDN生产者移动策略。在生产者移动切换发生之前,根据预测对网络设备进行预配置,以低带宽代价提升内容响应速度并降低因移动切换带来的额外时延,实现无缝切换。模型分析以及在ndnSIM上的仿真实验结果表明,本文策略在切换延时,丢包率,切换开销等指标上均具有一定的优势。  ...
Read More

17级杜茂瑜、谢英英同学参加2018中国区块链技术与应用高峰论坛

2018年9月15日,17级同学杜茂瑜、谢英英在雷凯老师的带领下,参加了中国区块链技术与应用高峰论坛暨中国计算机学会区块链专委会第一次工作会议。 本次峰会由由福州市人民政府和中国计算机学会主办。为期两天的论坛,国内区块链领域学者和行业精英,分别围绕区块链的体系结构、安全与隐私保护等技术,以及区块链标准规范、创新应用、产业落地等内容作主题演讲。 区块链作为近期备受关注的信息技术,在行业需求和实际落地应用上都还有许多亟待解决的问题。会上学者主要就区块链技术的发展现状和研究方向进行讨论,行业代表则重点关注区块链的应用落地。论坛了充满学术界和产业界智慧的碰撞和信息的交流。...
Read More

2018未来网络、区块链与数据智能科研交流汇报会

  2018年9月10日星期一上午,未来网络、区块链与数据智能科研交流汇报会在北京大学信息工程学院C125汇报厅圆满举行。本次交流会恰逢教师节和并且中秋节也将到来,因此实验室也给每位老师送上了节日的祝福和精美的礼物。出席本次交流会的有平安执委,首席科学家肖京博士、香港华为未来网络理论实验室高级研究员白铂博士、哈工大深圳计算机学院院长王轩、清华深圳网络PI, 科技处江勇处长、还有先进院的杨敏博士、清华大学深圳研究生院的郑海涛老师、哈工大深圳校区的汤步州老师、南科大金融系的陈坤老师以及实验室全体学生。 本次交流会首先由肖京博士和白铂博士给大家带来了精彩的报告。平安执委,首席科学家肖京博士从企业应用视角结合“智能”+大数据分析方法和平安集团的金融应用,分析了金融领域智能化所遇到的挑战和机遇,让大家有了对“智能”+金融的前景的具体感受和憧憬。 而作为香港华为未来网络理论实验室高级研究员的白铂博士首先对他们的实验室做了一个介绍,然后从专业角度向我们讲解了无线网络建模等无线网络理论,从图分解,机器学习和信息论的角度对无线网络问题进行了分析,并点名了机器学习对提高网络性能的重要性。另外哈工大深圳计算机学院院长王轩、清华深圳网络PI, 科技处江勇处长也发表了精彩的交流感言,并且对本次交流会的形式很满意,并且希望以后可以组织北大清华哈工大三校的 交流汇报,让活动举办得更加丰富多彩。 肖京博士和白铂博士的精彩报告之后,实验室网络体系组,区块链组,知识图谱组和Web与Data智能处理与分析组的同学首先以英文汇报的形式,对各自组的组员基本情况,组内各个成员的研究方向和研究进展做了一个介绍,然后每个同学基于自己当前的研究方向,研究问题和研究内容及研究进展和研究成果对自己这一两年以来的工作情况做了一个汇报。 交流会结束前,实验室的雷凯老师诚挚的感谢了嘉宾们的到来,并对同学们的汇报给予了肯定。随后全体师生和嘉宾进行了合影,本次交流会圆满结束。   详情参见9月10日周一上午-北大深圳互联网中心-开学科研论坛...
Read More

热烈欢迎Stephen J. Song教授,汤步洲教授到我院作学术汇报

2018年 9月5日, 莫纳什大学Monash Biomedicine Discovery Institute (BDI) 的Stephen J. Song教授和哈尔滨工业大学(深圳)计算机科学与技术学院汤步洲教授受雷老师邀请,于当日下午3:30在北京大学深圳研究生院C栋教学楼202室做了一场精彩纷呈的学术报告。沈颖老师,实验室所有学生等前来参加此次讲座。 Stephen J. Song教授演讲的题目是《人工智能在生物大数据中序列标注问题的关键应用》,以通俗易懂的语言给现场师生科普了什么是“生物信息学”之后,介绍了人工智能在蛋白质序列标注的研究进展和应用。教授演讲内容深入浅出,大家听得津津有味,并深刻地意识到:人工智能强大的学习能力和数据分析能力助力人类进一步探索“生命的奥秘”。 汤步洲教授演讲的题目为Chinese Clinical Natural Language Processing Research Status and Chanllenge,介绍了目前中文医疗文本中自然语言处理的研究现状与挑战,并分享了汤教授最近的研究进展:中文医疗文本中的实体识和属性联合抽取。大家看到汤教授多年如一日地深耕中文医疗文本NLP,不禁对汤教授的学者风范肃然起敬。   会议结束后,我院师生与Stephen J. Song教授、汤步洲教授合影,感谢他们此次的分享,希望以后可以有更多交流的机会。 ...
Read More

17级覃孟参加SIGCOMM 2018国际会议

2018年8月20日至25日,实验室17级覃孟同学参加了在匈牙利布达佩斯举行的ACM SIGCOMM 2018国际学术会议(ACM Special Interest Group on Data Communication),并在该会议附属的Network Meets AI & ML (NetAI) Workshop上将实验室最新研究成果与来自全球不同研究领域的学者共同讨论。 ACM SIGCOMM 2018会场     ACM SIGCOMM是计算机网络通信领域的重要学术会议,被中国计算机学会(CCF)列为A类学术会议,主要关注计算机网络通信应用、技术、体系结构和协议等的最新研究成果;同时,今年也是NetAI Workshop在SIGCOMM会议举办的第一届,该workshop主要关注如何利用人工智能技术有效应对现有网络系统的面临的挑战。 本次ACM SIGCOMM会议主要关注投稿论文是否在计算机网络通信领域是否具有: 重要且深刻的贡献 (Important deep contributions); 大胆且新颖的想法 (Daring novel ideas); 较宽广的应用范围和包容性(Breadth of scope and inclusivity)。 最终在222篇投稿论文中选择接收40篇;其中,两篇Best Paper分别为"Sincraonia: Near-Optimal Network Design for Colflows",以及"Inferrin Persistent Interdomain Congestion"。另外,两篇Test of Time Award论文分别为SIGCOMM 2008的"A Scalable, Commodity Data Center Network Architecture"和SIGCOMM 2016的"XORs in the air: practical wireless network coding"。 在会议伊始,主办方简要地总结了近期计算机网络通信领域的几大研究热点,主要包括: 无线网络; 数据中心网络; 机器学习技术在计算机网络领域的应用。 尤其对于机器学习技术的应用,会议的主流观点认为,随着人工智能在近几年的蓬勃发展,其受关注程度远远超过了计算机网络,但计算机网络应该始终保持其作为一个核心研究领域的地位,且应该成为一个不断发展的研究热点。进一步地,NetAI Workshop的主旨也强调,人工智能技术能够用于应对目前计算机网络中面临的挑战;另一方面,计算机网络的前沿技术也能够有效地帮助人工智能系统解决性能瓶颈问题。二者应该相辅相成,共同发展。 会议内容锦集     实验室17级覃孟同学和16级张翼同学在雷老师的指导下,分别在NetAI Workshop上发表长文"Adaptive Multiple Non-negative Matrix Factorization for Temporal Link Prediction in Dynamic Networks"和"IFS-RL: An Intelligent Forwarding Strategy Based on Reinforcement Learning in Named-Data Networking",并分别由覃孟同学和华为2012实验室的白铂老师做论文的口头汇报。 NetAI Workshop报告现场     两篇论文的简介如下: 标题:Adaptive Multiple Non-negative Matrix Factorization for Temporal Link Prediction in Dynamic Networks 作者: Kai Lei, Meng Qin, Bo Bai*, Gong Zhang. 文章链接:https://dl.acm.org/citation.cfm?id=3229546 简介:对于用户移动性、网络动态拓扑和网络流量的预测是改善各种网络系统性能的有效手段,而相关的网络系统动态性预测问题能够以复杂网络分析的观点一般性地抽象为时序链路预测(temporal link prediction)问题。从网络表征(network embedding)的观点出发,提出一种自适应多重非负矩阵分解(adaptive nonnegative matrix factorization, AM-NMF)模型解决上述问题。在非负矩阵分解(nonnegative matrix factorization, NMF)框架下,该模型将动态网络嵌入到一个保留了不同网络快照动态变化特征的低维隐含空间。特别地,由于引入自适应参数自动地调节混合模型中不同分量的相对重要性,该模型还能有效地结合不同时间片下的隐含信息,并考虑单个时间片与动态网络整体的内在关联性。进一步地,关于下一个时间片网络快照的预测结果能够通过执行NMF的逆过程生成。作为一个应用示例,该模型也被应用于各种网络系统相关的数据集,包括人移动网络、车辆移动网络、无线网格网络和数据中心网络。相关实验结果表明,该方法在无权网络和带权网络的时序链路预测任务上的性能超过现有的方法。   标题: IFS-RL: An Intelligent Forwarding Strategy Based on Reinforcement Learning in Named-Data Networking 作者:Yi Zhang, Bo Bai, Kuai Xu, Kai Lei* 文章链接:https://dl.acm.org/citation.cfm?id=3229547 简介:命名数据网络(Named-Data Network, DND)是一种新型的通信范式,它的基本网络原语是基于命名数据而不是主机标识。与传统的IP网络架构相比,NDN的数据传输平面允许每个路由器独立自主地选择下一个转发的接口,而不依赖于具体的路由过程。因此,转发策略在NDN的自适应高效数据传输过程中具有重要的影响。现有的大多数转发策略使用固定的控制规则或基于适用于某些特定部署环境的简单模型,但并不能应用于多种网络场景,也不能应对多样的应用需求。基于增强学习(reinforcement learning),提出一种智能转发策略IFS-RL。通过训练一系列的神经网络,该模型能够根据路由节点收集的Interest包历史转发信息自适应地确定合适的转发接口,而并不依赖于某个预定程序的模型(pre-programmed model)。因此,该模型能够适用于多种不同的网络状态。在基本模型的基础上,也考察了模型的学习力度,并提出一种改进方案使得基本模型能够有效地应对网络拓扑的变化。在NDNSim上的相关性能评价实验结果表明,IFS-RL模型在吞吐量和丢包率方面相比于现有方法具有更好的性能。 通过参加本次会议,不仅了解到了计算机网络通信领域最新研究进展,也充分认识到自身的学术研究能力仍与顶级学术会议有巨大的差距,以及自身研究工作中存在的不足,可谓收获颇丰。在接下来的科研工作中,不仅需要脚踏实地做出具有实质性学术贡献的工作,也需要有挑战国际顶级学术会议和期刊的勇气、魄力和信心。最后,感谢互联网研发中心雷凯老师的资助,以及在论文写作、投稿等方面给予的支持。 ACM SIGCOMM 2019信息 @匈牙利 布达佩斯 多瑙河畔...
Read More