11级王思博同学在国际知识科学工程与管理大会(KSEM 2013)发表一篇长文

深圳市云计算关键技术与应用重点实验室(SPCCTA) 11级王思博同学的论文被2013国际知识科学工程与管理大会(KSEM 2013)接受为长文。该会议将于8月10日至12日在大连召开。 Size-Constrained Clustering Using an Initial Points Selection Method 作者:Kai LEI, Sibo WANG, Weiwei SONG, Qilin LI 文章链接:https://link.springer.com/chapter/10.1007/978-3-642-39787-5_16 国际知识科学工程与管理大会(KSEM)是知识科学相关领域领先的国际会议,其议题主要包括知识科学(Knowledge Science),知识工程(Knowledge Engineering)和知识管理(Knowledge Management)等三个方面,具有一定的国际影响力。 Size-Constrained Clustering Using an Initial Points Selection Method 该篇论文作者引入了一种新的初始点选择的算法,从而提高了大小限制聚类(size-constrained clustering)算法的聚类效果和聚类速度。该算法主要工作是迭代地寻找出拥有高密度周围数据点的中心点做为聚类算法的初始化点,关键步骤如下:首先计算数据集中每两点之间的距离,然后找出周围的k个点的平均距离到中心点最短的点作为一个聚类的初始点,然后从集合中删除该中心点及其周围的k个点,并循环迭代下去,直到剩余点没有或小于k个点。从而使初始化点在全局上接近于聚类最终结果的点,减少了聚类的迭代次数,提高了聚类效果和聚类速度。 该论文于2013年2月投稿,指导老师为深圳市云计算关键技术与应用重点实验室(SPCCTA)、互联网信息工程研发中心雷凯老师。 11级王思博,12级于倩,张莹,廖文静同学参加了北京大学“挑战杯”系列赛事,并荣获跨学科作品竞赛鼓励奖。 北京大学“挑战杯”是北京大学规模最大、最具权威的学生课外学术科研竞赛活动,学校历来对此予以高度重视。 参赛作品《基于互联网的股票舆情市场调查研究》通过以计算机应用技术的学科视角阐述了在对股票市场舆情分析的技术可行性和广大的市场需求,并在实验室雷凯老师的鼓励和支持下,做出了系统的原型,搭建了实验平台,为后面的进一步研究和深入打下了坚实的基础。...
Read More

2013年4月19日互联网春游活动———厦门三日游

       2013年4月19日中午12点,我们怀着激动的心情登上了前往厦门的大巴。傍晚,窗外的天色已微微发白,地势渐渐平坦,建筑也渐渐密集。终于经过8个多小时的旅行,到达了目的地——厦门。吃完晚饭,我们到达了此行第一站集美学村,经过跨海的厦门大桥就进入了集美,集美的众多学校及厦门大学均是陈嘉庚先生捐资建立的,在集美有陈嘉庚先生的故居、嘉庚公园等景点和建筑。陈先生为教育事业倾其所有,甚至在他的公司进入低谷清盘时,为了维持厦门大学的经费,卖掉其家族的房屋做为厦门大学的经费,留下“卖掉大厦,维持厦大”的美谈。教育乃富民强国之本,陈先生之远见、胸襟令人仰止。        第二天早晨,我们乘车来到厦大南门,旁边就是南普陀寺,这儿人潮汹涌,香客众多入寺后我们随着人流拜佛许愿,然后就开始攀登寺后的五老峰,山间植被繁茂,山石似大块的卵石状。上山后可俯瞰,但似乎有雾气,看起来有点雾蒙蒙的,不尽爽朗。厦大南门拍照留影的人比比皆是。一出校门,就是一座别致的人行天桥横跨道路,走过天桥就是一片沙滩,厦大真乃宝地也。                下午我们满怀期待前往此行的第一景点——鼓浪屿。        鼓浪屿位于福建省厦门岛西南隅,与厦门市隔海相望。原名圆沙洲、圆洲仔,因海西南有海蚀洞受浪潮冲击,声如擂鼓,明朝雅化为今名。由于历史原因,中外风格各异的建筑物在此地被完好地汇集、保留,不仅有“万国建筑博览”之称。龙头路商业街还有张三疯奶茶、赵小姐店铺、三老肉脯干等诸多火热商铺,小岛还是音乐的沃土,人才辈出,钢琴拥有密度居全国之冠,又得美名“钢琴之岛”、“音乐之乡”。        登上鼓浪屿,发现上面的建筑都是当年欧洲人留下的,具欧式建筑的风格。这里有迷人的海景,柔软的海滩上的细沙,冰凉的海水,清晰的海水的味道,红艳艳的落阳,美味的张三疯奶茶。鼓浪屿岛上的家庭旅馆都各有一番情调,一块门牌,一张椅子,一件小摆设,悉心整理的小院落,处处传递出别具一格的调调,鼓浪屿上最有特色的是建筑,各种风格的房子错落有致,姓氏公馆,一些国家的领事馆,这个岛据说是世界上名人密度最高的岛,那时候很多有钱人都想在这岛上那建一处房子,随着自己的喜好,构筑自己的梦想天堂,每一处建筑无不透露着曾经主人的脾性;厦门的随性在海滩,环岛南路上的海滩是一处接着一处,你可以随见一处就下去看看,海滩边没有什么特别的设施,游人弄潮,拍照,玩沙子…         第三天是大家心目中期待已久的环岛路——自行车之旅。沿着沙滩向胡里山方向前行,约七、八分钟就到了沙滩木栈道的起点,沿着栈道前行,吹着清凉的海风,心情也跟着轻快起来,在栈道两边不时有卖各种小吃和小商品的摊点。在春日柔和的阳光下,吹着清爽的海风,沿着沙滩和大海,顺着洁净靓丽的环岛路骑行,所有的烦恼都可暂时的忘却,陶醉在这海边的春日里,任何喜欢的地方都可以随时停下欣赏休憩。下午2点半,我们坐上了开往深圳的大巴,带着厦门的记忆满载而归。        最后,互联网的所有同学感谢雷总对此次春游活动的支持。这次厦门之行让我们在忙碌的学习生活中得到了放松,同时也加深了每个年级同学之间的友谊。 ...
Read More

NDN领域目前相关专利信息一览表

NDN领域相关专利信息一览表 (备注:点击专利名称进行预览或下载) 序号 专利名称 专利申请号 申请日期 公告日期 申请人 发明人 1.  Apparatus and method preventing overflow of pending interest table in name based network system 13/491,683 2012/6/8 2012/12/13 Samsung Electronics Co., Ltd. Dae Youb Kim 2.  Communication method of content requester, intermediate node, and content owner in content centric network 13/546,080 2012/7/11 2013/1/17 Samsung Electronics Co., Ltd. Jae Hoon Kim Myeong Wuk Jang Ji Hoon Lee 3.  Content router of a content centric network EP20110177478 2011/8/12 2013/2/27 Alcatel Lucent Diego Perino Matteo Varvello 4.  Controlling the spread of interests and content in a content centric network 12/338,175 2008/12/18 2009/11/19 Palo Alto Research Center Incorporated Van L. Jacobson Diana K. Smetters 5.  Custodian routing with network address translation in content-centric networks 12/970,826 2010/12/16 2012/6/21 Palo Alto Research Center Incorporated Simon Barber Marc E. Mosko 6.  Custodian-based routing in content-centric networks 12/970,740 2010/12/16 2012/6/21 Palo Alto Research Center Incorporated Van L. Jacobson Marc E. Mosko 7.  Distributed service instantiation for information-centric networks 13/194,076 2011/7/29 2013/1/31 Credit Suisse Ag Alcatel Lucent Alcatel-Lucent Deutschland Shashank Shanbhag Ivica Rimac 8.  Energy-efficient content caching with custodian-based routing in content-centric networks 12/970,776 2010/12/16 2012/6/21 Palo Alto Research Center Incorporated Van L. Jacobson 9.  Energy-efficient content retrieval in content-centric networks 12/970,802 2010/12/16 2012/6/21 Palo Alto Research Center Incorporated Van L. Jacobson 10.  Generalized Dual-Mode Data Forwarding Plane for Information-Centric Network 13/369,763 2012/2/9 2013/3/7 Futurewei Technologies, Inc. Guo Qiang Wang Ravishankar Ravindran Xinwen Zhang 11.  Method and apparatus for facilitating communication in a content centric network 12/332,560 2008/12/11 2009/11/19 Palo Alto Research Center Incorporated Van L. Jacobson 12.  Method and Apparatus...
Read More

实验室内部求职经验分享会成功举办

4月18日晚八点,实验室10级、11级、12级所有同学准时的聚在了会议室,共同期待一场干货满满的自由交流的求职经验分享会。         10级师兄师姐分别单独介绍了自己的求职经历以及求职路上获得的经验和教训。求职方向包括:国内外互联网企业、国企、出国、研究机构等等。       11级和12级的同学们针对简历、笔试、项目经验等各个方面向师兄师姐咨询,分享会在持续了两个半小时后圆满结束。  ...
Read More

科研沙龙活动记录(八)

时间:2013年4月2日 地点:A118会议室 主讲人:宋学辉、裴雨龙 主持人:邹凡云 参与人员:实验室同学 活动内容:        第一位主讲人是12级宋学辉。主题是Impartial Combinatorial Games。他从有趣的例子引入主题,介绍了组合游戏理论的必胜、必败态,Nim游戏、Nim和,以及Sprague-Grundy值,SG理论以及应用。最终“好问题奖”确定为张帆、夏睿、王思博。 Q&A摘录: (夏睿)问:最后得到的结果如何影响决策?条件限制对最后的结果有没有影响? 答:抑或的最后结果用于找到需要进行策略的那个组,至于那个组具体的策略则根据具体的规则来确定,使这个组改变之后,综合的异或结果为0。不同的规则只会影响策略的数量,不会影响策略的存在与否。即策略是必然存在的,有可靠的证明。 (王思博)问:c点为什么是0? 答:因为c点下面的边是1,取非负整数的补集中最小的值,所以是0。 第二位主讲人是10级裴雨龙。主题是“隐马尔科夫模型”。主要讲述了隐马尔科夫模型的引入和定义,观测序列的概率估计,最优状态序列的推断,以及模型的学习算法,同时,还向我们展示了HMM的广泛应用场景。最终“好问题奖”确定为柳胜兵、彭程、仇长贺。 Q&A摘录: (柳胜兵)问1:HMM如何根据用户的反馈更新模型? 答1:可以设置某些状态。 问2:如何寻找TopK个最优状态序列? 答2:动态规划里多记即可。 问3:HMM和CRF孰优孰劣? 答3:看潮流。 (彭程)问:马尔可夫链是一类特殊的时间离散的随机过程,其最大的特点就是无后效性。能否根据以往的历史数据,建立了彩票预测的马尔可夫链模型,并对利用模型得出的结果进行分析。 答:在对历史数据统计分析的基础上,运用马尔科夫链理论预测分析彩票这种随机性很强的事件是一种方法,之前我也想过,我们可以根据最新得到的号码随时改变初始状态和转移概率矩阵,判断各个号码出现的概率,但这种方法得到一个必中的号码的概率很低,在实际应用中还有一定的局限性,可以运用这种方法再结合其他方法可能得到更大的概率值。 (仇长贺)问:t时刻的状态假设只设定与t-1时刻的状态有关对结果正确性影响有多大? 答:会有一定的影响。但是有的地方会采用二元或者三元或者更多元模型,但是如果太多对计算复杂性的要求很高,性价比低。   最后是所有听众对两位主讲人根据整个报告的逻辑、内容充实性、表述能力等进行投票。:最终投票结果是裴雨龙8票,宋学辉7票。裴雨龙赢得优胜奖,宋学辉赢得鼓励奖。   附: 获奖名单: 优胜奖:裴雨龙 鼓励奖:宋学辉 好问题奖:张帆、夏睿、王思博;               柳胜兵、彭程、仇长贺。 PPT、活动录像存放地址: ftp://www.icnlab.cn/BigData...
Read More

科研沙龙活动记录(七)

时间:2013年3月19日 地点:A118会议室 主讲人:邹凡云、于倩 主持人:邹凡云 参与人员:雷凯老师、黄连恩老师、实验室全体同学。 活动内容: 第一位主讲人是邹凡云。主要介绍了软件著作权的申请。结合实验室已成功申请的四个软件著作权,细致的谈论了软件著作权的申请意义、步骤和注意事项,使大家对软件著作权申请流程有一个完成的认识,以后进行软件著作权申请可以少走弯路。大家讨论非常热烈,最终“好问题奖”确定为李湛、王嘉炜、王思博。 Q&A摘录: (李湛)问:软件著作权保护时效是多久,软件如果更新版本,前一个版本申请的著作权还有用没? 答:会一直有效,如果更新版本的话对新的版本重新申请著作权。 (王嘉炜)问:已有相同的软件的情况下是否还能申请软件著作权呢? 答:可以,可以自己编写完全功能的软件。 (秦大洲)问:算法是申请软件著作权还是专利? 答:软件著作权是不可以的。需要是一个成型的软件。 (王思博)问:软件著作权需不需要看程序。 答:不用看,只粘贴前30页和后30页代码就可以了。 第二位主讲人是于倩。主要介绍了专利的申请。主要内容:1专利的申请流程;2专利说明书的写作及要点;3以实验室之前申请的几个实例做总结,介绍了被驳回的主要原因。雷凯老师和黄连恩老师对几位同学的提问,也都做了补充回答。最终“好问题奖”确定为张莹、仇长贺、邹凡云。 Q&A摘录: (张莹)问1:专利申请有何特别标准? 答:审核时对不合格有标准,其他没有。 问2:专利申请后,当别人使用后,是否要给钱? 答:需要在审查阶段规定。 (仇长贺)问:对于描述不清晰或者认为我们无法实现的专利,可以再申请吗? 答:可以在描述清晰之后申诉。 (邹凡云)问:和已有专利类似的技术产品,能不能申请其他分类号的专利? 答:这个是看技术产品的类似程度,分类号只是个概念。 此次科研沙龙主要是向同学们介绍软件著作权和专利申请的相关流程,经雷凯老师建议,两人全部是优胜奖。 附: 获奖名单: 优胜奖:邹凡云 优胜奖:于倩 好问题奖: 李湛、王嘉炜、王思博; 张莹、仇长贺、邹凡云。 PPT、活动录像存放地址: ftp://www.icnlab.cn/BigData...
Read More

科研沙龙活动记录(六)

时间:2013年3月12日 地点:A118会议室 主讲人:仇长贺、张志明 主持人:邹凡云 参与人员:雷凯老师、黄连恩老师、实验室全体同学。 活动内容: 这是本学期第一次科研沙龙,雷凯老师和黄连恩老师到场聆听指导,同学们听的认真,讨论的也非常积极。 第一位主讲人是仇长贺。主题是Intrusion as (Anti)social Communication:Characterization and Detection。这是KDD2012最佳学生论文,文中采用了新颖的方式检测网络中的恶意主机。利用社交网络文化中图的分析和割点的概念,来描述和检测入侵。讲完后,雷总对最近在研究NDN中DDoS方面的陈涛同学提了问题,思考这个方法是否适用于NDN。王嘉炜认为由于NDN中没有端到端主机的概念,所以答案是否定的。对于同学们来讲,听主讲人讲非自己研究方向的知识,不仅能拓宽视野,同样也有可能促进交叉研究思路。大家讨论非常热烈,最终“好问题奖”确定为廖文静、夏睿、秦大洲。 Q&A摘录: (廖文静)问:论文中采用的检测方法比原来方法好在哪里,最后是否有实验对比? 答:论文从社会网络的角度看待和分析入侵检测问题,实验只对比了传统的采用出度的方法,结果证明比这种方法效果好很多。 (夏睿)问1:社交群体圈的概念是怎么定义的? 答:按照连入某个目的主机的所有主机组成初始的一个群体,然后,通过删除割点,设置阈值的方式,进一步处理。 问2:对于本来是割点,删除割点以后,不是割点的点,怎么处理? 答:就当做不是可疑点。 (秦大洲)问:置信区间95%的范围是(..)到底是一个怎么样的情况? 答:是表示错误在(..)区间内的可信度能达到95%,是个不错的可被接收的情况。 第二位主讲人是张志明。主题是“支持向量机”。主要介绍了三种支持向量机:硬间隔—支持向量机、软间隔—支持向量机、非线性支持向量机。讨论了如何由原问题转化为对偶问题,原问题转化为对偶问题的手段是Lagrange函数,并介绍了核函数及其优点和工作机制。最后讨论了支持向量机的应用。最终“好问题奖”确定为张帆、夏睿、杨飞宇。 Q&A摘录: (张帆)问:如果训练集是几百万的文档数据,而特征是几十万的词,那利用对偶问题求解(与训练集规模有关)是否比直接求解原问题(与特征维数有关)更复杂了? 答:一般地,不需要如此多的文档进行训练,通过随机抽取一小部分文档训练即可;而特征维数则是不可控的,通常特征维数越高越利于分类,所以特征维度一般要比训练集规模大得多。 (夏睿)问1:关于原方程和对偶函数的复杂度的关系。 答:原函数是根据维度,对偶函数是根据数据样本的个数。 问2:RBF是否会出现分类属于一类的情况? 答:会的,因为很可能尝试不出好的核函数,最后变换到某个维度空间,在这个空间中,它们混杂在一起。 问3:SVM适合小样本吗? 答:几百的小样本可以尝试使用SVM来处理,比一般的算法效果要好。这可能是由于对偶函数的变换作用。 (杨飞宇)问:如何实现从低维映射到高维时能够保证实现非线性到线性的转化? 答:这个映射关系是隐式实现的,需要多次设计核函数进行不断地实验才能成功。 最后是所有听众对两位主讲人根据整个报告的逻辑、内容充实性、表述能力等进行投票。:最终投票结果是张志明11票,仇长贺8票。张志明赢得优胜奖,仇长贺赢得鼓励奖。   附: 获奖名单: 优胜奖:张志明 鼓励奖:仇长贺 好问题奖:廖文静、夏睿、秦大洲; 张帆、夏睿、杨飞宇。 PPT、活动录像存放地址: ftp://www.icnlab.cn/BigData...
Read More

实验室主任李晓明教授当选中国计算机学会(CCF)2012年度 会士

http://www.ccf.org.cn/sites/ccf/xhdtnry.jsp?contentId=2711724548115 年度CCF会士评选结束 2012年11月28日,CCF会士评选会议根据《中国计算机学会会士条例》和CCF九届六次常务理事会议关于CCF会士推选流程的决议,评选出了五名2012年度CCF会士候选人,并于2012年11月30日-12月14日在CCF网站进行公示。现公示期满,学会秘书处没有收到对于当选会士的异议,根据《中国计算机学会会士条例》的规定,五位会士候选人正式当选为CCF会士。 2012年度CCF会士名单(按姓氏拼音为序): 姓名 单位及职务 金芝 北京大学教授,CCF常务理事 李建中 哈尔滨工业大学教授,CCF常务理事、传感器网络专委主任 李晓明 北京大学教授,CCF高级会员 王怀民 国防科学技术大学教授,CCF常务理事 王珊 中国人民大学教授,CCF高级会员 ...
Read More

迎新年—互联网实验室唱歌聚餐

         开学以来,实验室的小秋游一直未能成行,同学们忙忙碌碌了一学期,终于可以一起出去狂欢了!1月10号,研一的同学终于结束了一学期的课程,还未迎来密集的期末考试,于是定在这一天,走起!          下午我们来到了西丽的双喜KTV。麦霸真不少!黄淮师兄有着一副酷似李玉刚的好嗓子,高音圆润饱满,独一无二!谁想和黄淮师兄合唱,是基本听不到自己声音的^=^柳德华走经典老歌路线,入情入境。陈涛俨然是个小王力宏,《大城小爱》唱的SO PERFECT! 今年实验室女生增多了,每当几首男生的歌曲过后,突然听到柔美的女声,耳朵也有焕然一新的感觉呢~~(当然唐汉红师兄的音色也很柔美哦!)不过平均下来,每个人唱的倒也不多。尤其是张莹小歌神,今天尤其低调^.^          五点多了,准备转移莘语轩,可是显然几位同学没有尽兴。虞龙煜又唱了一首《垃圾》,大家正要准备圆满的离开,黄淮师兄和柳德华一首《爱江山更爱美人》又开唱了。大家聚集在门口,欣赏着两位小天王的演绎。最终,经各位歌王同意,成功转移阵地。            晚上6点,实验室同学齐聚“莘语轩”,晚宴正式开始。只是几位老师没能和大家一起聚聚,有些遗憾,不过以后机会还很多^.^          沙哥先讲了几句,新年第一次聚会,让大家不要拘谨,吃好喝好O(∩_∩)O~随后大家就开吃啦!!!有的同学下午唱饿了,还有的同学下午赶作业消耗了不少能量。总之大家实力强大,饭吃饱了,酒喝的也高兴~~            本次活动为实验室同学们提供了一次难得的新老生一起玩、一起聚的机会,在实验室认真紧张的学习氛围中,增加了温馨的情怀,使12级的师弟师妹们感受到了来到互联网实验室是一种幸福,同时也使我们每一个人强烈的感受到了实验室的集体荣誉感。相信在以后,我们会拧成一股绳,共同为实验室更好的明天而努力奋斗!...
Read More