2015-2016科研沙龙(四)

时间:2015.11.30 地点:A栋118室 主讲人:15级司尚春、温德斯、张强 主持人:周颖 参与人员:雷凯老师、沈颖老师及14、15级实验室同学 活动内容: 第一次科研沙龙同学们收获颇丰,所以,在深圳温暖的冬季11月底,应同学们积极响应,我们实验室再一次迎来了本学期第二次科研沙龙。这次科研沙龙形式上主要为3位主讲人针对同一话题-“知识图谱”,从概念介绍、构建、技术、开源平台、评测和意义等方面循序渐进的进行讲解,之后的讨论环节留给同学们提问和互相解疑。 首先由15级的司尚春同学,从一个有趣的“姚明的女儿的妈妈的丈夫的身高”搜索结果引入知识图谱,介绍了知识图谱中节点、语义关系等基本概念,就什么是知识图谱展开讨论。之后针对知识图谱的六种构建方法,包括实体对齐、属性学习学习等方法细节,以及在构建知识图谱时候获取的不同知识之间的冲突解决方法。司尚春同学讲解经常以例子做引导,比如医学领域中的传染病与茶树枝梢点黑病的上下围关系、肥胖病和肥胖等同义实体的重定向问题,让同学们快速而形象的理解抽象的知识点。此外,他还提及几种构建中涉及到的技术,比如不同知识库的爬虫、共指消解、自然语言处理等技术,让同学们对知识图谱从概括到具体构建流程由浅入深的了解。 然后,温德斯同学给大家介绍了知识图谱数据源的分类,如维基百科、freebase 、cyc、wolfram alpha和行业知识库等半结构化数据库,并提供给大家可供下载的网址。在对每个数据库的历史和不同的数据特点和提取方法介绍完之后,引入其评估方法,比如基于应用、基于数据、基于人工等不同的评估使同学们对知识图谱从数据和测量上有了更深入的了解。 最后,  张强同学就知识图谱能做什么,从三个具体的应用例子给大家描述,可以说是举例对比,比如传统检索or智能检索。而并且针对能否成为第二代搜索引擎展开讨论,雷老师也说二者可能会是并列的补充关系而不能完全替代,而沈颖老师则从信息医疗方面表示在行业内应用应该是没有问题。之后,张强还给大家介绍知识图谱在知识导航以及决策系统方面的优势和应用,以及在图书馆和证券行业的真实有效作用。 介绍结束后,大家对该技术能否成为下一代搜索引擎、技术支持等展开了热烈讨论。有同学比较关注数据存储方法,比如爬取到的数据上下围关系路径的存储方式,朱帅同学则对知识图谱的聚类和可视化工具技术问题提出他的看法。王少华提出“作为下一代搜索引擎,他的商业模式、广告处理等问题可以解决么”,司尚春同学立即解释“一个引擎好用,有人用,模式商机自然就来了”,张强也进一步说到,知识图谱也可以有自己的广告商业方法,相比于原来的搜索引擎只是多了一个智能化选择而已。此起彼伏的讨论一直持续了半小时之久。 最后总结时,雷老师肯定主讲人用心的准备,是对实验室整体同学知识输入的一个贡献。知识图谱本质的改变是将语义与关联关系考虑进去,并且分析上网挂号与知识图谱结合例子。老师强调,一定要定位知识图谱的用户群,并考虑市场需求分析,“这不仅仅是一次活动,这只是一个开始。”雷老师如是说,“有兴趣的同学都都来讲讲,对这几个点可以进一步研究进展下去”。 附:获奖名单 鼓励奖:司尚春、温德斯、张强 好问题奖:王少华、朱帅、徐丽妹、陈辰 PPT、活动录像存放地址:ftp://219.223.192.208/pub/BigData/2015-2016yearscientific researchsalon/20151130/...
Read More

2015-2016学年科研沙龙(三)

时间:2015.10.19 地点:A栋118室 主讲人:14级郑亦哲 15王少华 主持人:周颖 参与人员:雷凯老师、白老师及14、15级实验室同学 活动内容:   在刚刚结束国庆长假之后,我们实验室迎来了本学期第一次科研沙龙。因为对于15级新生,这是第一次参加互联网实验室的特色活动,因此,在活动开始之前,雷老师先简单介绍了科研沙龙的活动流程、活动目的,希望通过这个活动让大家学会表达、开阔思维,调动整个实验室科研热情。讲解内容不限制自己研究领域“只要你觉得能值得讨论,给实验室同学带来收益的课题,都可以在科研沙龙中给大家分享”雷老师如是说。           第一位主讲人是15级的王少华同学,他给大家带来的是一个最近比较火热而有趣的话题--头戴设备与虚拟现实前景。首先介绍的是虚拟现实的基本概念,强调虚拟现实不只有头戴的显示设备,可以配合触觉、听觉、嗅觉等,并展示如PlayStation VR和Google CardBoard等头戴设备。通过引出了现在技术阶段虚拟现实的应用场景:比如:视频会议和工业设计,体现该技术可以让生活更加方便快捷。而在未来虚拟现实在一些,比如模拟太空失重环境等模拟演练,波音777用虚拟现实技术设计的一款飞机,甚至是医学仿真手术,都有很广的发展前景。最后,在介绍了虚拟现实与增强现实的区别后,不再局限于头戴设备,表示在虚拟现实前景上还有很多如气味、虚拟反馈、风雨等环境影响等多方面的领域有待开发。   王少华讲解完,现场非常活跃,大家对该课题表现极高的兴趣,都纷纷提出自己的问题和看法。比如,一些同学问道,在他购买的谷歌发布的Cardboard 产品,用户体验最直接感受是眼镜距离镜头很近,对视力影响很大,还有同学提出和国内的虚拟现实产品的区别,在视频处理方面的技术,王少华同学给出了现有头戴设备有待改进的分析,比如延迟性、重量、清晰度。他说,这些方面也将成为同类产品中相互角逐的关键点。王少华分享完毕之后,14级郑亦哲同学分享了--内网穿透NAT技术。     郑亦哲同学演讲风格幽默风趣,通过微电子同学对他提出的一个问题:“学校网不是公网ip,两台电脑不在一个局域网里,如何互相访问?”来引入今天的内网穿透话题。整个演讲过程,从分析圆锥形、对称形NAT的区别,来具体讲解什么是内网穿透问题,到两个主机分别在不同局域网、局域网和公网、两个都是公网的主机通信问题,来讲解怎么解决内网穿透问题,其中引入NAT类型的检测方法原理,层层递进,逻辑严密,给同学们由浅及深的对NAT进行分析。采用一边提问一边讲解的方法,“两个主机之间能互相通信么?”“为什么需要他主动发起连接?”增加与同学的互动过程,最终又回归到最初的问题,给出一句话的解决方法“用有线连接笔记本!”。给大家印象深刻的一次分享会。   最后,雷老师也表示,通过刚才的展示,可以看出同学在入学里,通过实验室的创客等项目答辩、课堂展示,在语言表达、应变能力等都有了很大的提高,也看出两位主讲人都非常认真的准备这次展示,希望以后能继续将这个实验室传统保持下去。 附:获奖名单 优胜奖:王少华 鼓励奖:郑亦哲 好问题奖:巩力睿、朱帅、金彤、杨力维 PPT、活动录像存放地址:ftp://219.223.192.208/pub/BigData/2015-2016yearscientific researchsalon/20151019/...
Read More

鄂维南院士到访深研院并做“大数据发展中一些瓶颈问题”学术报告

新学期伊始,8月29日,中国科学院院士,北京大学、美国普林斯顿大学鄂维南教授,应邀对北京大学深圳研究生院进行交流访问。下午3点,鄂院士在北京大学深圳研究生院H栋214作了专题为“大数据发展中的一些瓶颈问题”的精彩学术讲座。深研院党委书记、副院长谭文长教授出席讲座并致词欢迎,相关老师和同学积极参加了本次讲座。讲座由实验室雷凯老师主持。 鄂维南院士从数据资源、数据处理方法、大数据技术、数据人才等四个方面探讨了大数据发展中一些瓶颈问题,分享了自己对数据收集与处理的研究成果和经验。鄂院士2009年开始就关注大数据价值。当前数据资源并不稀缺,数据的价值在交易过程中很难保值,从而导致在数据需求方和数据所有方之间存在沟通、使用以及隐私担心方面的关键问题;数据隐私在之前发表的一篇Science文章中已经被基本证明是个不可完全规避的问题;大数据处理技术中存在很多有挑战性的理论和技术问题,例如在社会征信、推荐技术、预测技术和处理模型上都有比较广泛的研究内容和应用前景。 鄂院士通过Google搜索技术和商业模式、天文学家开普勒三大定律、物理学家牛顿三大定律、信息领域视频识别处理、社交网络结构分析、现代基因生物计算等几个跨交叉学科的大数据研究和进展的具体案例,生动说明了大数据发展的前景,启发大家思考解决相应科学问题的理解和思维方式。 现场提问环节,吸引了在座的老师和同学们的浓厚兴趣。对于相关老师问及的大数据理论判别依据、深度学习技术的进展和应用、人工智能分析技术、大数据存储技术、大数据在医疗、金融方面的应用、数据科学的前景、以及大数据发展的战略目标等问题,鄂院士都一一耐心透彻地进行了精辟的回答和讲解。 作为北京大学元培学院的院长,鄂院士特别指出此行的主要目的,是来实地看望并了解深圳研究生院的师生和办学情况。介绍北京本部数据学科的建设情况,以及鼓励深圳研究生院在大数据方面的人才培养模式、培养目标上多做出一些创新并实质性的尝试。 鄂维南院士与深研院师生们热情交流,并在讲座之后与大家集体合影留念。会议圆满结束之后,谭文长书记陪同鄂院士参观了深圳校区并介绍了大学城办学的基本情况。感谢鄂院士的专程访问并期待他的下次到访。 鄂维南教授2011年当选中国科学院院士。1996年获得了美国青年科学家和工程师总统奖,1999年获得冯康科学计算奖。2003年获第五届国际工业与应用数学家大会科拉兹奖(Collatz Prize)。鄂院士的研究领域极其广泛,分布在数学、力学和理论物理的诸多方向,并均有重要的发现和贡献。他的研究把数学模型、分析和计算美妙地结合起来,并能对现实世界的重要现象提供新的见解。2014年11月7日,北京大学北京国际数学研究中心暨数学科学学院鄂维南院士研究小组在Science杂志上发表题为“Microscopic mechanism of equilibrium melting of a solid”的文章,报告了基于鄂维南和合作者所发展的稀有事件新型算法对于揭示金属固体熔化微观机理的研究。文章刊登在Science第346卷,北京大学是责任作者鄂维南院士的第一署名单位,研究得到国家自然科学基金委员会重大研究计划的支持。...
Read More

2015-2016学年科研沙龙(二)

      2015年5月18日互联网实验室全体同学在A栋118举行了科研工作分享交流会,主要是通过12级师兄师姐三年来科研学习以及上一段时间找工作经历的分享,让师弟师妹们对科研和工作有新的认识了解。一直以来互联网实验室的毕业生找工作的情况是非常好的,所以希望能够一直保持着分享会的传统,让最宝贵的一手信息可以惠及实验室同学们。       交流会总体分为两个部分,经验分享和提问环节。首先由12级师兄师姐轮流分享科研学习以及找工作方面的心得经验。12级同学的工作方向主要分为两类,一是互联网公司,二是国企。       互联网类公司,陈艺勇、严春伟、王嘉炜、虞龙熠、黄康贤师兄们做了详细的介绍。总结起来,首先选公司,最好奔着一两个公司去,简历不要海投,因为每个公司面试可能有3-4面,如果投了很多公司,自己忙不过来;待选定目标公司后,可以多上网看看面经,面经的问题其实经常会重复考,不要以为考过就不考了;互联网公司面试和笔试题想有提高,可以去刷leetcode,一开始做的时候可能觉得很难,但是多做就发现其实题型就那么多,要有耐心,要会总结。       国企方面,于倩和王慧钰师姐做了非常详细的介绍。大致包括简历投递的时候,要会美化简历,可以多看看别人的写得好的简历,模仿一下。另外面试的时候不要太紧张,因为通常国企对技术的要求没有互联网类公司高,学生们好好准备下,是可以通过的。于倩师姐还总结了一些单位的特点,王慧钰师姐建议大家国企的话,因为招聘的时间晚,不妨多投几个,万一前面的没有通过,起码后面的单位还有希望。       本来第二个提问环节穿插在第一个分享环节中进行了,大家聊得十分开心。       通过此次分享会的举行,大家纷纷表示受益匪浅。研一研二的同学对自己的学习和找工作的目标又有了更深一步的了解,分享会一直是互联网实验室的优良传统,希望可以一直传承下去! ...
Read More

2015-2016学年科研沙龙(一)

科研沙龙活动记录(一) 时间:2015.04.09 地点:A栋118室 主讲人:13级候超俊 12级严春伟 主持人:袁梦 参与人员:雷凯老师及13、14级实验室同学 活动内容:       清明小长假刚刚结束,大家好像还没有完全步入学习正轨,我们本学期第一次科研沙龙今晚成功举办,希望可以让大家在讨论中共同进步,学习别人分享的内容,从中汲取营养。       第一位主讲人是13级的候超俊同学,他主要的研究内容在NDN的拥塞控制方面。候超俊今天的题目为《The congestion control in network》,他首先简单地介绍了TCP协议,通过TCP中的有限状态机之间的状态变化来着重的介绍TCP中的七种定时器和TCP中连接的建立和销毁。接着提出目前TCP下的拥塞产生的问题,以及如何做好相应的拥塞控制。关于TCP中的拥塞控制,根据慢启动,拥塞避免,快速重传和快速恢复四个阶段分别介绍。最后他介绍了TCP下常用的拥塞控制算法,以及在NDN下做拥塞控制所带来的机遇和挑战。       候超俊同学生活中幽默风趣,大家可以结识一下这位逗A~哈哈~候超俊分享完毕之后,陶世博和马一宁同学提出了问题。       首先陶世博同学提出TCP建立连接的时候为什么一定要是三次握手,为什么两次不行?候超俊进行了回答:三次握手的最主要目的是保证连接是双工的,TCP连接中上行路线和下行路线可能是不同的,第一次和第二次握手是为了保证服务端能够接收到客户端的消息,并能正确应答;第二次和第三次握手是为了保证客户端能够接收到服务端的消息,并能正确应答;两次握手无法保证连接是双重的。       马一宁就图中的一个定义的问题提出了疑问:图中的knee和cliff是什么值,怎么定义的?对此候超俊进行了解答:图中的这两个值,是通过实验得到的,cliff是悬崖的意思,也可以看到在cliff那个地方之后明显降落了。       接下来是12级的严春伟师兄的讲授,他的主讲题目为《word2vec 原理和应用》。简单介绍了神经网络的相关原理。 之后着重介绍了从统计语言模型到神经网络语言模型的发展过程,以及Word2Vec的几种训练目标和训练方法。之后简单描述了深度学习的基础知识。       师兄讲完之后,刘辰巍、燕红磊提出了问题。严春伟师兄给出了解释,期间大家讨论的内容很多,希望可以从中有所收获。以下为问答对话:       刘辰巍问:word2vec与SVM-perf 都能够用来做分类,那从分类的效果上来看,哪一种会比较好呢? 严春伟答:这两种工具从作用上来看,前者,主要是用来学习词向量的,学习词的向量表示,在它的词向量的基础上进行分类和聚类,而且,学习的语料越多,则学习的效果越好。后者主要是用来做分类的,属于机器学习的一种工具,是一种监督式的机器学习的方法,分类效果比较明显,很难说哪种更好,但是,大家用SVM作为一种工具进行分类,是比较常见的。       燕红磊问:在词向量分类中,神经网络输入跟输出是什么?同时,Word2vec中的滑动窗口大小对结果有影响吗? 严春伟答:运用神经网络,输入是句子,输出是词向量,句子中词的顺序是有影响的。Word2vec中滑动窗口的大小对结果有影响。 附:获奖名单 优胜奖:候超俊 鼓励奖:严春伟 好问题奖:陶世博、马一宁、燕红磊、刘辰巍 PPT、活动录像存放地址:ftp://219.223.192.222/BigData/2015-2016year scientific research salon/first20150409/...
Read More

2014-2015学年科研沙龙(八)

科研沙龙活动记录(八) 时间:2014.12.22 18:30 地点:A118会议室 主讲人:钟尚儒 黄康贤 主持人:袁梦 参与人员:雷凯老师和13级、14级同学 活动内容:       钟尚儒同学介绍了Google开源的音视频聊天技术WebRTC,回顾了其历史由来和介绍了技术框架和底层实现。这是一个基于Web前端的音视频通信技术,Google将其开源,希望Web开发者能用简单的JavaScript API就可以开发基于浏览器(Chrome、FireFox等)网页的实时多媒体聊天应用,无需下载安装任何插件。开发者也无需关注多媒体额的数字信号处理(编解码、去噪滤波)过程,以浏览器为应用入口,一定意义上实现了应用的跨平台。同时在Google的努力下,WebRTC技术已经成为2014年10月正式发布的HTML5标准之一。       Google收购多家音视频引擎公司On2、GIPS(Global IP Sound)后,将其优秀的核心音视频引擎iSAC、iLBC、VP8等的代码通过WebRTC对外公开,同时也公布了多媒体传输模块、建立P2P通信的ICE框架(STUN+TURN),轻易实现NAT/防火墙穿越。这些模块的源码对于多媒体编解码、网络转发传输都有很好的学习价值。 Q&A摘录: (燕红磊)问:传统实时视频跟WebRTC的性能比较如何? 答:WebRTC只是做出了DEMO,并没有进行跟传统实时视频进行性能评估。 (陶世博)问:你调研WebRTC是想要做什么? 答:我研究WebCRT主要是为了实现通过浏览器进行视频会议和小组讨论之类的应用场景。虽然市场上有微信、QQ之类的视频语音通信软件,但这类软件功能比较繁杂,不够专一,并且都是基于客户端的,不如浏览器来的方便,所以调研了WebRTC。       黄康贤同学介绍的内容是在手游领域很火的开源2d游戏引擎cocos2d。使用cocos2d家族开发的游戏据说占据收入排行榜的80%以上。Cocos2d那么流行的主要原因有几点:1.Cocos2d把握住时机,在手游开发热潮爆发之前推出;2.Cocos2d是开源免费的;3.Cocos2d简单易用,并有很多配套的工具以提高游戏开发的效率。目前来说,cocos2d还是手游领域最热门的引擎,但是随着苹果推出自己的游戏方面的框架、以及3d手游的迅速发展,Cocos2d的前景充满了未知。 (燕红磊)问:Cocos2d实现了跨平台,是只用OpenGL,不用DirectX 吗? 答:一些Cocos2d版本OpenGL和DirectX这两种方式都实现了。       今天刚好是冬至,雷老师询问大家有没有吃饺子,同学们表示有吃饺子还有吃汤圆的。过了冬至,节气到来,冬季将进入最冷的时段,寒冷天气使机体御寒能力下降,虽然在南国,雷老师提醒大家仍然要注意保暖。 附: 获奖名单: 优胜奖:钟尚儒 鼓励奖:黄康贤 好问题奖: 燕红磊*2、陶世博 活动录像存放地址: ftp://219.223.192.222/BigData/2014-2015year scientific research salon/eight 2020141222/...
Read More

2014-2015学年科研沙龙(七)

科研沙龙活动记录(七) 时间:2014.11.24 地点:A118会议室 主讲人:张炜阳 翁魏涛 主持人:袁梦 参与人员:13级、14级同学 活动内容:       张炜阳同学介绍的内容是近期很火的开源项目Docker。Docker的核心是基于Linux Container的轻量级虚拟化技术。不同于传统的KVM、Xen等Hypervisor的虚拟化技术,Docker不需要在Host OS上再创建Guest OS,而是直接通过层次化的镜像,利用dockerfile就可以在容器中运行应用及其依赖。Docker通过image、container、registry三大组件分别实现了应用的build、run、ship。相信Docker会推动Container as a Service(CaaS)这一云计算新模式的进步,从而改变传统的应用开发模式。     Q&A摘录: (燕红磊)问题:Docker 能代替Hypervisor 吗?Docker能实现动态迁移吗? 答:Docker不能完全代替Hypervisor , 但是它实现了其部分功能,在某种程度上说比Hypervisor 更加强大,Docker可以实现容器迁移,这样就可以大大地分担了服务器的负担,实现容器共享。 (陶世博)问:docker是一个linux上的组件还是一个应用?docker中的命令是怎么执行的?你是怎么知道docker的? 答:docker是linux上的一个组件,在运行命令时,docker首先启动一个系统镜像,命令是在这个镜像中执行的,就像本地执行一样。我在做web开发时发现论坛中这个东西很火就学习了一下。 (唐浩)问:Docker与传统的VM有哪些不同? 答:传统的VM中每个app都需要调用自己的Guest OS中的API,而Docker中,每个app通过Dockers Engine调用Host OS中的API,效率更高。        翁蔚涛同学结合自身参加两次国际学术会议的经历,给大家介绍了参加国际学术会议的整个流程。主要包括参加会议之前的准备、会议的整个流程和参会的收获和意义。希望能够激发实验室同学们的科研热情和兴趣。     (杨林青)问:如果中了B类会议,需要在国外开,我们可以出国开会吗? 答:这个因情况而定吧,但是国内开的会议一般都是可以去的。 (刘涌斌)问:对于中稿的会议,由于没办法去现场参加,会议主办方有权撤销所中的论文,怎么办? 答:自己不能参加,可以叫别人代替参加,把自己的所要演讲的内容或Poster发个代替者。 (陶世博)问:apweb是哪类会议?为什么这么豪华? 答:apweb是一个C类会议,虽然是C类,但是文章质量还不错,apweb2014在长沙举行,去了好多学术界大牛,像韩家炜、方滨兴等,其他学术界的高校等科研机构也很多,所以就会高大上一点。       附: 获奖名单: 优胜奖:张炜阳 鼓励奖:翁魏涛 好问题奖: 燕红磊、唐浩、刘涌斌、陶世博(*2)、杨林青 活动录像存放地址: ftp://219.223.192.222/BigData/2014-2015year scientific research salon/six20141124/...
Read More

2014-2015学年科研沙龙(六)

时间:2014.10.27   18:30 地点:A118会议室 主讲人:唐浩  袁杰 主持人:袁梦 参与人员:雷凯老师和13级、14级同学 活动内容:       唐浩同学介绍的内容是NDNoT,named data networking of things。主要在NDN网络下实现 IoT(物联网系统),包括NDN网络与物联网相关的特性,IoT设备本身的特点,IoT系统架构上的问题,以及NDN所能提供的解决方案。从设备层面上看,将物联网系统运行在NDN下,可以大幅减小设备本身的负载,增加网络传输的效率。从系统架构上看,在NDN上实现IoT系统,可以在保证系统安全性的情况下,降低整个系统配置的复杂度。 Q&A摘录: (张轶航)问:路由方面NDN和现有网络有什么区别,最大的区别是什么? 答: TCP/IP的路由表需要预先配置,而NDN路由器的路由表可以通过洪泛法向所有接口转发Interest请求,然后根据Data返回的接口配置路由表。TCP/IP主要是实现两台远程主机之间的点对点通信,以主机为中心,数据总是在用户和内容源之间进行传输,即便中间节点有数据,这样就造成了数据的冗余传输并且效率比较低。NDN中,用户不需要从内容源请求数据,而是可以从拥有该内容的附近节点直接获取数据。消除了网络地址的概念,用户在获取内容的时候只关心内容本身。这样,有效降低了数据的冗余传输,避免了网络冲突和拥塞。同时,又因为消除了网络地址的概念,彻底解决了IP不足的问题。 (巩力睿)问:在ndn里怎么样才恩能够保证安全性,包括公钥私钥是怎么传输的,怎么分发,还有ndn的名字传输是否是明文的? 答:NDNIoT的访问控制是基于用户身份的,用户的密钥表明其身份。数据由对称密钥加密,对称密钥在管理员和用户之间共享,对称密钥经过用户的公钥加密,由管理员发给用户。用户本身的公钥私钥获取一般同当前TCP/IP网络下密钥获取的方案一样。 (刘辰巍)问:对于NDN网络物联网的这个应用中,对于in-network cache 的调度机制是怎样的,有效时间有多长? 答:调用机制有很多种,看具体的情况,基本上使用的是LRU的机制进行调度,有效时间也看该Cache的命中率,同时与大小也有关系。        袁杰同学主要介绍了专利申请的有关知识 ,包括专利的分类、专利的申请程序、PCT专利的概念、专利的审批过程以及专利申请文需要准备的文件。详细介绍了专利申请文件中的说明书的作用、撰写要求以及一些不合法的撰写实例。最后给出了部分免费的专利检索网站。 Q&A摘录: (唐浩)问:专利局中由谁来审批专利? 答:专利局内部有数目庞大的技术人员,检索数据库,对专利进行审查,涉及到专利冲突时会找到先前专利持有人或该公司的相关部门进行探讨。 (燕红磊)问:如何使用别人申请的专利? 答:如果该专利失效,则可以直接使用;如果该专利有效,若以科研为目的,可以直接使用,若以生产经营为目的,需要跟申请人协商,否则视为侵权。 (杨林青)问:如果一个技术可以用到不同的领域,那么这个技术是否可以在单独领域申请专利? 答:这是不成立的,因为对于专利最重要的是权利认证书,认证书只涉及实现的技术,而非领域,所以不可以。   附: 获奖名单: 优胜奖:袁杰 鼓励奖:唐浩 好问题奖: 张轶航、巩力睿、刘辰巍、唐浩、燕红磊、杨林青 活动录像存放地址: ftp://219.223.192.222/BigData/2014-2015year scientific research salon/six 20141027/        ...
Read More

新老生交流会成功举办

       为了欢迎实验室14级的小伙伴们,使他们尽快熟悉并融入实验室,对实验室生活、南燕生活有更加全面的了解和认识,实验室9月18日19:00在A118会议室成功举办了新老生交流会,参加此次会议的有雷凯老师、12级的4位师兄、13级和14级全体同学。         交流会上,雷凯老师首先为14级的同学介绍了实验室的基本情况,主要讲了实验室对大家科研、发论文的期望和要求,对平日的出勤以及同上届同学多多交流做了提及。接着12级的黄康贤、陈涛、虞龙煜、王嘉炜、13级的全体同学对自己之前以及现在的研究内容向师弟师妹们做了简单介绍,每个人介绍完毕之后,师弟师妹如有问题都做了相应的解答。虽然之前实验室中秋聚餐,可是一次的自我介绍,还是认不准新面孔,所以14级的师弟师妹又一一作了自我介绍,大家介绍完毕之后,进行最后一个——提问环节。          师弟师妹大多对实验室的科研方向、专利、论文以及研一的课程要求比较好奇,问题也大多是在这些方面,12、13级的同学都耐心做了解答,期间大家都很幽默,整个交流会洋溢着欢乐的气氛。          通过这次交流会的举办,希望能使实验室的同学尽快熟悉,增加同学之间的交流,促进同学之间的友谊,更好的科研,更好的生活! ...
Read More

2014-2015学年科研沙龙(五)

时间:2014年06月05日 地点:A118会议室 主讲人:沙文鹏,张宇骁 主持人:于倩 参与人员:雷凯老师、黄连恩老师、实验室全体同学 活动内容: 2014年06月05日,星期四晚19点,互联网实验室2014-2015学年第五次科研沙龙如期在会议室A118举行。参与本次科研沙龙的有雷凯老师、黄连恩老师以及实验室全体同学。本次科研沙龙由12级于倩主持,11级沙文鹏及13级张宇骁进行讲解。 11级沙文鹏同学的讲演主题为论文中的英语写作,主要关注点为论文写作中英语语法、句式、内容及表达方式等方面。首先,他针对论文结构中每部分应该注意的知识点以及会犯的错误进行总结,进而对每个总结的部分进行举例论证,通过具体实例告诉同学们应该怎样去改进和避免。他在讲演中更是强调论文摘要的重要性,论文应该写什么内容,重点放在哪里以及怎么样的句式和表达更合适。 Q&A摘录: (唐浩)问:是否存在论文写作的模板,我们可以将论文内容迅速嵌套进去? 答: 不像托福GRE写作的模板有很多,据我所知专门适用于论文写作的还没有,需要自己平时总结。 (李树一)问:分号在英文写作中重要吗?有必要专门掌握一下分号的用法吗?答:分号是一种停顿时间介于逗号与冒号之间的符号。文章采用许多分号能使其风格显得严肃、正式。还是有必要掌握一下的,否则相关的小错误出现的多了就很麻烦。 (王家祥)问:论文写作中不可避免的会遗留一些错误,审稿人对这些错误的容忍程度有多大? 答: 什么时候会影响论文内容的阐述?答:中国人写英语论文错误不可避免,到肯定要尽量少犯错误 张宇骁同学主要讲了一种对于k-means计算的改进算法,算法利用信息检索领域中的倒排索引和wand技术,有效地减少了原k-means算法中非常耗费时间的相似度计算过程,同时,由于wand算法是用来找相似度最大的N个文档,算法为了避免选取的点太少而使得中心点的收敛过慢,在计算中保留了所有参与过wand栈的数据点,来一起计算中心点,相当于一种比较完善的取样。最终,算法得到了比传统k-means快70到100倍的速度提升。尤其是在大文档计算的时候,很明显。 Q&A摘录: (吴迪)问:有没有考虑通过分布式并行平台来提高K-Means算法的速度? 答: 考虑过,不过目前的数据量单机还是能够处理的,所以不太需要。 (王如慧)问:传统的已不适用的算法,是如何进行相似度计算的? 答:就是整个文本中的词一个一个匹配,举例:若文本一和二都含有两个单词“美元、汇率”,先比较美元,发现两个都有,则有50%相似,再匹配汇率又一样,则有100相似……。其实,就是用cos计算的方式,计算两个空间向量的距离。 (唐浩)问: 为什么一个算法可以提速10~100倍? 答: 因为之前的算法存在冗余计算的问题,这种算法提供了精简,所以能够大幅提高运算速度 附: 获奖名单: 优胜奖:沙文鹏、张宇骁 好问题奖: 吴迪、李树一、唐浩、王家祥、王如慧 PPT、活动录像存放地址: ftp://219.223.192.222/...
Read More