2013年12月12日,晚7点)互联网实验室2013-2014学年第四次科研沙龙活动于A118会议室如期举行。此次科研沙龙由12级于倩同学主持,出席人员包括,雷凯老师,黄连恩老师以及实验室全体同学。

本次科研沙龙的两位主讲人分别是11级的柳胜兵和张凯同学。在上学期的科研沙龙活动中,两位分别针对自己的研究领域做了讲解与报告。而通过这段时间的积累,他们又利用此次科研沙龙为大家分享各自的心得。其中,柳胜兵分享的主题为:“搜索中的query理解”,而张凯则为大家讲解和演示了Git的使用以及平时小组在开发过程中应该注意的细节。

柳胜兵同学讲解的内容包括:为了解决用户输入错误的查询纠错,为了提高召回而做的查询重写与扩展,为了解决query和document之间语言语义鸿沟实现的多重匹配模型等等。主要强调了query log挖掘在搜索中的重要性。参考的文献包括 Online spelling correction for query completion、Spelling Correction for Search Engine Queries Click through-Based Translation Models for Web Search、Automatically mining question reformulation patterns from search log data、Query Reformulation Using Anchor Text。讲解结束后,在座的同学都进行了深入的思考与讨论。同时黄连恩老师也针对柳胜兵同学在讲述过程中的不足进行了指导,希望其在每次presentation过程中放慢语速,这样更容易让听众知道讲演者所要传递的信息。

Q&A摘录:
(张宇骁)问:关于查询意图的猜测,如果我手动打上 “北京大学 官网”,百度会不会理解我的意思?百度做了实体搜索吗?
答:这方面正在做。实体搜索这方面google做得很好,但百度也有做,一些基本的类比眼下是可以实现的
(于倩)问:查询意图是针对个人的行为还是针对query内容的延伸?
答:在针对query的基础上,进行个体化的分析。
(张志明)问:在意向推断过程中,query太短怎么处理?
答: 对于比较短的query会根据用户的历史搜索行为来识别或者是通过一些规则来判定


张凯同学继上一次wiki 分享后,此次主要从Git 的发展,Git 的工作原理,Git的好处及Git 的使用这几个方面做了介绍。最后通过实验室的Git 平台现场进行操作和模拟,帮助大家将抽象概念转为实际应用。在讲演过程中,雷老师也对Git 与SVN的区别和联系与张凯进行了讨论,并鼓励大家在团队开发过程中多进行组内交流,从现在开始注重团队合作能力的培养。通过此次讲解,同学们从概念上大致明白了Git的使用,但张凯建议大家此次沙龙结束后每个人实地应用一下实验室Git 的平台,遇到任何问题可以随时找他进行交流。13级的同学在Q&A环节中表现积极,最后寻云波、袁杰、李树一、吴迪获得了好问题奖。

Q&A摘录:

(吴迪)问:Git上如果两个人修改了同一个文件里面的内容,都提交了,会怎么样?
答:Git系统会先检查两次修改是否冲突,如果不冲突,就把把两种修改都提交,否则会给用户提示信息,让用户采取措施
(寻云波)问:google code和Github的区别:
答:Google code使用的是svn仓库,然后很容易被墙,Github不被墙。现在大多数的项目代码托管都托管Github上。
(袁杰)问:除了用git clone命令,还有没有其他方法从服务器上得到git仓库里的源码?怎么把github上的源码文件迁移到实验室的服务器上?
答:可以通过打包下载的方式获得源码,一般的服务器,比如github和实验室的git服务器都实现了打包下载的功能. 可以先通过git clone的方式从github上获得源码文件,再将文件从本地push到实验室的服务器上。
(李树一)问:Github 与Git 的关系,应用Github 有什么好处?
答:Github 相当于一个中心,用户可以将自己通过Git管理的代码放到Github 上,一方面可以资源共享,另一方面也在一定程度上加强了相同爱好者之间的交流。

更多精彩内容微博持续更新中 @北大互联网中心CIRE

附:
获奖名单:
优胜奖:张凯、柳胜兵
好问题奖:张志明、袁杰、吴迪、张宇骁、李树一、寻云波
PPT、活动录像存放地址:
ftp://219.223.192.222/ 2013-2014学年科研沙龙/第四次 20131212