更多精彩内容微博持续更新中 @北大互联网中心CIRE
时间:2013年11月04日
地点:A118会议室
主讲人:寻云波、王慧钰
主持人:于倩
参与人员:雷凯老师、黄连恩老师、实验室全体同学

活动内容:
第一位主讲人为13级的寻云波同学。 主要讲解了ACM/ICPC和Coding,参考了《ACRush回忆录》和自身的ACM/ICPC以及做题的经验,对ACM/ICPC进行介绍以及相关的比赛和题库介绍推荐,分享相关的经验。虽然实验室同学在ACM竞赛上的历史参与度不高,但是通过这次的讲解同学们可以了解到一些经典赛事、竞赛过程的一些技巧以及较好的参考资料。同时雷凯老师也鼓励大家多多参与ACM等高水平竞赛,提高自己在算法理解度以及问题深入度的思考,也为以后找工作做好准备。“好问题奖”确定为13级的王家祥、张宇骁以及12级的陈艺勇。


Q&A摘录:
(陈艺勇)问:对于没有参加过ACM的同学,有什么对应ACM讲解的书籍或者资料?
答:清华大学刘汝佳老师的《算法艺术与信息学竞赛》,又叫黑书,可以参考,有对应的各种常用算法及例子,不过实际动手参加在线比赛,交流学习的方式会更好。
(王家祥)问:ACM竞赛中的特殊测试样例参赛者应该怎样去选取,有没有专门的选取特殊样例的网站?
答:主要是清楚的理解问题,找到临界数据,平时多练习,类似的网站还没有,一般题库里的测试样例都会包括比较特殊的一些样例
(张宇骁)问:关于acm算法比赛,有什么好的网站可以看参赛者对题目的见解吗?
答:许多算法比赛后面有交流论坛,GCJ还有官方解析

第二位主讲人是12级的王慧钰。主题是情感分析。综述了现阶段中文微博情感分析的主流方法:无监督算法和基于SVM/NB分类器的机器学习方法,总结汇报了针对主题相关和主题无关两类任务的实验结果。目前在针对中文的情感分析工作仍然处于研究阶段,相比于英文的效果并不是很好,所以雷凯老师在点评时提出应找到一个比较具体细化的方向进而针对主题性的情感分析挖掘。获得好问题奖的同学:欧阳陶旭、马一宁和王如慧。
Q&A摘录:
(欧阳陶旭)问:统计显示,对中文的情感分析准确率不高,请问这项方法有什么实际作用?
答:在一些特定文本领域,如商品评价系统,可以较为准确的提取分析内容并达到很好的效果。
(马一宁)问:对于微博的有监督的情感分析技术一般要经过分词、特征提取然后训练,那现在的中文分词工具针对微博效果怎么样?另外,现在针对微博有没有比较好的情感词典?
答:一般要经过分词、特征提取然后训练,那现在的中文分词工具针对微博效果怎么样?另外,现在针对微博有没有比较好的情感词典?
(王如慧)问:在特征值提取那块,两种特征都提取了链接,这个链接在情感方面有什么作用?
答:这个特征加上去之后,会构成识别率降低;但是在主客观分析上还是有作用的 。

按照科研沙龙流程,在座的每一位观众都对两位主讲人的报告从内容、演讲、回答等方面进行了投票。最终寻云波获得12票,王慧钰11票,寻云波获得了优胜奖,王慧钰获得鼓励奖
附:
获奖名单:
优胜奖:寻云波
鼓励奖:王慧钰
好问题奖:王家祥、张宇骁、陈艺勇;马一宁、王如慧、欧阳陶旭
PPT、活动录像存放地址:
ftp://219.223.192.222/ 2013-2014学年科研沙龙/第二次 20131104