[ 自然语言处理 ]
Style Transfer in Text: Exploration and Evaluation
@zhangjun 推荐
Transfer Learning
本文尝试在用 non-parallel data 来做文本的 style transfer,已被 AAAI 2018 录用。
论文链接
https://www.paperweekly.site/papers/1177
An Encoder-Decoder Framework Translating Natural Language to Database Queries
@zhangjun 推荐
Natural Language Generation
本文用端到端框架将自然语言转换为 SQL 语句,并在学术搜索和电影搜索问题上进行了实验。
论文链接
https://www.paperweekly.site/papers/1147
Aggressive Sampling for Multi-class to Binary Reduction with Applications to Text Classification
@guotong1988 推荐
Text Classification
把多分类问题转化成二分类问题,10000 多个类别的文本分类,多个指标 SOTA。
论文链接
https://www.paperweekly.site/papers/1184
[ 计算机视觉 ]
MegDet: A Large Mini-Batch Object Detector
@chenhong 推荐
Object Detection
旷视科技新出的一篇论文,作者主要提高 batch size 实现目标检测,GPU 也是相当大的,128 个 GPU,也不是一般公司能干的起的。
论文链接
https://www.paperweekly.site/papers/1202
Interpretable R-CNN
@Synced 推荐
Object Detection
由于深度学习已经在需要做出重大决策的领域如安防和自动驾驶中得到越来越广泛的应用,深度网络的可解释性称为愈加迫切的需要。北卡罗来纳州立大学与阿里巴巴 AI 实验室的研究人员近日提出了一种聚焦于目标检测的定性可解释的 R-CNN 网络,实现了未来人机对话的开端。
论文链接
https://www.paperweekly.site/papers/1215
What is the Role of Recurrent Neural Networks (RNNs) in an Image Caption Generator?
@jamiechoi 推荐
Image Captioning
文章比较了 RNN 在 image caption 里的两种作用:1. RNN 用来 encode 文字和图片;2. RNN 只 encode 文字。
论文链接
https://www.paperweekly.site/papers/1200
[ 机器学习 ]
MinimalRNN: Toward More Interpretable and Trainable Recurrent Neural Networks
@paperweekly 推荐
Recurrent Neural Networks
本文提出了一种更加简洁的 RNN 模型,实验证明可以捕获到更加长程的依赖。
论文链接
https://www.paperweekly.site/papers/1192
SafePredict: A Meta-Algorithm for Machine Learning That Uses Refusals to Guarantee Correctness
@Synced 推荐
Distributed Machine Learning
SafePredict 是一种新型元算法,可以使用拒绝机制保证正确率,其错误界限不依赖于任何关于数据分布或基础预测器的假设。该算法与顶尖的基于置信度的拒绝机制相比更有优势,可以更鲁棒地保证正确率,并减少拒绝的数量。
论文链接
https://www.paperweekly.site/papers/1179
Exploiting Dining Preference for Restaurant Recommendation
@LiFeng 推荐
POI Recommendation
- 微软亚洲研究院+中科大的组合,强强联合,专门做推荐的,几位作者都是专家,网上都有主页的,建议看看,这篇文章本身是发表在WWW 2016上的;
- 文章考虑显示反馈(评分,评论)、隐式反馈(餐馆签到数据)、上下文数据(地点、用户人口统计学信息、餐馆的属性等),综合考虑用户的进餐偏好,最终给用户生成推荐列表;
- 对隐式反馈建模时,考虑用户-地点-时间3维张量,采用张量分解的方法,并加入上下文因素进行提升;
- 对显示反馈建模时,使用主题模型+矩阵分解方法;
- 最后将隐式和显式反馈融合;
- 文章数据集是使用微软的 LifeSpec 从点评上爬下来的餐馆数据和签到数据,但是未在论文中公布,数据分析进行的很详细,最后只用了 Recall 作为评价指标,个人认为略显单调,不过他在文中说了不使用 Precision 的原因;
- 文中涉及到比较多的数学知识,比如各种高斯分布和隐狄利克雷分布;
- 个人拙见:要是能和 NTU 那样开源论文代码就更好了,当然也有可能考虑到涉及研究机密不开源也是可以理解的。
论文链接
https://www.paperweekly.site/papers/1188