一句话概述：Dropout 增益句子 Embedding。

摘要：本文提出一个简单的对比学习框架，极大地提高了句子的表征能力。首先是无监督的方法，使用一个输入句子，在对比目标中预测自己，这里仅使用标准的 dropout 作为噪声。接下来将 NLI 数据集中的标注对合并到对比学习中，“蕴涵”对作为正例，“矛盾”对作为负例。最后，论文还发现对比学习在理论上能够将预训练 Embedding 的各向异性空间正则化，使其更加均匀，而且有监督信号可用时，可以更好地对齐正例对。

高效深度学习：让模型更小、更快、更好

论文：[2106.08962] Efficient Deep Learning: A Survey on Making Deep Learning Models Smaller, Faster, and Better

Code：reddragon/efficient-dl-survey-paper: Efficient Deep Learning Survey Paper

一句话概述：一份实用的模型训练和部署「优化」指南。

机器之眼：树莓派摄像头

如果把树莓派比作机器人的大脑，那么摄像头相当于机器人的眼睛，我们需要使用摄像头不间断获取图片或视频流，然后通过图像识别技术判断「眼前」的物品/人，进而做出一些响应。目前已调通，可以通过摄像头获取实时画面，所以赶紧记录一下。

Unix Cheat Sheet

Unix & Linux 相关备忘。

机器之脑：树莓派初使用

拖延症太厉害了，这次终于下定决心要把自己一直想做的小弟（同时兼小秘）给做起来，什么时候做好不知道，但不能不开始。第一步要整的就是大脑，用一块树莓派承载，里面慢慢给灌上各种软件和模型。本文主要整理记录树莓派初始配置操作，主要针对的是远程 ssh 无屏幕连接无桌面版树莓派（4B），请注意限制条件，其他的操作也类似。

预训练模型的过去、现在和未来

Paper：[2106.07139] Pre-Trained Models: Past, Present and Future

Code：无

一句话概括：如题；）

Python 调用 Java

一直以为这样的情况不会出现，但它还是出现了：一段 Java 代码+引用 Jar 包，一段 Python 代码要使用 Java 代码中某个方法。本来想用 Python 重新实现一遍，又觉得这简直是浪费时间，何不直接在 Python 代码中使用 Java 代码的该方法呢？应该特别简单，分分钟搞定的事情，结果还是掉坑里了，特此记录，以备后查。

对NLP预训练模型的思考

最近连续读了两篇关于 BERT 学习机理的文章，略有所感，记录如下。

预训练模型本质是利用输入数据本身内在的结构进行学习，从自然语言处理的角度看，就是充分利用自然语言文本的上下文去学习到文本的表征。

Jupyter Notebook Cheat Sheet

Jupyter Notebook 的相关备忘。

Few-Shot NER and BERT Noisy Learning：ProtoBERT Paper Note

Paper：2105.00828 BERT memorisation and pitfalls in low-resource scenarios