最近换了新电脑,开始对新电脑进行了一些基础的配置。由于一些学习上的需求,我需要基于Linux环境写一些c++代码。但是常见的虚拟机软件都需要收费,因此我只能将目光转移到了Docker上。这篇博客主要记录了如何使用docker拉取ubuntu镜像并使用ssh连接容器进行简单的开发工作。

阅读更多

《Deberta: decoding-Enhanced Bert with Disentangled Attention》,该论文来自 ICLR2021,作者团队为微软,主要介绍了其提出的一个新的预训练语言模型:DeBERTa,该模型从注意力解耦(disentangled attention)和预训练阶段的解码增强两方面对BERT类预训练模型进行了优化,并在SuperGLUE上首次超越人类基准。

阅读更多

Transformer 是 Google Brain 发表在 NIPS2017 的论文《Attention is all you need》中提出的模型,随着深度学习的火热,基于Transformer的预训练模型已经席卷 NLP 领域,足见Transformer的重要性。 本文将按照这篇论文的顺序并结合一定的代码进行解读,但会调整论文中某些部分的顺序。

阅读更多

在ubuntu server上安装nvidia驱动以及cuda是件很令人头疼的事,但幸运的是,nvidia官方推出了CUDA Toolkit安装包,我们可以使用它直接安装显卡驱动和cuda toolkit工具包。但不那么幸运的是,这样做在一些服务器上是成功的,但在另一些服务器上又是失败的。这不禁引发了我的一些思考。经过了半个晚上的问题排查,共总结了以下几个问题来源。如果你也遇到了这个问题,希望这篇文章能帮助到您。

阅读更多

给定一个包含n个整数的数组num和一个目标值target,判断nums中是否存在四个元素a, b, c和d,使得a+b+c+d的值与target相等?找出所有满足条件且不重复的四元组。答案中不可以包含重复的四元组。

阅读更多

Your browser is out-of-date!

Update your browser to view this website correctly. Update my browser now

×