DeepSeek R1 Paper Reading
文章链接:https://arxiv.org/abs/2501.12948Cool Paper Link:https://papers.cool/arxiv/2501.12948文章内容较为通俗...
文章链接:https://arxiv.org/abs/2501.12948Cool Paper Link:https://papers.cool/arxiv/2501.12948文章内容较为通俗...
上文提到,研二之时,老板开始给我们分配一些合作公司的项目,一方面当做横向,大家都能赚到点小钱,学生获得了还算可观的劳务费,老板们拿到了经费和名声,简直是winwin。不过事情总不是那么一帆风顺的...
书接上文,大抵是openai放出了神奇的ChatGPT,导致我组的组会周期失调,并且那年2022年底,正是疫情放开的关键节点,因此突然忙碌的研究生生涯就节奏慢了下来。2022年12月份,本来还跟...
写在学生生涯的最后一段时光,仅以此铭记我没有那么丰富的旅程。写到哪里算哪里,本来就不是太会抒情的人。研一的时候刚进来,最会写的语言是JavaScript,天天看点前端小新闻,开心的不得了,Pyt...
背景最近在搞一个视频相关的项目,需要用到视频处理库,目前开源的视频工具例如 moviepy,Katna 关键帧抽取库等,都依赖于 OpenCV 的 Python 环境。而 OpenCV 的 Py...
由于存储相关的代码限制,目前问题数据只能存储在 LeanCloud 的数据仓库中,等过一段时间,我考虑用 Vue 和 Nuxt 重写整个项目, Next 还是不太好用。首先,需要在服务器上安装好...
我们要解决的问题是:一个文本经过前置的分词处理之后,送入一个语言模型进行预测,需要以一个什么样的形式输入?显然,直接使用文本不是很合适,因为我们的模型实质上就是一个超大型的函数,函数上的参数描述...