读研尾迹-其三

请注意，本文编写于 151 天前，最后修改于 134 天前，其中某些信息可能已经过时。

上文提到，研二之时，老板开始给我们分配一些合作公司的项目，一方面当做横向，大家都能赚到点小钱，学生获得了还算可观的劳务费，老板们拿到了经费和名声，简直是winwin。不过事情总不是那么一帆风顺的，由于我接受的不是一个全新的项目，因此有许多需要和前任维护者反复沟通的情况，真的是很痛苦啊哥们。

不过还好，前人维护者是我的师姐，就坐在我工位的后面，日常沟通和干活也挺方便的。

除了帮老板干活以外，其实我自己还是想做一些有价值和有意义的工作的。23年的6月份左右，还处在一个大模型迅速发展的初级阶段，国内的大部分开源模型还都笨笨的，闭源模型也强不到哪里去，跟伟大的 GPT 爷爷相去甚远。

我想做的第一件事情还是从老板给的项目出发，做点小小的创新，然后用这个小创新去发篇论文，差不多在23年年底的时候做了一个效果出来，发现在项目的测试集上效果还挺好的，比之前的对照实验强得多，但是呢由于实验的不严谨和我对这个方法的不自信，导致一直拖着没有做完整的实验，之后过了大半年，看到达摩院的大佬发了篇文章，思路跟我的小创新非常相似，但是看他的实验结果真是无语，性能跟我跑出来的差了不少。

但是，您猜怎么着，人家的实验结果是 Zero-shot 跑出来的，我对比的时候看岔了，没意识到这个巨大 gap，导致后续我做的实验跟他完全没有可比性，诶呀那我真是一整个五雷轰顶，天打雷劈。

也罢，不谈这学术上的苦难，我觉得我跟发论文是无缘了，把一个鸡毛蒜皮的创新点，吹得震天响，我是做不到的，人家定会个个做 sota，做时代潮流的引领者，怎么比啊，没法比呢。

添加新评论

评论列表

读研尾迹-其三

DeepSeek R1 Paper Reading

DeepSeek R1 Paper Reading

添加新评论

评论列表