上文提到,研二之时,老板开始给我们分配一些合作公司的项目,一方面当做横向,大家都能赚到点小钱,学生获得了还算可观的劳务费,老板们拿到了经费和名声,简直是winwin。不过事情总不是那么一帆风顺的,由于我接受的不是一个全新的项目,因此有许多需要和前任维护者反复沟通的情况,真的是很痛苦啊哥们。
不过还好,前人维护者是我的师姐,就坐在我工位的后面,日常沟通和干活也挺方便的。
除了帮老板干活以外,其实我自己还是想做一些有价值和有意义的工作的。23年的6月份左右,还处在一个大模型迅速发展的初级阶段,国内的大部分开源模型还都笨笨的,闭源模型也强不到哪里去,跟伟大的 GPT 爷爷相去甚远。
我想做的第一件事情还是从老板给的项目出发,做点小小的创新,然后用这个小创新去发篇论文,差不多在23年年底的时候做了一个效果出来,发现在项目的测试集上效果还挺好的,比之前的对照实验强得多,但是呢由于实验的不严谨和我对这个方法的不自信,导致一直拖着没有做完整的实验,之后过了大半年,看到达摩院的大佬发了篇文章,思路跟我的小创新非常相似,但是看他的实验结果真是无语,性能跟我跑出来的差了不少。
但是,您猜怎么着,人家的实验结果是 Zero-shot 跑出来的,我对比的时候看岔了,没意识到这个巨大 gap,导致后续我做的实验跟他完全没有可比性,诶呀那我真是一整个五雷轰顶,天打雷劈。
也罢,不谈这学术上的苦难,我觉得我跟发论文是无缘了,把一个鸡毛蒜皮的创新点,吹得震天响,我是做不到的,人家定会个个做 sota,做时代潮流的引领者,怎么比啊,没法比呢。