第(2/3)页 张莎莎因为不喜欢刘岁安,向来和他不对付,故而不会在意他带了个什么东西回来。 刘岁安调试代码心切,没有和任何人交流,忙不迭坐到服务器前的椅子上,打开代码编译器,把代码一行一行地展示给白泽看。 在路上时刘岁安从白泽口中得知,集成在耳环上的‘感知器官’,包括视觉传感器和雷达,这意味着白泽可以‘看’到这个世界。 见白泽一直没有出声,他逐渐加快了鼠标滑动的速度,不然这几千行代码要看很久。 人间一秒,计算机一年。 白泽作为高等智能,运算速度应该很惊人,这个速度不在话下。 终于,代码划到最后一行,刘岁安绷紧身子坐好,略显紧张地等待白泽开口。 “人脑神经是离散的信号传导,而你的神经网络建模的是连续可导空间,或者说目前你们绝大部分神经网络都是这样,其实不能叫神经网络…… Vit模块那里的多头自注意力机制倒是有点意思,不过效率太低,看你的代码,似乎是想降低运算的复杂度,但是没有调试完成…… 这里局部特征的提取使用深度卷积就可以了。键值对通过线性层直接提取到低维,优化的方向没错,但是Q和K投影的方式有问题……” 白泽一张嘴,刘岁安就听出来她没有吹牛,是真的有点东西。 至于东西多不多,要等代码改完看实验结果如何。 在她的指导下,刘岁安编码完成了核心创新部分的代码。 “这个注意力机制是不是应该取个新名字,叫Suian Attention怎么样?”刘岁安开玩笑道。 “你足够不要脸的话,当然可以,不过白泽的建议是叫Ultra Efficient Attention,简称UEA。” “……挺好的。” “结构改完,参数也需要调整。初始学习率设为0.025,weight-decay减半,为防止过拟合,num-heads降为4就够了……” 刘岁安通通照做。 …… 实验室另一边,张莎莎表面上在看手机,实则在用余光关注‘自言自语’的刘岁安。 “该不会是实验做不出来,疯了吧。” 她想到这个可能性,看向刘岁安的目光不禁多了些怜悯。 张莎莎和刘岁安之间的过节其实很儿戏,起因是很久之前一个学妹喜欢后者。 当时刘岁安对那个学妹没有任何发展的想法,不知道怎么拒绝合适,随口谎称自己是弯的,想让对方不要来打扰自己。 学妹被拒绝后还想和刘岁安成为好朋友,后来知道了真相,差点抑郁了。 张莎莎是东南大学的少年班,和刘岁安的学妹恰好是室友,知道此事后,自然对刘岁安没什么好脸色。 张莎莎不愿意指导刘岁安,还有另一个原因。 刘岁安觉得张莎莎做的研究太偏工程,属于实验报告,没有学术意义,而张莎莎觉得刘岁安眼高手低,对自己的水平没有逼数。 因此,刘岁安毅然决定靠自己一个人搞研究,从此和张莎莎交流极少。 二者之间的芥蒂终归是小打小闹,张莎莎联想到刘岁安最近经常独自去天台,心中浮现出一些不好的念头。 刚好见吊儿郎当的韩启明回到实验室,张莎莎将其唤了过来。 …… 刘岁安正在修改代码,忽然从后面伸出一只手,轻轻拍了拍他的肩膀。 “生活不止眼前的研究,还有诗和远方,没必要一叶障目。”这是韩启明的声音,玩世不恭的语调很有辨识度,“冀……哥们,吃不吃雪糕。” 一支雪糕递到眼前,刘岁安接过,开口道谢:“谢了。” 他扭过头瞄了眼韩启明,不知道对方为何反常地找上自己。 有韩启明在身旁,刘岁安暂时停止了和白泽的交流。 第(2/3)页