下一章 上一章 目录 设置
3、算法 Sil ...
-
Silver这个ID,但凡在论坛注册了账号的人都多少有所耳闻。
Quanta Overflow的数学专区元老级大神,八年前凭借《高维粘性Hamilton-Jacobi方程的整体解》一篇文章一战封神,直接成为论坛技术区版主,但本人非常低调神秘,从不参与论坛线下学术交流活动——据知情人透露,Silver本人是一名学者,在国际数学家大会上也有一席之地。
“给个位置,让我看看大神写了什么。”叶晓白噌的一下闪到笔记本电脑边,把周瑾河轰开,“吃你的饭去。”
见色忘友……周瑾河叹了口气,很不乐意地挪动尊臀,坐到边上开始吃饭。
叶晓白把帖子拉到正文部分。
“Silver:过去两年,“双层正则化”被广泛应用在最优传输、高维稀疏矩阵分解、甚至部分生成模型中。其优点很明显:一是小规模下能快速收敛;二是参数选择相对稳定;三是结果具备一定可解释性。”
“Silver:但是,双层正则化带来的问题也同样致命。当维度超过时,解对初始值和噪声过于敏感,稍微扰动就会彻底失控;并且,现有求解器大多依赖启发式,没有任何收敛保证。”
“Silver:更重要的是,现在所谓的“双层”,本质上只是“单层问题+附加约束”,并不是真正的层次结构。”
叶晓白心里一沉,隐约觉得摸到了什么东西的边界。他往下看,后面是大量公式和复杂的案例论证,简单略过论证后,他直接跳到了Silver加黑的内容。
短短一句话,带着爆炸的信息量,映入眼帘。
“Silver:换句话说,我们可能一直在修补一个伪问题。”
*
Edrant,Trinity Hall
顾辰合上电脑,起身倒了一杯咖啡。
此时Quanta Overleaf的论坛后台已经掀起轩然大波,引发讨论的始作俑者却退出账号,淡定地从狂风暴雨般的信息洪流里抽身而退——他似乎一直以来都是如此,不参加线下学术会议,不参加任何交流论坛,连克拉兹奖的颁奖典礼都是旧友出面代领——除了普林斯顿高等研究院的几位故人,几乎没人知道“陈九言”到底是一位怎样的学者。
Trinity Hall的老院长Scott先生在邀请他加入Edrant、执教应用数学系时,曾劝他收几个学生——胡子花白的老院长难得挤出了好几顿下午茶的时间,语重心长地和他谈话。
“顾,你能独立完成很多事情,我承认。但学术不是一个人的马拉松,跑得再快也终究有限。你需要有人接棒,哪怕一时跟不上你,但培养着培养着总能继承思路。”
老院长顿了顿,意味深长:“一个总是独来独往的教授,容易让人怀疑身上有什么秘密——顾,带个学生吧,学生是你最自然的掩饰。”
顾辰记得自己当时没回答,用沉默当做婉拒。
独来独往简直是理想的状态,不受任何人干扰,也没有必要的社会牵绊,即便失联,他人也只会觉得习以为常。
又何必产生多余的联系?
一阵铃声响起,顾辰扫了一眼,是来电通知,他随手接起。
“您好,是Chen Jiuyan先生吗?”
顾辰应了一声,对方的语气变得谨慎起来:
“非常抱歉打扰了。我是Barclays银行的地区经理,我们注意到,昨日您转出了五万英镑到‘Ye Xiaobai’先生的账户中,而您与对方似乎并没有直接经济往来。我行想确认一下,这是否是您本人的操作?”
“是我本人,”顾辰答得很简短。“Ye是我所属学院的学生,这是他应得的奖学金。”
“好的,后续我们会为Ye先生说明,再次为贸然来电致歉。”
电话挂断,办公室再次陷入一片死寂。
没来由地,他打开桌边抽屉,抽出那张写了厄农映射草稿的纸巾。
手指在笔迹上无意识地摩挲着,思绪回到早上的初见。
在LEAF打工的年轻学生比简历照片上的模样更生动。深棕色微卷短发,戴着一副圆框眼镜,眼睛年轻而明亮,整个人带着“生在红旗下长在春风里”的正气,偏偏又生了一副万万人中能抓住他目光的俊逸面孔,令他移不开眼。
叶晓白么……
*
“Silver重新上线了!”叶晓白狂摇周瑾河,摇得后者差点把刚咽下去的番茄炒蛋喷出来。他还没来得及放下筷子,就见叶晓白已经埋头沉浸在论坛里。
Silver不常在线,大多时候只是昙花一现地发个帖子更新研究进度或学术思路,引得众人一阵关注,而后便下线消失。
叶晓白刷新了一下帖子,发现大神的主贴还有后半段,之前被评论隐藏在底下。
“Silver:对此,我的直觉是——我们需要一种‘约束内生化’思路。约束不应作为外加条件,而应融入学习过程本身;训练中,约束与目标应同步优化,而不是先后分层,并且内外目标不再是主次,而是统一整体。从理论上,这意味着跨层结构=单层可优化问题+动态约束嵌入。”
“Silver:如果能做到这一点,所谓的“双层正则化”可能不再必要——相反,它会退化成一种更简单、稳定、强大的结构。”
底下回复已经炸了锅,这一条帖子炸出了不少应用数学相关的PhD,也有不少最优传输理论相关的研究者加入讨论。叶晓白顺手点进评论区。
EulerChild:
“我赞同S神。上个月跑了十万数据,外层目标几乎完全不可控,结果随机性比理论性强。”
Voidink:
“Agree.”
当然也有怀疑的声音。
MatrixFan:
“推翻整个方向?很多人都在做双层研究,这会不会有些武断?”
这一条回复下面有不少分歧,周瑾河也凑过去看,大部分言论都是围绕着现有双层正则化的研究方向进行讨论,但也有不和谐的挑刺者。
-DarkLagrange:
“那你的替代方案呢?别光说批判。”
-Silver(3分钟前):
“有些问题,不在答案,而在问法。”
这条简短的回复让整个楼层瞬间安静,顶帖无数,但无人敢再硬杠。
周瑾河见状不由得发出感叹:
“Silver……太酷了。诶,说起来,去年那位ICAM克拉兹奖的得主就是研究最优传输理论的,如果他俩有幸遇见,感觉会聊得很投缘。”
他感叹完,突然联想到叶晓白书架上那一排与概率论和算法相关的书籍,半开玩笑半是认真地打趣:“喂,小白,你最近不会是在琢磨最优传输理论优化算法吧?要真是的话,早点抱Silver大神的大腿啊。”
叶晓白怔怔地看着那一句三分钟前的回复,心口像被轻轻撞了一下。
他下意识切回到自己写了一半的算法界面。屏幕上,数千行代码在编写界面层层堆积,像一座未完工的积木塔,已经搭出骨架,却始终缺少那个让结构稳定下来的“关键拼块”。
专业算法开发者需要有极强的数理敏锐度和将思路编写为算法的优秀代码能力——而思路的变革往往是整个算法构建中最难的一部分。人类从石器时代的击石取火,到在反复快速的钻取中发现摩擦可以使得木制工具升温,最终发现钻木取火的方法,这个思路迭代的过程,用了整整数千年。
叶晓白之前的想法很直接——把最优传输问题当成一条复杂的“搬运路径”去算,每一步都严格控制,力求把成本压到最低。但这样写出的算法,效率总是被拖得很慢,就像是堆叠大量算力资源,在迷宫里一步步试出正确答案,笨拙得很。
而Silver的那句话——“不在答案,而在问法”,一语惊醒梦中人。
与其在既定路径上死磕,不如换个角度,把“路径”重新表述成一个更高层次的函数。如果能在上层就找到统一约束,把问题转化成“优化一个整体的能量函数”,底层路径自然会顺畅,甚至能自动规避掉冗余步骤。
——这不正是他隐约想过但没敢真正动手的方向吗?
叶晓白打开编辑器,亮色的光标开始跳动,像一颗等待被唤醒的心脏。
下一秒,代码从指尖浮现。
他边删边写,庞大的数据洪流奔涌向前,在他眼中具象地流向一个清晰的方向。键盘的敲击声连成一片,急促悦耳,又恢弘如钟,他仿佛独自立于数据运行的中央,身边空无一人。
而浩瀚邈远的黑暗里,似乎隐隐有人牵着他的手。
“如果把局部约束内生化……再把跨层权重合并进目标函数……”
思路正确,验证成立。
叶晓白把键盘敲得快冒火星子,周瑾河看了他一眼,就知道这小子又进入了眼里只有算法的境界,于是没打扰,吃完饭把碗筷洗干净后就离开了公寓。
*
周一早上8:33。
疯狂闭关一周后,理论优化算法终于基本完成,叶晓白把这个算法命名为“Spectral-OT”(谱正则化最优传输),通过低秩谱分解和正则化迭代,在保证传输精度的同时显著降低了计算复杂化,经过实际验证,在MS-COCO数据集测试中对图像和文本检索的F1分数提高了11%。
技术帖还没来得及发布,昨晚他打电话叫包括周瑾河、宋晚山和唐琪在内的本科室友帮忙测试,又连夜改bug,一熬就熬到了早上五点,几乎整晚没睡。早上六点多,楼下通宵开趴的留学生又没带公寓门禁卡,狂按门铃把他炸醒。
八点多门铃又响了,是周瑾河,叶晓白一边开门,一边骂他。
周瑾河扔下一个纸袋,说:
“唐哥让我给你带早饭,你昨晚熬大夜今早肯定起不来。”
叶晓白愧疚了半秒,打开纸袋,是热腾腾的小笼包和甜豆浆,碳水的幸福感扑面而来。
好久没吃人饭了。过去的一周叶晓白约等于失联,早上六点起床开始改代码,十点到LEAF打工,下午两点准时下班,而后又改代码改到晚上十二点,期间全靠吐司面包、鸡胸肉、瓶装水和维生素片存活,周瑾河、唐琪和宋晚山偶尔上门拜访,给他带点新鲜果蔬。
按照唐琪的原话,是怕他沉浸于代码不小心嘎嘣一下死了。
好在新算法卓有成效,三位好兄弟看过代码后一致认为这个项目够发一篇相当厉害的文章。
“我觉得今晚可以在论坛上发个技术贴,然后公开源码,”叶晓白一边吃一边说,“也许还有什么隐藏bug没修,让论坛上的大神们帮忙看看,应该还有优化空间。”
“这算法要是卖专利能卖不少钱,”周瑾河说,随即突然想起来,“你那五万英镑怎么样了?银行有说什么吗?”
叶晓白说:“他们确认了,是奖学金,但我核实过,学院名单上确实没有我。”
他想起那天的电话,柜员三番五次确认钱款来源和目的都没有任何问题,这笔钱就是给他的奖学金——但不肯透露转账方的任何信息,只知道并非学院官方,应该是私人行为。
这算什么?觉得他很有潜力?叶晓白联想到那道最后的建模大题,总不可能是因为整个学院只有他一个人肝完了那道工作量巨大的题?
“别管了,有钱还不爽?”周瑾河催他,“赶紧吃,吃完上课去。”
叶晓白懵了:“上什么课?”
“开学啊蠢蛋!你都闭关一星期了,今天是开学第一天,早上九点,代数拓扑与微分拓扑!”
糟了,差点忘记第一天是拓扑!