
编者按
在巴黎卓越工程师学院,有一批同学经过扎实的数理学习后,在科研领域厚积薄发,崭露头角。比如,巴黎卓越工程师学院硕士二年级黄思远同学接连在NeurIPS 2023、NeurIPS 2024等人工智能领域顶级会议以第一作者身份发表四篇论文。
黄思远同学2019年毕业于上海中学,随后进入巴黎卓越工程师学院(SPEIT)进行本硕贯通学习,期间曾赴巴黎综合理工学院攻读双学位。他目前在上海交通大学LUMIA团队,师从人工智能学院林洲汉副教授,并在字节跳动Seed部门实习。
在本篇访谈中,黄思远同学分享了他和他的学术Paper故事。
✦ Q&A 精华整理
✦
1
你目前的研究方向是什么?可以简单介绍一下你发表的四篇AI顶会论文吗?
我目前主要的研究方向是信息检索,主要做RAG链路中的检索排序优化。此前研究过图结构学习,主要做图上的注意力计算加速。有机会通过论文的方式和同行们交流我感到很荣幸,希望学术社区蓬勃发展。以下是我四篇文章的简介:
第1篇
ACL 2025 (CCF A类会议) - Main
Title: Gumbel Reranking: Differentiable End-to-End Reranker Optimization
这项工作提出把RAG系统中的Rerank建模为子集采样问题(Subset Sampling),通过在注意力机制中添加可学习的软掩码机制实现RAG系统中的端到端Reranker训练,显著提升了多跳推理任务中的检索排序指标和生成答案的准确性。
第2篇
NeurIPS 2024 (CCF A类会议) - Spotlight
Title: Cluster-wise Graph Transformer with Dual-granularity Kernelized Attention
这项⼯作提出了⼀种基于多核学习的注意⼒机制,具有线性计算复杂度和捕捉多粒度信息的能⼒,在图任务上显著提升了性能。
第3篇
EMNLP 2024 (CCF B类会议) - Findings
Title: Mirror-Consistency: Harnessing Inconsistency in Majority Voting
这项⼯作提出了LLM基于⼀致性的⾃反思策略,提升了⼤语⾔模型在复杂推理问题上的准确性和Calibration指标。
第4篇
NeurIPS 2023 (CCF A类会议) - Poster
Title: Tailoring Self-Attention for Graph via Rooted Subtrees
这项⼯作提出了⼀种基于邻域⼦树结构的多跳图注意⼒机制,具有线性复杂度,在图节点分类任务上取得SOTA级别的准确率。
2
你的论文选题是如何确定的?
一方面,大模型时代有很多东西需要重新发明。例如,在信息检索领域,传统的搜索引擎(例如百度)受到大模型AI搜(例如豆包)的冲击,大模型往往能对用户的提问给出更准确,更深入的回答。搜索引擎是一个很有机会被“重新发明”的领域,所以我选择了大模型AI搜方向的科研方向。
另一方面,实验室有充分的自由探索空间,导师不强加限制。一般选题大方向是受实验室同学们影响,因为师兄/师姐而开始了解某个方向,深入了解后自己挖掘值得探索的点。
3
你有哪些论文写作和投稿的心得体会想要分享给学弟学妹?
最重要的心得体会就是不要太重视论文。我觉得一定要把论文当成研究的“副产品”,而不是研究的目的。
真正重要的是探索自己感兴趣的领域,尝试没人试过的方法,扎扎实实做实验并拿到一些真正有价值、前人没有的见解,这些才是科研的目的。等拿到了新的见解以后,写论文只不过是一个“副产品”,一个宣发的渠道,方便和学术同行们交流。如果把最后的宣发当作目的,每天琢磨怎么多水几篇论文,那样就没法真正提升自己的能力,也无益于整个学术社区。
4
作为四篇顶会论文的一作,你是如何安排自己的时间和精力,在科研、课程和生活之间找到平衡的?
我感觉随着成长的过程,会越来越理解大家常说的“选择比努力更重要”。因为初中高中,乃至本科低年级读书的时候,把书读好就是毋庸置疑的头等大事。但是随着步入高年级并且步入职场,会发现有越来越多不同的事情需要做,也需要和越来越多的人打交道。精力有限,不可能把每件事都做到完美,也不可能让每个人都满意。所以最重要的步骤就是分析出什么事是真正重要的。每个同学有不同的取向和职业发展的规划。
于我而言,低年级的时候我希望能打好数理基础,所以在SPEIT的课程上投入了全部的精力;目前我希望在大模型领域工作下去,所以我会在互联网企业的实习上投入绝大多数的精力。
5
SPEIT中法融合的培养模式对你的科研产生了哪些影响?
中法融合的培养模式,对我而言的主要影响是打下了比别的工科专业更扎实的数学基础,一系列的数学课(每个专业可能有所区别)比如高等代数之类的理论,让我能很快地理解前沿人工智能的一系列方法和理论,让我做科研时有能力做些更高维度,同时也更本质的理论分析。此外,能有机会去法国进行交流交换,和SPEIT同学们一起学习、一起旅行、一起体验生活,也让我感觉来对了地方。

在SPEIT的成长是全方位的,有语言能力、数理基础、口头表达、科研能力等各方面的成长,也是因为SPEIT的课程比较丰富,给我们提供了各种各样的机会。
6
你更倾向于将来继续深造,还是将研究成果应用于现实场景?
未来我打算硕士毕业后直接工作,在企业和高校都有创新的土壤。从我的感受来看,企业的创新更务实,更有影响力,能惠及用户。目前国内的头部企业变得越来越“科技型”,愿意在产业背景下加大科研投入。我觉得择业时分析一下企业的风格以及自己后续的发展规划(想做业务or科研)很有必要;高校里则更自由,更开放。每个地方都能发光发热。
7
可以介绍一下你目前的实习岗位吗?
目前我在字节跳动Seed部门实习,主要负责优化豆包的联网搜索算法。这段实习挺辛苦,压力也比较大,但字节Seed能提供很多待解决的、有价值的业务问题,并且有机会能重构搜索体验,颠覆传统的搜索引擎,所以让人有目标,有动力,也感觉自己的工作有价值。
经过这段实习,我希望之后的工作能去做真正有价值的事,普惠用户的产品也好,探索新兴技术也好,总而言之难但正确的东西让人更有工作的动力。
感谢思远同学的分享
也欢迎更多同学分享
“我与我的学术paper”的故事!
---
策划|宣传与招生办
图文提供|黄思远
排版|李 雷
责编|周向雨