CN FR EN
  • 学院概况
  • 人才培养
  • 科学研究
  • 党群工作
  • 菁菁校园
  • 报考我们

黄思远|以一作身份发表4篇AI顶会论文,他有什么科研秘诀?

06.13/2025 87

SPEIT

编者按

在巴黎卓越工程师学院,有一批同学经过扎实的数理学习后,在科研领域厚积薄发,崭露头角。比如,巴黎卓越工程师学院硕士二年级黄思远同学接连在NeurIPS 2023、NeurIPS 2024等人工智能领域顶级会议以第一作者身份发表四篇论文。

黄思远同学2019年毕业于上海中学,随后进入巴黎卓越工程师学院(SPEIT)进行本硕贯通学习,期间曾赴巴黎综合理工学院攻读双学位他目前在上海交通大学LUMIA团队,师从人工智能学院林洲汉副教授,并在字节跳动Seed部门实习。

在本篇访谈中,黄思远同学分享了他和他的学术Paper故事。

 

✦ Q&A 精华整理

1

 

你目前的研究方向是什么?可以简单介绍一下你发表的四篇AI顶会论文吗?

 

我目前主要的研究方向是信息检索主要做RAG链路中的检索排序优化。此前研究过图结构学习,主要做图上的注意力计算加速。有机会通过论文的方式和同行们交流我感到很荣幸,希望学术社区蓬勃发展。以下是我四篇文章的简介:

第1篇

ACL 2025 (CCF A类会议) - Main

Title: Gumbel Reranking: Differentiable End-to-End Reranker Optimization

这项工作提出把RAG系统中的Rerank建模为子集采样问题(Subset Sampling),通过在注意力机制中添加可学习的软掩码机制实现RAG系统中的端到端Reranker训练,显著提升了多跳推理任务中的检索排序指标和生成答案的准确性。

第2篇

NeurIPS 2024 (CCF A类会议) - Spotlight

Title: Cluster-wise Graph Transformer with Dual-granularity Kernelized Attention

这项⼯作提出了⼀种基于多核学习的注意⼒机制,具有线性计算复杂度和捕捉多粒度信息的能⼒,在图任务上显著提升了性能。

第3篇

EMNLP 2024 (CCF B类会议) - Findings

Title: Mirror-Consistency: Harnessing Inconsistency in Majority Voting

这项⼯作提出了LLM基于⼀致性的⾃反思策略,提升了⼤语⾔模型在复杂推理问题上的准确性和Calibration指标。

第4篇

NeurIPS 2023 (CCF A类会议) - Poster

Title: Tailoring Self-Attention for Graph via Rooted Subtrees

这项⼯作提出了⼀种基于邻域⼦树结构的多跳图注意⼒机制,具有线性复杂度,在图节点分类任务上取得SOTA级别的准确率。

 

2

 

你的论文选题是如何确定的?

 

一方面,大模型时代有很多东西需要重新发明。例如,在信息检索领域,传统的搜索引擎(例如百度)受到大模型AI搜(例如豆包)的冲击,大模型往往能对用户的提问给出更准确,更深入的回答。搜索引擎是一个很有机会被“重新发明”的领域,所以我选择了大模型AI搜方向的科研方向。

 

另一方面,实验室有充分的自由探索空间,导师不强加限制。一般选题大方向是受实验室同学们影响,因为师兄/师姐而开始了解某个方向,深入了解后自己挖掘值得探索的点。

 

3

 

 你有哪些论文写作和投稿的心得体会想要分享给学弟学妹?

 

最重要的心得体会就是不要太重视论文。我觉得一定要把论文当成研究的“副产品”,而不是研究的目的。

 

真正重要的是探索自己感兴趣的领域,尝试没人试过的方法,扎扎实实做实验并拿到一些真正有价值、前人没有的见解,这些才是科研的目的。等拿到了新的见解以后,写论文只不过是一个“副产品”,一个宣发的渠道,方便和学术同行们交流。如果把最后的宣发当作目的,每天琢磨怎么多水几篇论文,那样就没法真正提升自己的能力,也无益于整个学术社区。

 

4

 

作为四篇顶会论文的一作,你是如何安排自己的时间和精力,在科研、课程和生活之间找到平衡的?

 

我感觉随着成长的过程,会越来越理解大家常说的“选择比努力更重要”。因为初中高中,乃至本科低年级读书的时候,把书读好就是毋庸置疑的头等大事。但是随着步入高年级并且步入职场,会发现有越来越多不同的事情需要做,也需要和越来越多的人打交道。精力有限,不可能把每件事都做到完美,也不可能让每个人都满意。所以最重要的步骤就是分析出什么事是真正重要的。每个同学有不同的取向和职业发展的规划。

 

于我而言,低年级的时候我希望能打好数理基础所以在SPEIT的课程上投入了全部的精力目前我希望在大模型领域工作下去,所以我会在互联网企业的实习上投入绝大多数的精力。

 

5

 

SPEIT中法融合的培养模式对你的科研产生了哪些影响?

 

中法融合的培养模式,对我而言的主要影响是打下了比别的工科专业更扎实的数学基础,一系列的数学课(每个专业可能有所区别)比如高等代数之类的理论,让我能很快地理解前沿人工智能的一系列方法和理论,让我做科研时有能力做些更高维度,同时也更本质的理论分析。此外,能有机会去法国进行交流交换,和SPEIT同学们一起学习、一起旅行、一起体验生活,也让我感觉来对了地方。

在法国交流交换

在SPEIT的成长是全方位的,有语言能力、数理基础、口头表达、科研能力等各方面的成长,也是因为SPEIT的课程比较丰富,给我们提供了各种各样的机会。

 

6

 

你更倾向于将来继续深造,还是将研究成果应用于现实场景?

 

未来我打算硕士毕业后直接工作,在企业和高校都有创新的土壤。从我的感受来看,企业的创新更务实,更有影响力,能惠及用户。目前国内的头部企业变得越来越“科技型”,愿意在产业背景下加大科研投入。我觉得择业时分析一下企业的风格以及自己后续的发展规划(想做业务or科研)很有必要;高校里则更自由,更开放。每个地方都能发光发热。

 

7

 

可以介绍一下你目前的实习岗位吗?

 

目前我在字节跳动Seed部门实习,主要负责优化豆包的联网搜索算法。这段实习挺辛苦,压力也比较大,但字节Seed能提供很多待解决的、有价值的业务问题并且有机会能重构搜索体验,颠覆传统的搜索引擎所以让人有目标,有动力,也感觉自己的工作有价值

 

经过这段实习,我希望之后的工作能去做真正有价值的事,普惠用户的产品也好,探索新兴技术也好,总而言之难但正确的东西让人更有工作的动力。

 

感谢思远同学的分享

也欢迎更多同学分享

“我与我的学术paper”的故事!

 

---

策划|宣传与招生办

图文提供|黄思远

排版|李   雷

责编|周向雨