上纽大计算机科学助理教授赵晨:潜心人工智能,解决现实难题

他是计算机教授,也是桥牌高手。他致力于利用人工智能技术助力医疗发展,也希望能为更多有志于计算机领域的学生引航。2023年秋季学期,他加入上海纽约大学,成为计算机科学助理教授。

在来到上纽大之前,他于马里兰大学帕克分校取得博士学位,随后加入纽约大学开展博士后研究,主攻自然语言处理(Natural Language Processing)。他的研究与如今广泛应用的大语言模型,比如ChatGPT、DeepSeek等息息相关,包括探究如何补足训练数据外的信息、如何控制生成内容的准确性,以及如何将成果应用于现实领域等。

以下,我们来认识赵晨教授。我们邀请他分享了他的研究、他在上纽大的体验,以及他的桥牌之路。



如今大家都在热议并使用ChatGPT、DeepSeek等大语言模型工具,你主要研究与之相关的哪些问题?

我的研究领域是自然语言处理,主要指利用人工智能(AI)技术聚焦解决语言问题。它的实际应用包括机器翻译,比如谷歌翻译;还有问答系统,即你在搜索引擎或是ChatGPT中输入指令,然后直接获得答案。事实上,我尤其关注问答系统,我的博士论文就是关于这一领域的。

我的其中一个研究领域叫作“检索增强语言模型”(Retrieval-augmented Language Models)。像我们如今熟知的ChatGPT这种聊天机器人程序,都是用一定时间范围内的数据训练的,如果你询问最近发生的事情,它可能就没有相关信息。这时,你就需要一个附加的搜索引擎,我们称之为信息检索,来找到最新的信息并整合进ChatGPT,以输出最终的答案,也即用附加工具增强了基础语言模型。

此外,我也重点研究“可控生成”(Controllable Generation)。我们如今使用的基于语言模型的服务,比如ChatGPT,会产生“幻觉”(Hallucination),即生成一些看似正确、实则与事实不符的信息。如果你本身不具备相关知识,会很难判断信息的准确性。这样的事放在医疗等特殊领域,会导致十分严重的后果。所以我们需要通过算法,让模型遵循特定的指令或限制,使它生成的内容可控,最终的目的是要增加用户对于语言模型的信任。


作为专业人士,你观察到目前大家对AI有什么误区吗?

大家对这些工具有时过于依赖和乐观,可能有人觉得用它们能做任何事,但现实情况与这还有很大的差距。在一些比较简单、直接的任务中,比如让ChatGPT给你润色一篇文章,它的表现不错。但如果你让它做一些重要决策,对它来说就非常有挑战性。

如果说想让AI完全替代现在人类的工作,那还有相当长的路要走。在很多复杂、重要的任务中,我们其实需要人类与AI合作,这也是我的一个研究领域,叫“以人为中心的人工智能”(Human-centered AI)。

以医疗为例,当你需要分析放射影像或者诊断癌症时,很多有经验的医生可能也会遗漏一些细节,这时,AI模型就可以作为补充。反过来,医生会了解更多患者的病史、医疗背景,并纳入考量,而AI模型可能会遗漏这些对人类来说显而易见的信息。所以让人类与AI合作,可以让结果更为高效、可靠、精准。


你提到了研究在医疗领域的应用,为何会重点关注这一领域?

我与纽约大学数据科学中心(NYU Center for Data Science)合作开展研究,纽约大学又有个很大的朗格尼医学中心(NYU Langone Health),那里的一些研究者也涉猎数据科学,我们了解彼此的研究兴趣,进而产生了跨学科科研合作的想法。
 

Zhao with colleagues in NYU Langone Medical Center
赵晨(右五)博士后期间与同事在纽约大学数据科学中心


我们的其中一项合作是关于放射科报告生成的。放射科医生每天需要处理大量的报告,如果有模型可以根据放射影像生成报告,会大大提升工作效率。但当医生知道模型会“编造”出一些错误内容,他们就无法再相信模型得出的结论。如此一来,双方便无法达成合作。所以我们就需要对模型的内容生成进行控制,也就是我在做的“可控生成”相关研究。如果这个项目进展顺利,其成果可以直接在朗格尼医院得到应用,对现实生活产生实际的价值。

“可控生成”,以及自然语言处理在特定领域的应用也是我未来的研究方向。过去的模型能力不足以解决许多实际问题,比如以前的自然语言处理模型很难解析医学术语。但如今大语言模型的发展为其在医疗、金融、法律等许多领域的应用提供了独特的机遇,只要我们建立可用的模型,它就立刻能被直接应用,造福许多人。这是最令我感到兴奋的地方

 

为何选择加入上纽大?

加入上纽大对我来说是一件自然而然、水到渠成的事情。当我还在纽约大学进行博士后研究时,我刚好有机会与彼时担任上纽大计算机科学、数据科学与工程学部主任的Keith Ross教授聊天。当我和他说了我有回亚洲发展的想法后,他让我一定要申请上纽大,那里会是我最好的选择。

我也同意这是一个很好的机会,因为我是在美国取得博士学位、完成博士后研究,对美国的教育和科研体系更为熟悉、适应一些。而我又想回到亚洲,一方面离家比较近,另一方面也因为我是个具有职业水准的桥牌选手,想要回亚洲追寻这方面的梦想。

上纽大融汇中西的独特模式完美契合了我的需求,而且作为纽约大学全球教育体系的一员,也更方便我延续与纽约大学的科研合作与交流。能获得这个工作机会,我感到很幸运。

 

在上纽大工作的感觉如何?

我想说,计算机科学、数据科学与工程学部真的很棒,超出我的预期。上纽大的学生非常积极主动地去探索自己感兴趣的领域。让我印象深刻的是,一些大一的学生会主动找到我,诚恳地表示自己虽然没有自然语言处理相关的经验和背景,但想要做相关研究,希望我推荐一些课程或学习资源给他们自学。

我很乐意与本科生合作,这一方面能帮助推动我的研究,另一方面,也为他们提供了探索科研的机会。即便他们参与后发现这不是自己的志向所在,至少他们尝试了。当然,也有学生借此机会开启了自己的科研道路,我们正计划一起发表文章

 

能说说你是如何与桥牌结缘的,以及你在桥牌方向上的目标吗?

我对桥牌是很认真的。2011年,我受父亲的影响开始接触桥牌,取得的一些成绩愈发激励我探索。到美国读博后,有了一些空闲时间,我更加认真起来,参与了一些美国锦标赛,并获得过冠军。2018年左右,我还代表中国青年队参加了国际比赛。我很幸运一路获得了中国各代桥牌大师的指导,让我在这条路上不断突破。
 

Zhao competing at 2024 China National Bridge Games.
赵晨参与2024年全国桥牌综合竞标赛,夺得第三名的成绩

 

桥牌和我的研究领域其实也有一些相通之处:它和计算机一样,需要你有比较好的数学基础,因为要快速计算。它也和自然语言处理相似,都是决策的过程。不同的是,桥牌需要考虑更多心理层面的影响因素,你需要了解你的对手,揣摩他们的想法,做出自己的选择。我也利用自己的专长来训练,比如我会通过编程创造出虚拟的对手帮助我完成不同类型的练习,这比真的找人坐在一起打牌的传统练习方式要有效率得多。

如今,我更加专注于我的教职,所以参与联赛的频率降低了,但这并不会影响我的训练。目前,我和我的桥牌搭档会每周做一些线上练习,我也会阅读相关书籍,做一些类似解数学题的训练。我们的目标是在五到十年内,能够代表中国国家队在世界比赛中有所突破,虽然尚在讨论中,但我们会全力以赴。