加入支持让我们有继续维护的动力！会员畅享查看所有预告立即购买

如何测试ChatGPT的语义理解与常识推理水平？——兼谈大语言模型时代语言学的挑战与机会

来源：: 学校官网
收录时间：: 2025-10-27 16:15:53
时间：: 2025-10-30 16:00:00
地点：: 海淀校区图书综合楼815
报告人：: 袁毓林
学校：: -/-
关键词：: ChatGPT, large language models, semantic understanding, commonsense reasoning, Winograd Schema Challenge, WinoGrande, distributed semantics, vector representation, Turing test, computational linguistics
简介：: 讲座简介了ChatGPT等大型语言模型在语义理解和常识推理方面的表现，介绍了其工作原理及分布式语义学与词向量表示；回顾图灵测试及其局限，重点介绍新图灵测试中的维诺格拉德模式挑战及其升级版WinoGrande数据集；展示使用该模式测试ChatGPT的结果，表明其语言理解与推理能力接近人类水平；指出语言学家应参与构建此类测试集，这是语言学在AI时代拓展学术领域的重要机遇。
: -/- 21

报告介绍：

本讲座首先简介ChatGPT等现代大型语言模型在语义理解和常识推理方面的优秀表现，概要地说明它们的工作原理及其所采用的分布式语义学和词语的向量表示；接着简介经典的“图灵测试”及其缺陷，特别介绍“新图灵测试”及其中的维诺格拉德模式挑战，还介绍其升级版本，即WinoGrande数据集；然后介绍我们用维诺格拉德模式的句子测试ChatGPT的情况，展示语言大模型在语言理解和常识推理方面达到了接近人类的水平；最后简单说明语言大模型能够“理解”人类自然语言，而构建维诺格拉德模式挑战之类的测试集是语言学家应该参与的工作，也是语言学在人工智能时代扩展自身学术领域的一个机会。

报告人介绍：

袁毓林，著名语言学家，现为澳门大学人文学院中国语言文学系讲座教授。1990年毕业于北京大学，获博士学位。担任北京大学中文系教授，博士生导师，1998年入选北京市跨世纪（新世纪）中青年社科理论人才“百人工程”。1999年入选教育部跨世纪人才培养计划，2015年被聘为教育部长江学者特聘教授，2017年入选第三批国家“万人计划”哲学社会科学领军人才。兼任中国语言学会理事，中国中文信息学会常务理事，《当代语言学》《中文信息学报》、日本《中国语学》等十几家杂志编委。主要研究理论语言学和汉语语言学，特别是句法学、语义学、语用学、计算语言学和中文信息处理。在《中国社会科学》、《中国语文》、《当代语言学》和《中文信息学报》等刊物发表论文100余篇，出版著作10部。

购买下会员支持下吧...用爱发电已经很久了立即购买

请添加微信沟通