中国社会科学院哲学研究所是我国哲学学科的重要学术机构和研究中心。其前身是中国科学院哲学社会科学部哲学研究所。历任所长为潘梓年、许立群、邢贲思、汝信(兼)、陈筠泉、李景源、谢地坤。中华人民共和国成立前,全国没有专门的哲学研究机构。为了适应社会主义改造和建设事业发展的需要... ... <详情>
哲学专业书库的前身是哲学研究所图书馆,与哲学研究所同时成立于1955年。1994年底,院所图书馆合并之后将其划为哲学所自管库,从此只保留图书借阅流通业务,不再购进新书。
2009年1月16日,作为中国社会科学院图书馆体制机制改革的重要举措之一,哲学专业书库正式挂牌。
<详情>2011年3月10日,我所逻辑室邹崇理研究员主持了国家重大招标课题《自然语言信息处理的逻辑语义学研究》第一次小组讨论。讨论会邀请了微软亚洲研究院前主任研究员、计算机自然语言处理组组长黄昌宁研究员、以及清华大学信息技术研究院语言理解实验室主任周强教授,共同就该课题关于对预期成果进行计算机检验和实现等相关问题进行了探讨。参加讨论会的还有中国医学科学院的高东平副研究员,哲学所的博士生满海霞、张晓君和张璐、北京化工大学的付瑶等课题组成员。
研讨会开始之后,邹崇理研究员就四个子课题的主要研究内容和项目组成员的构成进行了介绍,指出在各方面研究中,第四子课题关于前期研究结果的计算机实现是相对比较薄弱的环节。希望能更多听取黄昌宁研究员与
黄昌宁研究员指出,目前微软亚洲研究院已经利用组合范畴语法对汉语的语句生成做了一部分前期工作。具有代表性的是香港城市大学的
进行这种尝试的目的很简单,因为CCG的优点在于,它在句法和语义之间有一个非常透明、直截了当的接口,每个词条的语义表达式和句法范畴都被存放在词库的词项上,是一种完全的词汇主义的处理方式。句法范畴跟语义类型、语义最后的表示都可以在词库中通过对句子的组合而生成。因此,它在句法上和语义上都是一种组合的方式。但是要把词项一个个都理清楚,将每个词的句法范畴、语法特征都标出来,需要巨大的人工。如果能把已有的树库直接翻译成CCG树库,可以节省大量的时间、人力等等资源。国外这方面已经有人开始做,如果我们能把中文树库变成这种推导,就可以反过来通过CCG的树库得到这个树库中所有用过的词的所有的句法范畴(大概三四万个词),甚至统计出每个范畴出现过多少次,如何分布。
为什么要选择CCG呢?有两个理由:一、CCG表现的现象比以前词汇功能语法、中心语驱动语法等要深,它可以更快地评价语句中的语词是否有依存关系,谓词-论元关系等,而且速度最快。二、实用价值,CCG不但分析速度快,准确性也很高。因此,CCG是一个很好的选择。
当然在进行CCG分析时,还有很多语言学的问题没有解决,主要原因是在我们的语言学的描写中具有在树库的描写中原没有描写的内容。比如说,一个不连续的语法结构,语法上虽然不连续,但实际上是有依存关系的;主语的语义角色;连谓、兼语等特殊结构的谓词论元关系;量词辖域等等,都是开问题,还没有定论。同时,黄昌宁研究员也提出疑问,在项目书的设想中研究团队更多提到的是类型逻辑语法,那么为什么会选它而不是组合范畴语法,是否在逻辑上有什么特殊的意义?
邹崇理研究员就此问题回答说。原因包括两个方面:一是背景偏好,由于课题组成员多为逻辑出身,所以更关注逻辑构造。从逻辑角度看,这两种语法都以范畴语法为根源,但类型逻辑语法是Lambek演算的一个新的发展模式。早在二十世纪五十年代,Lambek为范畴语法构造了逻辑系统Lambek演算,之后在八十年代又与Došen一起为Lambek演算构造了框架语义,将其纳入了模态逻辑的范畴,这就是类型逻辑语法的路数。类型逻辑语法在这一个脉络里面具有比较完整的逻辑讨论,包括可靠性、完全性、几种表述系统等价。在我们的眼界里看到的主要是逻辑、是理论,所以对Lambek演算为首的一系列理论自然而言地比较感兴趣。虽然在很多介绍性文章中也接触过CCG,但由于它的相关研究主要是对语言的分析,鲜有逻辑方面的讨论,所以没有引起我们的重视。二是在申请这个课题之后,要求我们在计算方向深入思考,利用第四个子课题的平台,做出一些事情。所以我们就开始关注整个范畴语法大类下面与计算机处理相关的一些理论情况,应一些专家的意见,真正把理论讨论与实际应用结合起来。转回来开始关注CCG。
谈到类型逻辑语法,来自清华大学的
此外,
地址:北京市东城区建国门内大街5号邮编:100732
电话:(010)85195506
传真:(010)65137826
E-mail:philosophy@cass.org.cn
2011年3月10日,我所逻辑室邹崇理研究员主持了国家重大招标课题《自然语言信息处理的逻辑语义学研究》第一次小组讨论。讨论会邀请了微软亚洲研究院前主任研究员、计算机自然语言处理组组长黄昌宁研究员、以及清华大学信息技术研究院语言理解实验室主任周强教授,共同就该课题关于对预期成果进行计算机检验和实现等相关问题进行了探讨。参加讨论会的还有中国医学科学院的高东平副研究员,哲学所的博士生满海霞、张晓君和张璐、北京化工大学的付瑶等课题组成员。
研讨会开始之后,邹崇理研究员就四个子课题的主要研究内容和项目组成员的构成进行了介绍,指出在各方面研究中,第四子课题关于前期研究结果的计算机实现是相对比较薄弱的环节。希望能更多听取黄昌宁研究员与
黄昌宁研究员指出,目前微软亚洲研究院已经利用组合范畴语法对汉语的语句生成做了一部分前期工作。具有代表性的是香港城市大学的
进行这种尝试的目的很简单,因为CCG的优点在于,它在句法和语义之间有一个非常透明、直截了当的接口,每个词条的语义表达式和句法范畴都被存放在词库的词项上,是一种完全的词汇主义的处理方式。句法范畴跟语义类型、语义最后的表示都可以在词库中通过对句子的组合而生成。因此,它在句法上和语义上都是一种组合的方式。但是要把词项一个个都理清楚,将每个词的句法范畴、语法特征都标出来,需要巨大的人工。如果能把已有的树库直接翻译成CCG树库,可以节省大量的时间、人力等等资源。国外这方面已经有人开始做,如果我们能把中文树库变成这种推导,就可以反过来通过CCG的树库得到这个树库中所有用过的词的所有的句法范畴(大概三四万个词),甚至统计出每个范畴出现过多少次,如何分布。
为什么要选择CCG呢?有两个理由:一、CCG表现的现象比以前词汇功能语法、中心语驱动语法等要深,它可以更快地评价语句中的语词是否有依存关系,谓词-论元关系等,而且速度最快。二、实用价值,CCG不但分析速度快,准确性也很高。因此,CCG是一个很好的选择。
当然在进行CCG分析时,还有很多语言学的问题没有解决,主要原因是在我们的语言学的描写中具有在树库的描写中原没有描写的内容。比如说,一个不连续的语法结构,语法上虽然不连续,但实际上是有依存关系的;主语的语义角色;连谓、兼语等特殊结构的谓词论元关系;量词辖域等等,都是开问题,还没有定论。同时,黄昌宁研究员也提出疑问,在项目书的设想中研究团队更多提到的是类型逻辑语法,那么为什么会选它而不是组合范畴语法,是否在逻辑上有什么特殊的意义?
邹崇理研究员就此问题回答说。原因包括两个方面:一是背景偏好,由于课题组成员多为逻辑出身,所以更关注逻辑构造。从逻辑角度看,这两种语法都以范畴语法为根源,但类型逻辑语法是Lambek演算的一个新的发展模式。早在二十世纪五十年代,Lambek为范畴语法构造了逻辑系统Lambek演算,之后在八十年代又与Došen一起为Lambek演算构造了框架语义,将其纳入了模态逻辑的范畴,这就是类型逻辑语法的路数。类型逻辑语法在这一个脉络里面具有比较完整的逻辑讨论,包括可靠性、完全性、几种表述系统等价。在我们的眼界里看到的主要是逻辑、是理论,所以对Lambek演算为首的一系列理论自然而言地比较感兴趣。虽然在很多介绍性文章中也接触过CCG,但由于它的相关研究主要是对语言的分析,鲜有逻辑方面的讨论,所以没有引起我们的重视。二是在申请这个课题之后,要求我们在计算方向深入思考,利用第四个子课题的平台,做出一些事情。所以我们就开始关注整个范畴语法大类下面与计算机处理相关的一些理论情况,应一些专家的意见,真正把理论讨论与实际应用结合起来。转回来开始关注CCG。
谈到类型逻辑语法,来自清华大学的
此外,
中国社会科学院哲学研究所-版权所有