学术英文写作对于母语非英语的(English as a Second Language,ESL)学者而言是一项挑战.现有的ESL写作辅助系统均基于连续单词(n-gram)在语料库中出现的频率来构建,而忽略了语义信息对于ESL写作的作用.文中提出基于语义的写作辅助方法,...学术英文写作对于母语非英语的(English as a Second Language,ESL)学者而言是一项挑战.现有的ESL写作辅助系统均基于连续单词(n-gram)在语料库中出现的频率来构建,而忽略了语义信息对于ESL写作的作用.文中提出基于语义的写作辅助方法,支持按照词性、搭配类型和概念扩展等语义条件来检索短语和自动推荐搭配.此外,为了方便英语知识有限的ESL学者利用语义条件进行检索,文中还设计了易于理解的短语检索界面.该界面提供包含语义修饰符的查询表达式,并可根据用户输入的部分查询表达式在线提示和补全.最后,为验证语义方法的有效性,文中实现并部署了ESLWriter系统.用户实验表明,ESLWriter可以有效地推荐搭配并提供短语检索结果,其查询界面直观易用;ESL学者通过混合使用自动搭配推荐功能和短语检索功能,写作质量和写作信心得到有效提高.这些结果证明了语义信息在ESL写作辅助中的重要作用.展开更多
文摘针对英语文章语法错误自动纠正(Grammatical Error Correction,GEC)问题中的冠词和介词错误,该文提出一种基于LSTM(Long Short-Term Memory,长短时记忆)的序列标注GEC方法;针对名词单复数错误、动词形式错误和主谓不一致错误,因其混淆集为开放集合,该文提出一种基于ESL(English as Second Lauguage)和新闻语料的N-gram投票策略的GEC方法。该文方法在2013年CoNLL的GEC数据上实验的整体F1值为33.87%,超过第一名UIUC的F1值31.20%。其中,冠词错误纠正的F1值为38.05%,超过UIUC冠词错误纠正的F1值33.40%,介词错误的纠正F1为28.89%,超过UIUC的介词错误纠正F1值7.22%。
文摘学术英文写作对于母语非英语的(English as a Second Language,ESL)学者而言是一项挑战.现有的ESL写作辅助系统均基于连续单词(n-gram)在语料库中出现的频率来构建,而忽略了语义信息对于ESL写作的作用.文中提出基于语义的写作辅助方法,支持按照词性、搭配类型和概念扩展等语义条件来检索短语和自动推荐搭配.此外,为了方便英语知识有限的ESL学者利用语义条件进行检索,文中还设计了易于理解的短语检索界面.该界面提供包含语义修饰符的查询表达式,并可根据用户输入的部分查询表达式在线提示和补全.最后,为验证语义方法的有效性,文中实现并部署了ESLWriter系统.用户实验表明,ESLWriter可以有效地推荐搭配并提供短语检索结果,其查询界面直观易用;ESL学者通过混合使用自动搭配推荐功能和短语检索功能,写作质量和写作信心得到有效提高.这些结果证明了语义信息在ESL写作辅助中的重要作用.