-
题名一个基于词语搭配的英文文本检索软件的实现
- 1
-
-
作者
乔艳梅
杨进才
刘应亮
-
机构
青岛城市管理职业学校
华中师范大学计算机学院
武汉理工大学外语学院
-
出处
《计算机应用与软件》
2017年第10期85-90,142,共7页
-
基金
国家社会科学基金项目(14BYY093)
国家自然科学基金项目(31371275)
-
文摘
词语搭配是英语语言学研究中的一个重要课题,近年来,趋向于注重数据验证和量化研究。探讨一个基于搭配研究的英文文本检索软件ColloStu实现的关键技术。该软件设计一个通配符匹配算法,该算法使用确定有限自动机DFA,通过压缩自动机的状态数,加快匹配速度。同时,在检索搭配词时能识别共现语境中的句子终结符,从而更有效地检索出搭配词。对搭配力计算的Z分值算法进行了改进,综合运用Z分值、T分值、MI值从多个角度计算搭配强度,使计算更加准确。实验表明,与主流的检索软件相比,Collo Stu除增加了搭配力计算功能外,单词统计和搭配词检索更准确。
-
关键词
文本检索
词语搭配
通配符匹配
确定有限自动机
搭配力计算
-
Keywords
Text retrieval Word collocation Wildcard matching DFA Collocation calculation
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-