期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
SMS-2008标注中文短信息库 被引量:4
1
作者 马旭 徐蔚然 +1 位作者 郭军 胡日勒 《中文信息学报》 CSCD 北大核心 2009年第4期22-26,共5页
随着短信息应用的普及,用户、运营商及政府管理部门均迫切需要智能短信处理工具。语料库是研究算法,开发系统,测试性能等必不可少的基础资源。但受到技术、版权保护、隐私权利等种种原因,目前还没有公开的标准短信息语料库。SMS-2008标... 随着短信息应用的普及,用户、运营商及政府管理部门均迫切需要智能短信处理工具。语料库是研究算法,开发系统,测试性能等必不可少的基础资源。但受到技术、版权保护、隐私权利等种种原因,目前还没有公开的标准短信息语料库。SMS-2008标注短信息库是本项目组在国内外率先建立的多用途中文短信息语料库,它包括原始语料库、预处理语料库、隐私标注语料库、内容标注语料库、错误标注语料库等。该语料库可用于短信语言现象研究、短信分类过滤算法研究、隐私保护算法研究、自动纠错算法研究等。 展开更多
关键词 计算机应用 中文信息处理 中文短信息 标注语料库
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部