期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
5
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
人机共生时代的语言数据问题
被引量:
19
1
作者
李宇明
《华中师范大学学报(人文社会科学版)》
CSSCI
北大核心
2023年第5期135-143,共9页
人类不断创造各种语言技术以辅助语言应用、改善语言生活,从结绳记事、表意图画到文字的创制、印刷术的应用、广播影视的普及,而今进入了以互联网和语言智能为代表的现代语言技术阶段。“人-人”直接交际方式逐渐减少,“人-机-人”的间...
人类不断创造各种语言技术以辅助语言应用、改善语言生活,从结绳记事、表意图画到文字的创制、印刷术的应用、广播影视的普及,而今进入了以互联网和语言智能为代表的现代语言技术阶段。“人-人”直接交际方式逐渐减少,“人-机-人”的间接交际方式成为常态,未来正在进入为人类配备AI助手的“人机共生”时代。以ChatGPT为代表的语言大模型是人类语言技术发展到今天的高峰,显示了大数据、特别是语言数据的强大功能;而语言大模型在语言表达中所表现出的知识缺陷,是网络上缺乏专门领域、特殊人群、特殊场景、非通用语种等“特域数据”造成的。数据,包括语言数据,已成为新科技发展的关键要素和现代经济的生产要素,必须通过法律法规、规范标准对数据进行管理,通过数据市场促进数据的生产、流通和利用,通过数据公司有规划地集聚“特域数据”以有效弥补网络数据之缺,通过语言智能教育来促进公民具有适应AI助手的能力,通过就业市场预测机制及时将劳动力转移到新技术催生出的新岗位。数据管理应宽严适度,既要尽力促进语言智能发展,又要保证技术向善,使其在伦理学的轨道上前进。
展开更多
关键词
语言技术
语言数据
语言智能
AI助手
语言伦理
在线阅读
下载PDF
职称材料
新世纪专门用途中文的发展动力、现状与趋势
被引量:
9
2
作者
李艳华
李宇明
《首都师范大学学报(社会科学版)》
CSSCI
北大核心
2024年第2期87-96,共10页
进入21世纪,在自驱力--中文学习者学习需求多元化和他驱力--经济动力和政策动力的合力作用下,专门用途中文进入内涵式发展的新阶段,呈现出新特点,并有进一步提升的空间。新世纪专门用途中文教材在编写数量、编写团队、教材性质和编写原...
进入21世纪,在自驱力--中文学习者学习需求多元化和他驱力--经济动力和政策动力的合力作用下,专门用途中文进入内涵式发展的新阶段,呈现出新特点,并有进一步提升的空间。新世纪专门用途中文教材在编写数量、编写团队、教材性质和编写原则等方面取得显著成效;专门用途中文教学法与具体学科相结合进行创新性探索;专门用途中文大纲以考试大纲为主,编制领域不断拓展,职业中文系列标准接续推出;专门用途中文语言测试已在商务和医学领域有成功经验,并将朝着系统化、专业化、科学化、产业化的方向推进;专门用途中文师资以中文教师为主,专门院校和职业院校的师资力量不断充实进来。今后专门用途中文的发展在理论层面和实践层面都呈现出良好态势,并需在参与主体、依托形式和发展模式等方面深入探索,努力实现深层次、高水平的可持续发展。
展开更多
关键词
专门用途中文
学习需求多元化
内涵式发展
发展趋势
在线阅读
下载PDF
职称材料
基于70年报刊语料的现代汉语历时稳态词抽取与考察
被引量:
6
3
作者
饶高琦
李宇明
《中文信息学报》
CSCD
北大核心
2016年第6期49-58,共10页
该文基于70年跨度的历时报刊语料库,使用九种统计方法计算了词语历年的使用情况,并通过对稳定性、覆盖度和时间区分性能的考察筛选获得了规模为3 013词的历时稳态词候选词集。该词集中动词与名词各占约三分之一(其余为形容词、副词与虚...
该文基于70年跨度的历时报刊语料库,使用九种统计方法计算了词语历年的使用情况,并通过对稳定性、覆盖度和时间区分性能的考察筛选获得了规模为3 013词的历时稳态词候选词集。该词集中动词与名词各占约三分之一(其余为形容词、副词与虚词),平均词长约1.7字,前密后疏地分布于历时语料库总频序表的前7 609位,覆盖了总语料的近九成。该部分词语中包含大量构造句子结构的核心词语。它们塑造了稳态词在词长和词类上的特性。稳态词的提取可以加深对语言生活底层与基础词汇的认识,对汉语教学、中文信息处理和语言规划都具有重要意义。
展开更多
关键词
稳态词
历时语料库
语言监测
在线阅读
下载PDF
职称材料
基于词汇聚类方法的现代汉语分期与分期体系构建
被引量:
3
4
作者
饶高琦
李宇明
《中文信息学报》
CSCD
北大核心
2017年第6期18-24,共7页
当前对现代汉语史的研究多借用政治-社会史的分期方式将现代汉语分为新文化运动至1949年、1950—1966年、1967—1976年和1977—至今四个时期,并在这一基础上开展了许多研究。语言尤其是书面语虽然与社会政治生活有密切联系,但语言系统...
当前对现代汉语史的研究多借用政治-社会史的分期方式将现代汉语分为新文化运动至1949年、1950—1966年、1967—1976年和1977—至今四个时期,并在这一基础上开展了许多研究。语言尤其是书面语虽然与社会政治生活有密切联系,但语言系统有其自身的演化规律。从语言数据出发对语言进行分期是更加合适的选择。该文将语言的分期问题视作历时语料的分期问题,进而成为历时文本的聚类问题。该文工作基于历时报刊语料库遴选出的时间敏感程度较好的词汇。使用机器学习领域中广泛使用的K均值和期望最大算法进行聚类,以该部分词汇频率为特征对70年跨度(1945—2015)的历时报刊语料进行聚类,并在不同的聚类数量下绘制了具有层次性的词汇使用分期树。据此构建了过去70年现代汉语的词汇层次分期模型,揭示了改革开放的开始作为词汇使用变迁最重要分水岭的地位。
展开更多
关键词
现代汉语
分期
词汇
历史演变
聚类
在线阅读
下载PDF
职称材料
“别解”造词理据及规范问题分析
被引量:
2
5
作者
刘楚群
《江西师范大学学报(哲学社会科学版)》
2013年第6期52-56,共5页
别解造词是近年来新出现的一种修辞造词的方式。其存在并流行的理据主要涉及两方面:语言本身内在的理据、社会文化方面的外在理据。语言理据包括语义别解、语法别解、语音别解、字形别解,其社会文化理据包括一定的逻辑基础、"陌生...
别解造词是近年来新出现的一种修辞造词的方式。其存在并流行的理据主要涉及两方面:语言本身内在的理据、社会文化方面的外在理据。语言理据包括语义别解、语法别解、语音别解、字形别解,其社会文化理据包括一定的逻辑基础、"陌生化"的美学特征、凸显个性的时代文化以及网络媒介的助推。在新词语规范中要注意避免别解造词的低俗化和随意性。
展开更多
关键词
新词语
别解
修辞造词
词语规范
在线阅读
下载PDF
职称材料
题名
人机共生时代的语言数据问题
被引量:
19
1
作者
李宇明
机构
北京语言大学语言政策与标准研究所
出处
《华中师范大学学报(人文社会科学版)》
CSSCI
北大核心
2023年第5期135-143,共9页
基金
国家社会科学基金重点项目“中国学前儿童语料库建设及运作研究”(19AYY010)
国家社会科学基金重大项目“新时代中国特色语言学基本理论问题研究”(19VXK06)
国家社会科学基金重大项目“‘两个一百年’背景下的语言国情调查与语言规划研究”(21&ZD289)。
文摘
人类不断创造各种语言技术以辅助语言应用、改善语言生活,从结绳记事、表意图画到文字的创制、印刷术的应用、广播影视的普及,而今进入了以互联网和语言智能为代表的现代语言技术阶段。“人-人”直接交际方式逐渐减少,“人-机-人”的间接交际方式成为常态,未来正在进入为人类配备AI助手的“人机共生”时代。以ChatGPT为代表的语言大模型是人类语言技术发展到今天的高峰,显示了大数据、特别是语言数据的强大功能;而语言大模型在语言表达中所表现出的知识缺陷,是网络上缺乏专门领域、特殊人群、特殊场景、非通用语种等“特域数据”造成的。数据,包括语言数据,已成为新科技发展的关键要素和现代经济的生产要素,必须通过法律法规、规范标准对数据进行管理,通过数据市场促进数据的生产、流通和利用,通过数据公司有规划地集聚“特域数据”以有效弥补网络数据之缺,通过语言智能教育来促进公民具有适应AI助手的能力,通过就业市场预测机制及时将劳动力转移到新技术催生出的新岗位。数据管理应宽严适度,既要尽力促进语言智能发展,又要保证技术向善,使其在伦理学的轨道上前进。
关键词
语言技术
语言数据
语言智能
AI助手
语言伦理
Keywords
language technology
language data
linguistic intelligence
AI assistants
linguistic ethics
分类号
TP18 [自动化与计算机技术—控制理论与控制工程]
F49 [经济管理—产业经济]
在线阅读
下载PDF
职称材料
题名
新世纪专门用途中文的发展动力、现状与趋势
被引量:
9
2
作者
李艳华
李宇明
机构
北京语言大学
国际中文教学
研究所
北京语言大学语言政策与标准研究所
国家语委中国
语言
文字规范
标准
研究
中心
出处
《首都师范大学学报(社会科学版)》
CSSCI
北大核心
2024年第2期87-96,共10页
基金
教育部中外语言交流合作中心2023年国际中文教育研究课题重点项目(23YH08B)
北京语言大学院级科研项目(中央高校基本科研业务费专项资金)(21YJ010105)
北京语言大学2023年国际中文教育教改一般项目(GJG202336)的资助。
文摘
进入21世纪,在自驱力--中文学习者学习需求多元化和他驱力--经济动力和政策动力的合力作用下,专门用途中文进入内涵式发展的新阶段,呈现出新特点,并有进一步提升的空间。新世纪专门用途中文教材在编写数量、编写团队、教材性质和编写原则等方面取得显著成效;专门用途中文教学法与具体学科相结合进行创新性探索;专门用途中文大纲以考试大纲为主,编制领域不断拓展,职业中文系列标准接续推出;专门用途中文语言测试已在商务和医学领域有成功经验,并将朝着系统化、专业化、科学化、产业化的方向推进;专门用途中文师资以中文教师为主,专门院校和职业院校的师资力量不断充实进来。今后专门用途中文的发展在理论层面和实践层面都呈现出良好态势,并需在参与主体、依托形式和发展模式等方面深入探索,努力实现深层次、高水平的可持续发展。
关键词
专门用途中文
学习需求多元化
内涵式发展
发展趋势
分类号
H195 [语言文字—汉语]
在线阅读
下载PDF
职称材料
题名
基于70年报刊语料的现代汉语历时稳态词抽取与考察
被引量:
6
3
作者
饶高琦
李宇明
机构
北京语言大学
对外汉语
研究
中心
北京语言大学语言政策与标准研究所
出处
《中文信息学报》
CSCD
北大核心
2016年第6期49-58,共10页
基金
国家社科基金(12&ZD173)
国家社科基金(16AYY007)
+3 种基金
国家语委科研项目(YB125-42
ZDI135-3)
863计划重点项目(SQ2015AA0100074)
教育部人文社科重点研究基地重大项目(16JJD740004)
文摘
该文基于70年跨度的历时报刊语料库,使用九种统计方法计算了词语历年的使用情况,并通过对稳定性、覆盖度和时间区分性能的考察筛选获得了规模为3 013词的历时稳态词候选词集。该词集中动词与名词各占约三分之一(其余为形容词、副词与虚词),平均词长约1.7字,前密后疏地分布于历时语料库总频序表的前7 609位,覆盖了总语料的近九成。该部分词语中包含大量构造句子结构的核心词语。它们塑造了稳态词在词长和词类上的特性。稳态词的提取可以加深对语言生活底层与基础词汇的认识,对汉语教学、中文信息处理和语言规划都具有重要意义。
关键词
稳态词
历时语料库
语言监测
Keywords
steady-state word
diachronic corpus
language monitoring
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
基于词汇聚类方法的现代汉语分期与分期体系构建
被引量:
3
4
作者
饶高琦
李宇明
机构
北京语言大学
对外汉语
研究
中心
北京语言大学语言政策与标准研究所
出处
《中文信息学报》
CSCD
北大核心
2017年第6期18-24,共7页
基金
北京市语言资源高精尖创新中心项目(TYR17001J)
北京语言大学校级项目(中央高校基本科研业务费专项基金)(17PT05
+2 种基金
16YBB16)
国家语委重点规划项目(ZDI135-3)
教育部人文社科重点研究基地重大项目(16JJD740004)
文摘
当前对现代汉语史的研究多借用政治-社会史的分期方式将现代汉语分为新文化运动至1949年、1950—1966年、1967—1976年和1977—至今四个时期,并在这一基础上开展了许多研究。语言尤其是书面语虽然与社会政治生活有密切联系,但语言系统有其自身的演化规律。从语言数据出发对语言进行分期是更加合适的选择。该文将语言的分期问题视作历时语料的分期问题,进而成为历时文本的聚类问题。该文工作基于历时报刊语料库遴选出的时间敏感程度较好的词汇。使用机器学习领域中广泛使用的K均值和期望最大算法进行聚类,以该部分词汇频率为特征对70年跨度(1945—2015)的历时报刊语料进行聚类,并在不同的聚类数量下绘制了具有层次性的词汇使用分期树。据此构建了过去70年现代汉语的词汇层次分期模型,揭示了改革开放的开始作为词汇使用变迁最重要分水岭的地位。
关键词
现代汉语
分期
词汇
历史演变
聚类
Keywords
modern Chinese
epoch division
lexicon
diachronic evolation
clustering
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
“别解”造词理据及规范问题分析
被引量:
2
5
作者
刘楚群
机构
教育部
语言
文字应用
研究所
北京语言大学
中国
语言
政策与
标准
研究所
出处
《江西师范大学学报(哲学社会科学版)》
2013年第6期52-56,共5页
基金
国家社科基金一般项目"新词语规范及科学语言规范观研究"(编号:13BYY059)
国家社科基金重大项目"新时期语言文字规范化问题研究"(编号:12&ZD173)
江西省社会科学"十二五"(2011)规划项目"新词语构造理据的多视角研究"(编号:11WX29)
文摘
别解造词是近年来新出现的一种修辞造词的方式。其存在并流行的理据主要涉及两方面:语言本身内在的理据、社会文化方面的外在理据。语言理据包括语义别解、语法别解、语音别解、字形别解,其社会文化理据包括一定的逻辑基础、"陌生化"的美学特征、凸显个性的时代文化以及网络媒介的助推。在新词语规范中要注意避免别解造词的低俗化和随意性。
关键词
新词语
别解
修辞造词
词语规范
Keywords
new words
"Bie Jie"
rhetorical word - building
criterion of words
分类号
H102 [语言文字—汉语]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
人机共生时代的语言数据问题
李宇明
《华中师范大学学报(人文社会科学版)》
CSSCI
北大核心
2023
19
在线阅读
下载PDF
职称材料
2
新世纪专门用途中文的发展动力、现状与趋势
李艳华
李宇明
《首都师范大学学报(社会科学版)》
CSSCI
北大核心
2024
9
在线阅读
下载PDF
职称材料
3
基于70年报刊语料的现代汉语历时稳态词抽取与考察
饶高琦
李宇明
《中文信息学报》
CSCD
北大核心
2016
6
在线阅读
下载PDF
职称材料
4
基于词汇聚类方法的现代汉语分期与分期体系构建
饶高琦
李宇明
《中文信息学报》
CSCD
北大核心
2017
3
在线阅读
下载PDF
职称材料
5
“别解”造词理据及规范问题分析
刘楚群
《江西师范大学学报(哲学社会科学版)》
2013
2
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部