期刊文献+
共找到5篇文章
< 1 >
每页显示 20 50 100
人机共生时代的语言数据问题 被引量:19
1
作者 李宇明 《华中师范大学学报(人文社会科学版)》 CSSCI 北大核心 2023年第5期135-143,共9页
人类不断创造各种语言技术以辅助语言应用、改善语言生活,从结绳记事、表意图画到文字的创制、印刷术的应用、广播影视的普及,而今进入了以互联网和语言智能为代表的现代语言技术阶段。“人-人”直接交际方式逐渐减少,“人-机-人”的间... 人类不断创造各种语言技术以辅助语言应用、改善语言生活,从结绳记事、表意图画到文字的创制、印刷术的应用、广播影视的普及,而今进入了以互联网和语言智能为代表的现代语言技术阶段。“人-人”直接交际方式逐渐减少,“人-机-人”的间接交际方式成为常态,未来正在进入为人类配备AI助手的“人机共生”时代。以ChatGPT为代表的语言大模型是人类语言技术发展到今天的高峰,显示了大数据、特别是语言数据的强大功能;而语言大模型在语言表达中所表现出的知识缺陷,是网络上缺乏专门领域、特殊人群、特殊场景、非通用语种等“特域数据”造成的。数据,包括语言数据,已成为新科技发展的关键要素和现代经济的生产要素,必须通过法律法规、规范标准对数据进行管理,通过数据市场促进数据的生产、流通和利用,通过数据公司有规划地集聚“特域数据”以有效弥补网络数据之缺,通过语言智能教育来促进公民具有适应AI助手的能力,通过就业市场预测机制及时将劳动力转移到新技术催生出的新岗位。数据管理应宽严适度,既要尽力促进语言智能发展,又要保证技术向善,使其在伦理学的轨道上前进。 展开更多
关键词 语言技术 语言数据 语言智能 AI助手 语言伦理
在线阅读 下载PDF
新世纪专门用途中文的发展动力、现状与趋势 被引量:9
2
作者 李艳华 李宇明 《首都师范大学学报(社会科学版)》 CSSCI 北大核心 2024年第2期87-96,共10页
进入21世纪,在自驱力--中文学习者学习需求多元化和他驱力--经济动力和政策动力的合力作用下,专门用途中文进入内涵式发展的新阶段,呈现出新特点,并有进一步提升的空间。新世纪专门用途中文教材在编写数量、编写团队、教材性质和编写原... 进入21世纪,在自驱力--中文学习者学习需求多元化和他驱力--经济动力和政策动力的合力作用下,专门用途中文进入内涵式发展的新阶段,呈现出新特点,并有进一步提升的空间。新世纪专门用途中文教材在编写数量、编写团队、教材性质和编写原则等方面取得显著成效;专门用途中文教学法与具体学科相结合进行创新性探索;专门用途中文大纲以考试大纲为主,编制领域不断拓展,职业中文系列标准接续推出;专门用途中文语言测试已在商务和医学领域有成功经验,并将朝着系统化、专业化、科学化、产业化的方向推进;专门用途中文师资以中文教师为主,专门院校和职业院校的师资力量不断充实进来。今后专门用途中文的发展在理论层面和实践层面都呈现出良好态势,并需在参与主体、依托形式和发展模式等方面深入探索,努力实现深层次、高水平的可持续发展。 展开更多
关键词 专门用途中文 学习需求多元化 内涵式发展 发展趋势
在线阅读 下载PDF
基于70年报刊语料的现代汉语历时稳态词抽取与考察 被引量:6
3
作者 饶高琦 李宇明 《中文信息学报》 CSCD 北大核心 2016年第6期49-58,共10页
该文基于70年跨度的历时报刊语料库,使用九种统计方法计算了词语历年的使用情况,并通过对稳定性、覆盖度和时间区分性能的考察筛选获得了规模为3 013词的历时稳态词候选词集。该词集中动词与名词各占约三分之一(其余为形容词、副词与虚... 该文基于70年跨度的历时报刊语料库,使用九种统计方法计算了词语历年的使用情况,并通过对稳定性、覆盖度和时间区分性能的考察筛选获得了规模为3 013词的历时稳态词候选词集。该词集中动词与名词各占约三分之一(其余为形容词、副词与虚词),平均词长约1.7字,前密后疏地分布于历时语料库总频序表的前7 609位,覆盖了总语料的近九成。该部分词语中包含大量构造句子结构的核心词语。它们塑造了稳态词在词长和词类上的特性。稳态词的提取可以加深对语言生活底层与基础词汇的认识,对汉语教学、中文信息处理和语言规划都具有重要意义。 展开更多
关键词 稳态词 历时语料库 语言监测
在线阅读 下载PDF
基于词汇聚类方法的现代汉语分期与分期体系构建 被引量:3
4
作者 饶高琦 李宇明 《中文信息学报》 CSCD 北大核心 2017年第6期18-24,共7页
当前对现代汉语史的研究多借用政治-社会史的分期方式将现代汉语分为新文化运动至1949年、1950—1966年、1967—1976年和1977—至今四个时期,并在这一基础上开展了许多研究。语言尤其是书面语虽然与社会政治生活有密切联系,但语言系统... 当前对现代汉语史的研究多借用政治-社会史的分期方式将现代汉语分为新文化运动至1949年、1950—1966年、1967—1976年和1977—至今四个时期,并在这一基础上开展了许多研究。语言尤其是书面语虽然与社会政治生活有密切联系,但语言系统有其自身的演化规律。从语言数据出发对语言进行分期是更加合适的选择。该文将语言的分期问题视作历时语料的分期问题,进而成为历时文本的聚类问题。该文工作基于历时报刊语料库遴选出的时间敏感程度较好的词汇。使用机器学习领域中广泛使用的K均值和期望最大算法进行聚类,以该部分词汇频率为特征对70年跨度(1945—2015)的历时报刊语料进行聚类,并在不同的聚类数量下绘制了具有层次性的词汇使用分期树。据此构建了过去70年现代汉语的词汇层次分期模型,揭示了改革开放的开始作为词汇使用变迁最重要分水岭的地位。 展开更多
关键词 现代汉语 分期 词汇 历史演变 聚类
在线阅读 下载PDF
“别解”造词理据及规范问题分析 被引量:2
5
作者 刘楚群 《江西师范大学学报(哲学社会科学版)》 2013年第6期52-56,共5页
别解造词是近年来新出现的一种修辞造词的方式。其存在并流行的理据主要涉及两方面:语言本身内在的理据、社会文化方面的外在理据。语言理据包括语义别解、语法别解、语音别解、字形别解,其社会文化理据包括一定的逻辑基础、"陌生... 别解造词是近年来新出现的一种修辞造词的方式。其存在并流行的理据主要涉及两方面:语言本身内在的理据、社会文化方面的外在理据。语言理据包括语义别解、语法别解、语音别解、字形别解,其社会文化理据包括一定的逻辑基础、"陌生化"的美学特征、凸显个性的时代文化以及网络媒介的助推。在新词语规范中要注意避免别解造词的低俗化和随意性。 展开更多
关键词 新词语 别解 修辞造词 词语规范
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部