期刊文献+
共找到12篇文章
< 1 >
每页显示 20 50 100
MD&A文本相似性会影响审计风格吗?
1
作者 阳震青 占焱芳 《南京审计大学学报》 CSSCI 北大核心 2024年第5期26-36,共11页
“管理层讨论与分析”(MD&A)信息披露通常会受到管理层的影响,并带来相应的披露后果。以2014—2021年上市公司为研究样本,以审计师向客户发表非标准审计意见的准确度来衡量审计风格,实证检验MD&A文本相似性对审计风格的影响。... “管理层讨论与分析”(MD&A)信息披露通常会受到管理层的影响,并带来相应的披露后果。以2014—2021年上市公司为研究样本,以审计师向客户发表非标准审计意见的准确度来衡量审计风格,实证检验MD&A文本相似性对审计风格的影响。研究发现:MD&A文本相似性越高,审计风格越激进;分析师跟踪、信息披露质量和媒体关注度削弱了MD&A文本相似性与审计风格之间的正相关关系。影响机制研究发现:MD&A文本相似性越高,审计师投入的审计资源会越少,要求的收费水平就会降低,使得审计风格更加激进。异质性分析发现:MD&A文本语调更为积极的一组,MD&A文本相似性与审计风格之间的关系不显著,语调消极的一组二者之间仍存在显著的正相关关系,而MD&A文本可读性程度的高低不影响MD&A文本相似性和审计风格之间的关系。上述研究结论对监管机构落实审计师责任、审计师作出审计判断和投资者进行投资决策等具有一定的参考意义。 展开更多
关键词 MD&A 文本相似性 审计风格 审计意见 审计费用 分析师跟踪 信息披露 媒体关注度
在线阅读 下载PDF
文本相似性度量中参数相关性与优化配置研究 被引量:11
2
作者 张祖平 徐昕 +1 位作者 龙军 袁鑫攀 《小型微型计算机系统》 CSCD 北大核心 2011年第5期983-988,共6页
针对文本相似性度量中的相似度阈值、准确率、召回率、shingle滑动窗口大小、shingle权重系数和文本属性等参数相互影响、关系复杂的问题,研究了这些参数之间的相关性,并结合实际应用需求,提出各参数可优化配置的建议,分析与设计了相似... 针对文本相似性度量中的相似度阈值、准确率、召回率、shingle滑动窗口大小、shingle权重系数和文本属性等参数相互影响、关系复杂的问题,研究了这些参数之间的相关性,并结合实际应用需求,提出各参数可优化配置的建议,分析与设计了相似度阈值可适应文本篇幅属性的相似性度量算法.通过某基金2009年的7378个项目申请书的比对分析,结果表明:提出的算法不但适用于大规模的文本集合,而且在短小的文本集合中进行相似性度量也具有很高的应用价值,其准确率和召回率均可高达95%以上. 展开更多
关键词 文本相似性度量 算法 邻接词组 参数相关性分析 召回率
在线阅读 下载PDF
一种基于熵的文本相似性计算方法 被引量:13
3
作者 李圣文 凌微 +1 位作者 龚君芳 周长征 《计算机应用研究》 CSCD 北大核心 2016年第3期665-668,共4页
文本比较是求解两个文本间相似度的过程,文本间的相似度越高代表两个文本越趋于类似。传统的相似度算法主要从字符的角度度量文本的相似性,忽略了文本内多个共同文本串对于文本相似度的影响。针对此问题提出一种基于熵的相似度求解方法... 文本比较是求解两个文本间相似度的过程,文本间的相似度越高代表两个文本越趋于类似。传统的相似度算法主要从字符的角度度量文本的相似性,忽略了文本内多个共同文本串对于文本相似度的影响。针对此问题提出一种基于熵的相似度求解方法,在对文本间字符信息的提取基础上,建立共同子文本串度量维度,然后采用熵的方法进行相似度度量。实验表明,该方法具有更平滑的相似度曲线,从而验证了算法的有效性和准确性。 展开更多
关键词 文本相似性 字符串匹配 编辑距离算法 最长公共子序列
在线阅读 下载PDF
结合关键词微变和LD算法的文本相似性研究
4
作者 程玉胜 梁辉 +1 位作者 王一宾 任勇 《计算机工程与应用》 CSCD 北大核心 2016年第8期70-73,124,共5页
为了解决基于传统向量空间模型的文本相似性算法没有考虑向量高维及关键词的微变,而导致文本相似性计算结果不够精确的问题,提出了关键词微变情况下基于聚类和LD算法的文本相似性算法TSABCLDA(Text Similarity Algorithm Based on Clust... 为了解决基于传统向量空间模型的文本相似性算法没有考虑向量高维及关键词的微变,而导致文本相似性计算结果不够精确的问题,提出了关键词微变情况下基于聚类和LD算法的文本相似性算法TSABCLDA(Text Similarity Algorithm Based on Clustering and LD Algorithm)。对文本进行移除数字、标点符号和停用词等预处理;采用聚类的方法约简文本中的低频词,利用LD算法计算特征词间的相似度,建立文本相似度矩阵;用特征词相似度及其权重构建的空间向量计算文本间的相似度,这样不仅考虑了关键词微变的情况,而且有效地解决了文本向量的高维问题,将其应用于文本挖掘中,能够提高相似文本的挖掘效率。实验结果表明,由于考虑了关键词微变情况,在一定的阈值范围内,该算法文本相似性的准确率得到了明显的提高。 展开更多
关键词 聚类 LD算法 文本相似度矩阵 向量空间模型 文本相似性
在线阅读 下载PDF
利用N-gram和语义分析的维吾尔语文本相似性检测方法 被引量:1
5
作者 张莹 亚森·艾则孜 吴顺祥 《计算机应用研究》 CSCD 北大核心 2019年第9期2722-2725,2729,共5页
为了实现维吾尔语文本的相似性检测,提出一种基于N-gram和语义分析的相似性检测方法。根据维吾尔语单词特征,采用了N-gram统计模型来获得词语,并根据词语在文本中的出现频率来构建词语-文本关系矩阵,并作为文本模型。采用了潜在语义分析... 为了实现维吾尔语文本的相似性检测,提出一种基于N-gram和语义分析的相似性检测方法。根据维吾尔语单词特征,采用了N-gram统计模型来获得词语,并根据词语在文本中的出现频率来构建词语-文本关系矩阵,并作为文本模型。采用了潜在语义分析(LSA)来获得词语及其文本之间的隐藏关联,以此解决维吾尔语词义模糊的问题,并获得准确的相似度。在包含重组和同义词替换的剽窃文本集上进行实验,结果表明该方法能够准确有效地检测出相似性。 展开更多
关键词 维吾尔语 文本相似性检测 N-gram统计模型 潜在语义分析
在线阅读 下载PDF
年报文本信息相似性对审计收费的影响 被引量:1
6
作者 李世刚 鲁逸楠 《财会月刊》 北大核心 2021年第16期111-119,共9页
年报文本信息的披露通常会受到管理层的影响,并产生相应的披露后果。以2004~2017年上市公司为研究对象,借助计算机文本信息处理技术,实证检验年报文本信息相似性对审计师定价决策的影响。研究发现:年报文本信息相似性越高,审计师投入的... 年报文本信息的披露通常会受到管理层的影响,并产生相应的披露后果。以2004~2017年上市公司为研究对象,借助计算机文本信息处理技术,实证检验年报文本信息相似性对审计师定价决策的影响。研究发现:年报文本信息相似性越高,审计师投入的资源越少,感知的信息风险越低,从而要求的收费水平越低;企业内部控制强化了上述影响,但审计师行业专长则弱化了年报文本信息相似性与审计收费之间的负相关关系强度。通过机制研究发现:年报文本信息相似性越高,审计师资源投入越少且感知的风险水平越低,具体表现为审计时间投入越少,上市公司信息违规风险越低,越被倾向于出具标准无保留审计意见。上述研究对加强审计师年报文本信息披露执业关注和审计师执业准则建设具有重要的参考价值。 展开更多
关键词 年报文本信息相似性 审计收费 内部控制 审计师行业专长
在线阅读 下载PDF
应用于电网资产模型搜索的交叉权积文本相似度计算方法
7
作者 赵增涛 张豪 余益龙 《水利水电技术(中英文)》 北大核心 2020年第S02期209-214,共6页
电网资产模型搜索中对搜索结果的排序,采用了按综合得分由高到低排列的方法。综合得分由多字段综合文本相似度得分、过滤条件匹配度得分、关注热度得分,按照一定的占比计算得到。多字段综合文本相似度算法的基础是短文本的相似度计算方... 电网资产模型搜索中对搜索结果的排序,采用了按综合得分由高到低排列的方法。综合得分由多字段综合文本相似度得分、过滤条件匹配度得分、关注热度得分,按照一定的占比计算得到。多字段综合文本相似度算法的基础是短文本的相似度计算方法,需要根据电网资产模型中各个不同领域数据的特点进行灵活调整。设计出具有一定可调节性的短文本相似性计算方法。算法构建两个与需要计算相似度的两个短文本字符长度相同的权重数组并赋予初识权重值,再遍历其中一个字符串中的字符,根据字符是否在另外一个字符串中是否存在调整其权重值,之后对单字匹配、连续匹配的字符计算权重交叉乘积获得文本相似性权重,与原始权重积相除获得文本相似度值。应用交叉权积相似性算法的电网资产模型搜索,在搜索结果的准确性方面更贴近电力专业用户的期望。 展开更多
关键词 电网资产模型 搜索 文本相似性 文本权重 交叉权积
在线阅读 下载PDF
“一带一路”倡议海外传播分析——基于对主要国际媒体的文本挖掘方法 被引量:13
8
作者 李倩倩 李瑛 刘怡君 《情报杂志》 CSSCI 北大核心 2019年第3期121-126,132,共7页
[目的/意义]了解国际主流媒体如何建构"一带一路"倡议,有利于把握"一带一路"倡议在国际传播的议程设置方向。[方法/过程]以CNN、BBC、半岛电视台(AJ)、今日俄罗斯(RT)关于倡议的新闻报道为研究对象,利用主题模型、... [目的/意义]了解国际主流媒体如何建构"一带一路"倡议,有利于把握"一带一路"倡议在国际传播的议程设置方向。[方法/过程]以CNN、BBC、半岛电视台(AJ)、今日俄罗斯(RT)关于倡议的新闻报道为研究对象,利用主题模型、文档相似性等文本挖掘方法,探析国际主流媒体的报道重点和相似关联性。[结果/结论]发现:在内容上,国际媒体更多关注倡议落实过程中面临的严峻挑战和对国际社会上产生的影响;在参与度上,国际媒体援引中国国家主流媒体信源的内容不多,中国智库和研究者的声音比较薄弱;在相似性上,CNN、BBC、AJ享有更多的相似议程设置,而RT则相对独立。最后,提出增强"一带一路"倡议海外传播能力的建议。 展开更多
关键词 "一带一路"倡议 海外传播 文本挖掘 主题模型 文本相似性
在线阅读 下载PDF
基于Web身份特征的网络视频监控设备识别 被引量:6
9
作者 丁伟祥 《沈阳工业大学学报》 EI CAS 北大核心 2020年第4期427-431,共5页
为了更好地对网络视频监控设备进行在线管理与维护,提出了一种网络视频监控设备在线检测与自动识别技术.利用无状态扫描技术进行网络终端设备的在线检测,从终端设备特定端口返回的HTTP头信息中提取BANNER和HTML页面信息,并通过粗糙集属... 为了更好地对网络视频监控设备进行在线管理与维护,提出了一种网络视频监控设备在线检测与自动识别技术.利用无状态扫描技术进行网络终端设备的在线检测,从终端设备特定端口返回的HTTP头信息中提取BANNER和HTML页面信息,并通过粗糙集属性约简后构建设备Web身份特征.利用余弦距离计算在线设备Web身份特征与已知设备特征库样本之间相似度,实现在线设备的检测与识别.结果表明,该方法能够较好地在线检测并自动识别网络视频监控设备,具有较高的识别准确率和较低的识别遗漏率. 展开更多
关键词 网络视频监控 Web身份特征 无状态扫描 粗糙集 特征约简 文本相似性 余弦距离函数 在线检测 自动识别
在线阅读 下载PDF
基于云计算的网络舆情藤蔓式串并行聚类方法研究 被引量:2
10
作者 陈雪刚 《情报杂志》 CSSCI 北大核心 2017年第2期122-126,107,共6页
[目的/意义]针对目前在线网络海量信息难以快速获取其舆情的问题,为有效提升舆情获取速度,提出一种基于云计算的网络舆情藤蔓式串并行聚类方法。[方法/过程]首先构建舆情文本相似性度量模型,并设计确定舆情最佳聚类阈值的方法,以度量舆... [目的/意义]针对目前在线网络海量信息难以快速获取其舆情的问题,为有效提升舆情获取速度,提出一种基于云计算的网络舆情藤蔓式串并行聚类方法。[方法/过程]首先构建舆情文本相似性度量模型,并设计确定舆情最佳聚类阈值的方法,以度量舆情信息间的相似性及确定舆情最佳聚类阈值;然后构建舆情藤蔓式串并行聚类模型,以一个舆情主题为聚类起始,之后如藤蔓的主干自动分支和延伸样,自主扩展舆情聚类主题,并根据舆情信息间的相似性和聚类阈值聚类同主题的舆情信息;最后在舆情藤蔓式串并行聚类模型的基础上,利用云计算的并行计算能力,快速、准确地聚类各主题的舆情信息。[结果/结论]实验结果表明:该方法能快速获取网络舆情,且具有较高的舆情聚类准确度,可为在线网络舆情实时监控提供一定的方法支持。 展开更多
关键词 在线网络舆情 云计算 文本相似性 藤蔓式串并行聚类
在线阅读 下载PDF
基于信号指纹的地磁异常识别算法 被引量:5
11
作者 徐鹏深 滕云田 +3 位作者 于子叶 王晓美 吴琼 胡星星 《地震学报》 CSCD 北大核心 2018年第1期79-88,共10页
本文基于信号指纹技术,通过研究短时(<10 min)地磁异常数据识别算法,完成了对地磁干扰信号类型的识别。本文所用信号指纹技术结合了短时傅里叶变换、小波变换、信号二值化、文本相似性哈希等多种数据和文本处理方法,将一定时间内的... 本文基于信号指纹技术,通过研究短时(<10 min)地磁异常数据识别算法,完成了对地磁干扰信号类型的识别。本文所用信号指纹技术结合了短时傅里叶变换、小波变换、信号二值化、文本相似性哈希等多种数据和文本处理方法,将一定时间内的波形数据转换为一个32位的整型数字,极大地压缩了信号的特征信息,因此在很大程度上减少了后续查找与分类过程中所需处理的数据。利用该算法对河北红山地磁台2016年5月1—3日两套GM4磁通门磁力仪的原始秒数据的计算结果表明,本文算法可以快速准确地识别干扰信号类型,为实现地磁相对观测数据中异常信号的自动提取提供技术支撑。 展开更多
关键词 短周期异常 信号指纹 文本相似性哈希
在线阅读 下载PDF
基于SolidWorks的三维模型智能化出图方法和系统 被引量:6
12
作者 支辰羽 方喜峰 +1 位作者 朱永辉 罗兰珍 《制造技术与机床》 北大核心 2023年第8期39-46,共8页
为提高工程图出图效率,减少简单重复的出图工作,并在实现智能化出图的基础上保证工程图出图的规范性,提出将机器学习应用到工程图出图中,利用文本相似性检索技术、图像相似性检索技术以及KNN算法,结合Python、VB.net对SolidWorks进行二... 为提高工程图出图效率,减少简单重复的出图工作,并在实现智能化出图的基础上保证工程图出图的规范性,提出将机器学习应用到工程图出图中,利用文本相似性检索技术、图像相似性检索技术以及KNN算法,结合Python、VB.net对SolidWorks进行二次开发,实现工程图视图的自动选择、图幅的智能选择、视图比例及位置调整等,保证视图选择的正确性、尺寸的规范性、布局的合理性,节省了大量人工手动出图时间。 展开更多
关键词 工程图 SOLIDWORKS二次开发 文本相似性检索技术 图像相似性检索技术 KNN
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部