期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

全文获取类型

收费全文	3篇
免费	1篇

学科分类

工业技术

4篇

出版年

2023年	1篇
2013年	1篇
2012年	1篇
2009年	1篇

排序方式： 共有4条查询结果，搜索用时 15 毫秒

统计与规则相结合的古文对联应对模型 总被引：1，自引：0，他引：1

张开旭孙茂松《中文信息学报》2009,23(1):100

该文将古文对联规则区分为硬规则与软规则,将软规则区分为字相对与上下文相对。并在软规则指导下建立对联应对的有向概率图模型,使用EM(Expectation-Maximization)算法估计模型参数,在求解的搜索过程中加入硬规则,从而给出了一种完整的对联自动应对方法。实验结果表明参数学习后的候选字列表由于一定程度上不考虑上下文相对的影响,比仅用频次统计的候选字列表更为合理。该方法还能够对训练语料库中工整与不工整的对联区分学习。基于该方法所实现的古文对联应对程序达到了一定水平。
相似文献

执行中文分词和词性标注的统一框架

下载免费PDF全文

张开旭孙茂松《中国通信》2012,9(3):1-9

The paper proposes a unified framework to combine the advantages of the fast one-at-a-time approach and the high-performance all-at-once approach to perform Chinese Word Segmentation (CWS) and Part-of-Speech (PoS) tagging. In this framework, the input of the PoS tagger is a candidate set of several CWS results provided by the CWS model. The widely used one-at-a-time approach and all-at-once approach are two extreme cases of the proposed candidate-based approaches. Experiments on Penn Chinese Treebank 5 and Tsinghua Chinese Treebank show that the generalized candidate-based approach outperforms one-at-a-time approach and even the all-at-once approach. The candidate-based approach is also faster than the time-consuming all-at-once approach. The authors compare three different methods based on sentence, words and character-intervals to generate the candidate set. It turns out that the word-based method has the best performance. 相似文献

基于自动编码器的中文词汇特征无监督学习

张开旭周昌乐《中文信息学报》2013,27(5):1-8

大规模未标注语料中蕴含了丰富的词汇信息,有助于提高中文分词词性标注模型效果。该文从未标注语料中抽取词汇的分布信息,表示为高维向量,进一步使用自动编码器神经网络,无监督地学习对高维向量的编码算法,最终得到可直接用于分词词性标注模型的低维特征表示。在宾州中文树库5.0数据集上的实验表明,所得到的词汇特征对分词词性标注模型效果有较大帮助,在词性标注上优于主成分分析与k均值聚类结合的无监督特征学习方法。相似文献

房产测绘技术与测绘质量的控制措施探讨

张开旭《冶金管理》2023,(9):79-81

房产测绘技术在验房、收房过程中起着不可替代的作用,可帮助人们了解房屋的界限、权属和位置。如今,房地产行业蓬勃发展,各地区纷纷掀起房屋购置浪潮。然而,由于人们对房屋缺乏基础的了解,引发了热议与争端。房产测绘技术也因此得到了广泛关注,有利于减少房产引发的各类问题,共创社会和谐。为此,对房产测绘技术与测绘质量的控制进行探讨,用以提高测绘工作的整体水平。相似文献