首页 | 官方网站   微博 | 高级检索  
文章检索
  按 检索   检索词:      
出版年份:   被引次数:   他引次数: 提示:输入*表示无穷大
  收费全文   3篇
  免费   1篇
工业技术   4篇
  2023年   1篇
  2013年   1篇
  2012年   1篇
  2009年   1篇
排序方式: 共有4条查询结果,搜索用时 15 毫秒
1
1.
统计与规则相结合的古文对联应对模型   总被引:1,自引:0,他引:1  
该文将古文对联规则区分为硬规则与软规则,将软规则区分为字相对与上下文相对。并在软规则指导下建立对联应对的有向概率图模型,使用EM(Expectation-Maximization)算法估计模型参数,在求解的搜索过程中加入硬规则,从而给出了一种完整的对联自动应对方法。实验结果表明参数学习后的候选字列表由于一定程度上不考虑上下文相对的影响,比仅用频次统计的候选字列表更为合理。该方法还能够对训练语料库中工整与不工整的对联区分学习。基于该方法所实现的古文对联应对程序达到了一定水平。
  相似文献   
2.
The paper proposes a unified framework to combine the advantages of the fast one-at-a-time approach and the high-performance all-at-once approach to perform Chinese Word Segmentation (CWS) and Part-of-Speech (PoS) tagging. In this framework, the input of the PoS tagger is a candidate set of several CWS results provided by the CWS model. The widely used one-at-a-time approach and all-at-once approach are two extreme cases of the proposed candidate-based approaches. Experiments on Penn Chinese Treebank 5 and Tsinghua Chinese Treebank show that the generalized candidate-based approach outperforms one-at-a-time approach and even the all-at-once approach. The candidate-based approach is also faster than the time-consuming all-at-once approach. The authors compare three different methods based on sentence, words and character-intervals to generate the candidate set. It turns out that the word-based method has the best performance.  相似文献   
3.
大规模未标注语料中蕴含了丰富的词汇信息,有助于提高中文分词词性标注模型效果。该文从未标注语料中抽取词汇的分布信息,表示为高维向量,进一步使用自动编码器神经网络,无监督地学习对高维向量的编码算法,最终得到可直接用于分词词性标注模型的低维特征表示。在宾州中文树库5.0数据集上的实验表明,所得到的词汇特征对分词词性标注模型效果有较大帮助,在词性标注上优于主成分分析与k均值聚类结合的无监督特征学习方法。  相似文献   
4.
房产测绘技术在验房、收房过程中起着不可替代的作用,可帮助人们了解房屋的界限、权属和位置。如今,房地产行业蓬勃发展,各地区纷纷掀起房屋购置浪潮。然而,由于人们对房屋缺乏基础的了解,引发了热议与争端。房产测绘技术也因此得到了广泛关注,有利于减少房产引发的各类问题,共创社会和谐。为此,对房产测绘技术与测绘质量的控制进行探讨,用以提高测绘工作的整体水平。  相似文献   
1
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号