![]() ![]() |
基于人工神经网络和向量空间模型的汉语体貌系统研究
基于统计学和机器学习算法, 以大规模语料库和知识库为依托, 对现代汉语中的体标记和动词情状类型之间的组合规律进行了深度挖掘, 最终以层次聚类算法验证并生成了现代汉语情状类型层级体系; 以人工神经网络算法实现了对汉语动词情状类型的自动预测; 以多元逻辑回归算法实现了对体标记和动词情状类型之间的统计学量化。首先根据现有研究, 提出假设, 即包括 ZHE、LE1、LE2、GUO、ZAI 和 ZHENGZAI 在内的方面标记能够对不同的情境类型进行分类, 然后将其所有的动词词义都手动链接到 Sinica 语料库的动词, 并根据语料库数据构建同现频率矩阵, 最后, 本书构建了一个包含动词意义及其情境类型的数据集, 并对其进行了评估测试。
你还可能感兴趣
我要评论
|