展开全部

主编推荐语

详解词语计算与应用的相关知识。

内容简介

本书共有四章,除了附录、后记外,核心内容词语的计算与应用,主要包括“领域新词语快速获取”、“词语分类和词语聚类”、“词语计算与辅助汉语教学”、“词语主题度计算与自动标引”几个方面,这些也都是目前理工科(包括图书馆的情报检索)关注的热门课题,属于人文学科与理工学科交叉的边缘领域。

语言信息处理、自然语言理解、人工智能、机器翻译等都是这一边缘领域的学科或课题。理工专业人士研究此类项目时,要补充人文专业知识(如语言学);人文专业人士研究此类项目,要补充理工专业知识(如计算机科学、数理科学)。相对而言,补充人文专业知识较容易,补充理工专业知识则较困难。也就是说,搞计算语言学,文科出身者比理工科出身者面临的压力大。

通常,理工科的人写的计算语言学的论著,满篇术语公式,文科读者觉得犹如读“天书”,但是刘华博士的《词语计算与应用》并非如此。因为是文科出身的人写给文科出身的人读的书,作为一个“过来人”,他能设身处地为读者着想,每个术语都有诠释,甚至每个公式都有解读,文科的人读来并不觉得过于深奥晦涩。

目录

  • 版权信息
  • 1领域新词语快速获取
  • 1.1 新词语识别和聚类综述
  • 1.2 基于分类网页链接分析的领域新词语发现
  • 1.3 分类新词语分析
  • 1.3.1 词语抽取的准确率与排错处理
  • 1.3.2 抽取词语的新词率
  • 1.3.3 新词语在切分中的作用
  • 1.3.4 新词语的强文本表示功能
  • 小结
  • 参考文献
  • 2词语分类和词语聚类
  • 2.1 词语分类和词语聚类综述
  • 2.2 基于分类特征提取的词语分类
  • 2.2.1 定义说明
  • 2.2.2 特征提取方法分析
  • 2.2.3 词语表与训练语料介绍
  • 2.2.4 算法实现
  • 2.2.5 实验结果分析
  • 2.2.6 实验结果举例
  • 2.3 基于大规模分类语料库关键词标引的词语聚类
  • 2.3.1 超大规模分类语料库和词语表说明
  • 2.3.2 利用关键词标引确定种子词语
  • 2.3.3 在大规模分类语料库中聚类词语
  • 2.3.4 聚类词语集成
  • 2.3.5 算法实现
  • 2.3.6 实验结果和分析
  • 小结
  • 参考文献
  • 3 词语计算与辅助汉语教学
  • 3.1 计算机辅助汉语教学综述
  • 3.2 辅助汉语教学的语料库建设
  • 3.3 词语搭配自动获取
  • 3.4 词汇常用度计算
  • 3.5 例句难易度计算
  • 3.6 基于语料库的对外汉语教学用分类词表的研制
  • 3.6.1 分类词表的特点和任务描述
  • 3.6.2 分类词表的研制原理
  • 3.6.3 分类词表的研制流程
  • 3.6.4 几点说明
  • 3.7 面向对外汉语教学的话题聚类研究
  • 3.7.1 报刊阅读与话题课
  • 3.7.2 话题与话题词簇
  • 3.7.3 报刊阅读课现状分析与目标描述
  • 3.7.4 系统实现及结果分析
  • 小结
  • 参考文献
  • 4词语主题度计算与自动标引
  • 4.1 词语主题度数学模拟
  • 4.1.1 词语主题度计算的理论基础
  • 4.1.2 词语主题度数学模拟
  • 4.2 基于词语主题度的标引知识自动获取
  • 4.2.2 专家标引的网页关键词获取
  • 4.2.2 关键词主题度计算
  • 4.3 基于词语主题度的文献综合自动标引
  • 4.3.1 文献综合自动标引概述
  • 4.3.2 文献综合自动标引总体流程
  • 4.3.3 关键词文档权重计算
  • 4.3.4 关键词自动标引实现
  • 4.3.5 自动文摘实现
  • 4.3.6 基于关键短语的立体文本分类模型
  • 4.4 文献情报自动标引系统介绍
  • 4.4.1 系统概述
  • 4.4.2 面向的行业类型
  • 4.4.3 功能模块
  • 小结
  • 参考文献
  • 附录1网络新闻用层级分类体系
  • 附录215大类分类词语表
  • 附录3 244个层级小类分类词语
  • 附录4聚类种子词语
  • 附录5聚类词语
  • 附录6HSK(商务)词语表
  • 后记
展开全部

评分及书评

尚无评分
目前还没人评分

出版方

暨南大学出版社

暨南大学出版社为“侨”而生,因“侨”而兴,砥砺卅五载,春华秋实,书香五洲,声教四海。始立以来,以“侨”为“桥”,厚植文化,秉承推动华文教育、服务教学科研、传承传播中华优秀传统文化的出版理念,着力华文教材、华侨华人研究、岭南文化研究、高校学术研究成果的出版,已累计出版各类图书7000余种,《中文》《汉语》等华文教材发行海外80多个国家和地区。