The Study on Some Issues of the Uygur Text Classification
维吾尔文文本分类中若干问题的研究

文本分类作为在数据挖掘领域中的一项具有较大实用价值的关键技术,可以在很大程度上解决信息杂乱的问题,方便用户准确地定位和分流所需的信息。随着文本分类技术在信息检索、意见挖掘、舆情分析、信息过滤、新闻分类和数字图书馆等多个领域的广泛应用,文本分类关键技术的研究已经成为信息处理领域的一个前沿课题。

Components of the Book:
  • FRONT MATTER
    • 前言
    • 目录
  • Chapter 1 Introduction
    第一章 绪论
    • 研究背景
    • 研究意义
    • 研究现状
    • 文本分类基本技术
    • 维吾尔文文本分类研究现状
    • 本书工作
    • 本书内容安排
  • Chapter 2 Summary of Text Classification
    第二章 文本分类概述
    • 问题描述
    • 文本表示模型
    • 文本预处理
    • 特征选择
    • 特征加权
    • 分类方法
    • 分类性能评价
    • 本章小结
  • Chapter 3 Uighur Text Classification for Data Collection and Pretreatment
    第三章 面向维吾尔文文本分类的数据集及预处理
    • 引言
    • 数据集
    • 预处理
    • 实验平台
  • Chapter 4 Uighur Text Feature Selection
    第四章 维吾尔文文本特征选择
    • 引言
    • 传统的特征选择方法及分析
    • 基于类别分布差异和特征熵的特征选择方法
    • 实验结果及分析
    • 本章小结
  • Chapter 5 Uighur Bigram Text Feature Extraction
    第五章 维吾尔文Bigram文本特征提取
    • 引言
    • Bigram特征对分类的作用
    • CHI和PMI统计量的分析与改进
    • 基于CHI-PMI的Bigram特征提取算法
    • 实验及结果分析
    • 本章小结
  • Chapter 6 Weight calculation Based on Features of Class Information
    第六章 基于类别信息的特征权重计算
    • 引言
    • 相关研究工作
    • 现有权重计算方案研究
    • 引入类别信息的特征权重计算方案
    • 实验及分析
    • 本章小结
  • Chapter 7 Semi-supervised Text Classification Combined with Centroid and EM
    第七章 Centroid和EM结合的半监督文本分类
    • 引言
    • 半监督分类技术
    • Centroid和EM结合的半监督文本分类算法
    • 实验及分析
    • 本章小结
  • Chapter 8 Summary and Outlook
    第八章 总结与展望
    • 总结
    • 展望
  • BACK MATTER
    • 参考文献
    • 后记
    • 作者简历
1
FRONT MATTER
Alimjan Aysa,Kurban Ubul,Tuergen Yibulayin
PDF (861 KB)
11
Chapter 1 Introduction
第一章 绪论

Alimjan Aysa,Kurban Ubul,Tuergen Yibulayin
PDF (365 KB)
39
Chapter 2 Summary of Text Classification
第二章 文本分类概述

Alimjan Aysa,Kurban Ubul,Tuergen Yibulayin
PDF (351 KB)
62
Chapter 3 Uighur Text Classification for Data Collection and Pretreatment
第三章 面向维吾尔文文本分类的数据集及预处理

Alimjan Aysa,Kurban Ubul,Tuergen Yibulayin
PDF (321 KB)
69
Chapter 4 Uighur Text Feature Selection
第四章 维吾尔文文本特征选择

Alimjan Aysa,Kurban Ubul,Tuergen Yibulayin
PDF (533 KB)
92
Chapter 5 Uighur Bigram Text Feature Extraction
第五章 维吾尔文Bigram文本特征提取

Alimjan Aysa,Kurban Ubul,Tuergen Yibulayin
PDF (469 KB)
112
Chapter 6 Weight calculation Based on Features of Class Information
第六章 基于类别信息的特征权重计算

Alimjan Aysa,Kurban Ubul,Tuergen Yibulayin
PDF (627 KB)
132
Chapter 7 Semi-supervised Text Classification Combined with Centroid and EM
第七章 Centroid和EM结合的半监督文本分类

Alimjan Aysa,Kurban Ubul,Tuergen Yibulayin
PDF (442 KB)
149
Chapter 8 Summary and Outlook
第八章 总结与展望

Alimjan Aysa,Kurban Ubul,Tuergen Yibulayin
PDF (281 KB)
152
BACK MATTER
Alimjan Aysa,Kurban Ubul,Tuergen Yibulayin
PDF (844 KB)
Alimjan Aysa, 新疆大学网络与信息技术中心教师,副教授,计算机应用博士

Kurban Ubul, 新疆大学信息科学与工程学院副教授,硕士生导师

Tuergen Yibulayin, 现任新疆大学信息科学与工程学院院长,教授,博士生导师

Copyright © 2006-2024 Scientific Research Publishing Inc. All Rights Reserved.
Top