语义分析和文本分析有什么区别?很紧急!!!!!
1,语义分析是编译过程中的一个逻辑阶段,语义分析的任务是审查结构正确的源程序的上下文相关性质和类型。语义分析是检查源程序是否有语义错误,为代码生成阶段收集类型信息。例如,语义分析的任务之一是进行类型审查,检查每个运算符是否有语言规范允许的操作数。当它不符合语言规范时,编译器应该报告一个错误。如果一些编译器希望在实数用作数组下标时报告错误。比如有些程序规定操作数是可以强制的,所以在对一个整数和一个实对象进行二元运算时,编译器要把整数转换成实对象,不能认为是源程序的错误。
2.文本分析是指文本的表征及其特征项的选择;文本分析是文本挖掘和信息检索中的一个基本问题。它量化从文本中提取的特征词来表示文本信息。将它们从一个非结构化的原始文本转化为计算机可以识别和处理的结构化信息,即对文本进行科学抽象,并建立其数学模型来描述和替代文本。这样计算机就可以通过这个模型的计算和运算来识别文本。由于文本是非结构化数据,要想从大量的文本中挖掘出有用的信息,首先要把文本转换成可管理的结构化形式。目前人们通常用向量空间模型来描述文本向量,但是如果直接用分词算法和词频统计方法得到的特征项来表示文本向量中的各个维度,那么这个向量的维数就会非常大。这种未经处理的文本向量不仅给后续工作带来了巨大的计算开销,使得整个处理过程效率非常低,而且损害了分类和聚类算法的准确性,从而使得得到的结果不尽人意。因此,需要在保证原意的基础上,进一步净化文本向量,找出最有代表性的文本特征。为了解决这个问题,最有效的方法就是通过特征选择来降低维数。