论文部分内容阅读
对复句层次结构和层次关系进行分析和研究之前,首先要确定有标复句中分句的数量,即有标复句中的哪些字段是分句,哪些字段只是加了标点符号的句法成分(文中称之为短语字段)。结合语言学的相关理论,提取出识别短语字段的因素,并对这些因素进行主成分分析,从而得出进行识别的综合影响因素以及与原始的具体因素之间的关系。结果表明,前三个主成分所包含的信息量接近85%,已包含原有因素大部分的信息,在今后的研究中,这三个主成分将取代原来的多个变量,从而简化研究的复杂度。