“语篇瓦片叠压”(TextTiling)技术解析

来源 :语料库语言学 | 被引量 : 0次 | 上传用户:cygggg
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
体裁分析日益受到学界关注,“自上而下”的语步分析是其主流方法。语篇瓦片叠压(Text Tiling)技术已在文献检索、自动摘要等文本分析领域得到运用,可用来对说明性文本和学术论文等进行子话题(VBDU)自动、批量切分,与人工切分达到了很好的一致性,也和语步方法在语篇组织整体模式分析方面相一致。语篇瓦片叠压程序Python版本主要参数均可进行个性化设置,以满足不同文本类型、不同研究目的的需要。语篇瓦片叠压程序可分析书面语和口语,对理想文本的要求是:文本文件,英语语言,说明文本/科学杂志文章/学术论文/非文学文本,无(小)标题,文本长度300字以上、包含多个段落等。语篇瓦片叠压技术可尝试作为“自下而上”的体裁分析法,可以和语步方法相结合或作为其有益的补充。 Genre analysis is increasingly concerned by the academic community, “top-down ” step by step analysis is the mainstream method. Text Tiling technology has been used in text analysis such as document retrieval and automatic summarization. It can be used to automatically and batch sub-topics (VBDU), such as descriptive texts and academic papers, Points reached a very good consistency, but also with the step-by-step approach to the discourse analysis of the overall model consistent. Text Tile Stacking Program Python version of the main parameters can be personalized settings to meet different text types, different research purposes. Textual Tile Stacking Program Analyzes written and spoken language. The requirements for ideal text are: text file, English language, explanatory text / scientific journal article / scholarly thesis / non-literary text, no (small) title, text length 300 words Above, contains multiple paragraphs and so on. Discourse tile overlay technology can be used as a “bottom-up” genre analysis, which can be combined with or as a helpful complement to the step-by-step approach.
其他文献
┏━━━━━━━━━┳━━━━━━━━━━━━━━━┳━━━━━━━━━━━━━┳━━━━━━━━━━━━━┳━━━━━━━━━━━━━━┓┃ 阶段 ┃ 第一代 ┃
本研究以力学试验为基础,探讨使用单组份聚氨酯胶接的六层青杨集成材的抗弯性能,并与同尺寸的间苯二酚树脂胶接的四层与六层青杨集成材进行对比分析.试件尺寸均为3000(L)×60
为将南宁市埌东污水处理厂二级出水TP从一级B提升至一级A标准,对该厂出水进行了化学除磷研究.以硫酸铝、聚合氯化铝(PAC)、聚合硫酸铁(PFS)、氯化铁和聚合氯化铝铁(PAFC)为材
会议
非常时期"教和学"的方式有所改变,作为教育工作者要对"教和学"的关系重新认识。"教和学"的关系不能停留在传统的对立统一上,教学相长的层面还应深化和拓展到"教和学"的相互理
导热油加热工艺是人造板生产中非常重要的工艺过程,但由于选油、用油的不当,成为了许多导热油用户运营中的安全隐患,该如何安全选择和使用导热油成为了人们关注的话题,探讨选
期刊