針對連續型數值屬性標籤建構客製化之決策樹分類系統

来源 :第十七届海峡两岸信息管理发展与策略学术研讨会 | 被引量 : 0次 | 上传用户:wgy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
決策樹是眾多資料分類技術中,相當受歡迎的一種分類方法,主要是因為決策樹分類方法所探 勘出來的規則有較佳的可讀性。在過去的研究中,有關連續型數值屬性標籤之決策樹分類系統可以分為三種, 第一種是利用回歸樹分類法去預測單一數值資料,第二種是利用資料前處理的方式,將連續型數值資料預先 做離散化,再進一步的套用在分類方法中,第三種是透過決策樹長成的過程中依據數值型資料分佈的情形進 行動態的數值區間切割。然而,過去的方法存在著相當程度的限制,並且在現實生活中有許多的情況並不適合用過去的分類方法 來進行分類或預測的工作,因此本研究將開發一新型之決策樹演算法,可同時考量資料在不同情境中會有不 同分布的情況之下,進一步的將專家知識納入決策樹的建構過程當中,並透過智慧型動態離散化方法將數值 屬性資料做客製化的切割,以有效解決上述演算法中所面臨的問題。最後透過實驗結果呈現本研究所提之方 法能夠在兼顧分類規則的正確率以及明確度之條件下,挖掘出具有決策力且符合決策者需求的分類規則。
其他文献
Packing problems 的目的是為了尋找最好的方法將一組矩形集合置入於包覆矩形中,並產生最小 面積。此類的問題始於多項的產業中,如:鋼鐵業、造紙業、紡織業與交通業。在可接受的
会议
運動賽事的進行是現代人所經常引起關切的話題,一年四季皆會有特定的賽事供球員彼此較勁, 提供觀看者感官娛樂與運動員獲取榮譽及獎金的機會。賽程的安排往往是費時且耗人力的,
会议
术语注册是指对各种知识组织系统提供权威的、集中控制的存储,以促进知识组织资源在信息系统和信息服 务中的发现、重用、管理、标准化和互操作。术语服务是指对知识组织系统
会议
长期以来,植物育种多以有性杂交的方法进行,但由于植物的生殖隔离,许多植物存在杂交不亲和性,限制了有性杂交的组合和范围。另外,多数植物雌雄配子(即性细胞)间遗传物质的交
情感分析是对用户在Web 网络上发表的评论进行意见抽取的最新研究领域,目前的研究聚焦在情感的极 性识别。而对于网络应用的深入发展,单纯的极性分类已显得单薄,更需要对评论进