热度 5|
连续值离散化的目的是为了简化数据结构。
数据通常有这样几种类型:标称型,离散型和连续型。标称型目标变量的结果只在有限目标集中取值,如真与假、动物分类集合{ 爬行类、鱼类、哺乳类、两栖类} ;数值型目标变量则可以从无限的数值集合中取值,如0.100、42.001、1000.743 等。
现实生活中的数据往往来源于复合型,例如许多数据是数值型与离散型的复合。这就需要有一个统一的数据类型来进行数据处理。通过将属性值域划分为区间,数据离散化技术可以用来减少给定连续属性值的个数。离散属性比连续属性更接近于知识级的表达。对用户和专家而言,离散属性更易理解、使用和解释。 而使用离散属性所获得的结果往往更紧凑、简短和精确,因此其结果也更易被检查、比较、使用和重用。
这种离散化处理有什么好处呢,便于在某一个抽象层级来解决问题。其实就像一个筛子,通过一定的条件过滤,是一个层到另一个层的映射。
便于简化问题和降低复杂度。
××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××
说完了神童,再说说传统中国人是如何看问题的,传统中国人看问题的思维方式是经验,所以他看到一大堆数据就是一大堆数据。
太实诚了,呵呵
说实话啊,你不进行抽象分层,就永远也解决不了问题。(不否认有一些超人)
经验的思想看到的就是一堆数据,而神童很难看到整体,它看到的东西都是割裂的,也就是说他总是在找破绽,可能是心理紧张的后遗症。因为过早的进入成人世界,莫名的紧张。
心理上,神童做不到模糊化处理,也就是老百姓所说的,差不多就行了。
××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××
就此打住,闲了继续黑。是不是我自己也患上 “神童综合症” 了,成 “黑王” 了。
发挥中国人的山寨精神,把高科技做成大白菜。
GMT+8, 2024-11-23 17:02 , Processed in 0.029008 second(s), 17 queries , Gzip On.
Powered by Discuz! X3.2
© 2001-2013 Comsenz Inc.