热点:

    SPSS Modeler类型节点解析

      [   原创  ]   作者:
    收藏文章 暂无评论

    类型节点用于刻画字段中数据的特性。当字段的所有属性均明确时,称其为完全实例化。字段的类型与其存储方式不同,它表明数据以何种形式存在,如字符串、整数、实数、日期、时间或时间戳等。

    1、 范围

    2、 用于表示数值区间,如0至100或0.75至1.25,可包含整数、实数及日期时间类型。

    3、 离散

    4、 适用于字符串值,当无法预知非重复值的具体数量时使用。该数据类型未被实例化,意味着其存储和使用方式尚未完全确定。在读取数据后,其实际类型将根据stream properties对话框中设定的最大集合大小,自动转换为flag、set或无类型中的一种。

    5、 标志

    6、 适用于包含两个不同取值的数据,如是与否或1与2。数据可表现为文本、整数、实数或日期时间类型,其中日期时间包括时间、日期和时间戳三种存储形式。

    7、 集

    8、 用于表示包含多个不同取值的数据,每个取值均被视为集合中的一个元素,如small、medium、large。在本版Clementine中,集合可存储数值、字符串或日期时间类型。需注意,将数据类型设为集合形式并不会自动将其元素转换为字符串类型,原始数据类型仍会被保留。

    9、 有序集合

    10、 用于表示包含多个具有内在等级或顺序关系的取值类型,这类数据被称为有序集。例如,薪资等级、客户满意度评分等均可定义为有序集。其内部元素按照自然排序规则确定先后顺序:如整数序列1、3、5按数值大小排列,字符串如HIGH、LOW、NORMAL则依据字母升序进行排序。通过将分类变量定义为有序集,可将其作为序数数据参与分析与建模,在可视化展示、决策树算法(如C5.0、C&R树)以及两步聚类等模型中发挥重要作用。同时,该类型支持导出至其他能识别序数属性的外部系统,例如SPSS统计软件。有序集字段的使用场景广泛,凡是可以应用普通集合字段的位置均可用有序集替代。此外,无论是实数、整数、字符串,还是日期、时间等存储类型的变量,均可被设定为有序集形式,从而更准确地反映数据本身的层级结构和顺序特征。

    11、 无类型

    12、 适用于不满足前述分类的数据,或包含大量成员的集合类型。当字段为多成员集合(如账户列表)时尤为适用。选择无类型后,角色将自动设为无。集合默认最多容纳250个唯一值,该限制可在流属性对话框中修改或关闭。

    13、 值

    14、 双击任意字段名称,可设置Clementine中数据的值与字段标签。例如,在类型节点中可查看或调整从SPSS导入的字段元数据,也可为字段及其取值创建新标签。根据流属性对话框中的设定,类型节点中定义的标签将在整个Clementine流程中统一显示和应用。

    15、 方向

    16、 用于指定建模节点中各字段在机器学习中的作用,即作为输入(自变量)或输出(因变量)。除常见的输入与输出方向外,还支持Both(同时作为输入和输出)和None(不参与建模)两种设定。此外,Partition表示该字段用于将数据划分为训练、测试和验证等独立样本集,具体配置可参考字段方向设置说明。

    17、 缺失

    18、 设定被视为空白的值。

    19、 检查

    20、 在检查列可设定条件,确保字段值处于规定范围内。

    21、 实例化设置

    22、 通过值列可设定读取数据集数值的方式,选择指定则打开新对话框进行详细配置,亦可选择仅传递字段而不提取其实际数值。

    23、 工具菜单按钮

    24、 忽略唯一字段会自动跳过仅含单一值的字段。

    25、 忽略大型集会自动排除成员数量过多的集合。

    26、 创建筛选节点,用于过滤并丢弃指定字段数据。

    27、 太阳镜模式切换

    28、 可将所有字段的默认值设为读取或传递状态。源节点中的类型选项卡默认传递字段,而类型节点本身则默认读取数值。

    29、 清空数值按钮

    30、 可撤销对该节点字段值的修改(不含继承值),并重新获取上游数据。此功能可用于恢复上游特定字段的原始设置。

    31、 可将节点中所有字段的值重置为初始状态,使各字段恢复读取模式。该功能适用于清除现有数据,重新从上游获取最新的值与类型信息,确保数据同步准确。

    32、 启用查看未使用字段功能进行设置

    33、 可查看数据中已消失或未连接至此类型节点的字段类型设置,便于在数据集变更后重复利用类型节点。

    soft.zol.com.cn true https://soft.zol.com.cn/1094/10947555.html report 3247 类型节点用于刻画字段中数据的特性。当字段的所有属性均明确时,称其为完全实例化。字段的类型与其存储方式不同,它表明数据以何种形式存在,如字符串、整数、实数、日期、时间或时间戳等。 1、 范围 2、 用于表示数值区间,如0至100或0.75至1.25,可包含整数、实数及日...
    不喜欢(0) 点个赞(0)
    随时随地资讯查报价 就上ZOL手机客户端,点击或扫描二维码下载
    立即下载

    CONSIDEO MODELER

    更新时间:2010年04月27日

    用户评分:8 | 1人点评

    软件类型:共享软件

    软件语言:英文

    CONSIDEO MODELER
    • 更新时间:2010年04月27日
    • 软件大小:69.3MB
    • 软件分类:办公应用
    • 语言种类:英文
    • 软件评级:1 人点评