广告合作
  • 今日头条

    今日头条

  • 百度一下

    百度一下,你就知道

  • 新浪网

    新浪网 - 提供新闻线索,重大新闻爆料

  • 搜狐

    搜狐

  • 豆瓣

    豆瓣

  • 百度贴吧

    百度贴吧——全球领先的中文社区

  • 首页 尚未审核订阅工具 订阅

    spss中k-means聚类的操作方法

    来源:网络收集  点击:  时间:2024-04-03
    【导读】:
    k-means聚类是聚类方法中的一种,通常我们要预先确定case到底可以分为几类,然后才能进行这个聚类分析。另外,注意查看各个变量的量纲、平均数、方差齐性,如果不满足同质性,需要进行正太化转变,当然,数据要满足正态分布才可以啊哦。工具/原料more这种聚类方法不能自动的计算变量的Z分数,如果数据差异过大,量纲不同,需要进行z分数的转换,下面的操作没有告诉你如何转换z分数,你需要注意BRBRk-means的聚类的原理是迭代,迭代本身是无限的过程,如果没有命令,计算机就一直迭代下去,这样计算会很慢,所以我们设置一个迭代次数,比如100,那么迭代100次就必须停止。活着spss中有迭代停止的标准spss20.0BR方法/步骤1/12分步阅读

    准备好数据,在菜单栏上执行:analyse--classify--k-means cluster,打开k平均数对话框

    2/12

    将聚类用到的指标变量放入variables,将客户的编码放到label cases by当中,把客户编号作为case的标签

    3/12

    接着要设置聚类的类别数目,如图所示,这个数目不是随便给的,他有两个来源:要么是你根据工作经验,认为数据分为几类是最合理的;要么是你有前人的研究证明分为几类。

    4/12

    在主对话框中,点击iterate按钮,打开迭代对话框

    5/12

    将最大迭代次数设置为100,下图你看到的默认的迭代次数为10,但是数据量越大,迭代次数就应该越多,所以我们设置为100.点击continue按钮,返回到主对话框。

    6/12

    点击save按钮,因为我们想要保存分类的结果,并将结果保存到一个变量当中

    7/12

    打开一个自对话框,勾选cluster membership,点击continue返回到主对话框

    8/12

    点击ok,开始运行数据,并输出数据结果

    9/12

    我们看到的第一个表格叫做初始聚类中心,它列出每一个类别初始的中心点,这些中心点都是spss自动生成的。因为case的顺序会影响到中心点的位置,所以我们需要让case的顺序是随机的,有必要的时候要进行随机化处理

    10/12

    下面的两个表格是迭代过程表,你可以看到每一次迭代中心点的变化值,当中心点的变化小于初始类别中心最小距离的2%的时候,迭代就停止了,你看到的第二幅图在迭代35次以后就停止了迭代

    11/12

    下面这个表格叫做最终聚类中心,也就是各个类别在各个变量上的平均值,它可以帮助我们根据变量的平均值来给分类赋予实际的意义

    12/12

    最后的表格叫做各个类别case数,你可以读出在每一个类别中有多少case

    k-means
    本文关键词:

    版权声明:

    1、本文系转载,版权归原作者所有,旨在传递信息,不代表看本站的观点和立场。

    2、本站仅提供信息发布平台,不承担相关法律责任。

    3、若侵犯您的版权或隐私,请联系本站管理员删除。

    4、文章链接:http://www.ff371.cn/art_408773.html

    ©2019-2020 http://www.ff371.cn/ 国ICP备20009186号05-21 17:51:33  耗时:1.215