《AI助力高效物流 - K均值》学习任务单
(建议课时:2)
学 校:__________________________
姓 名:__________________________
班 级:__________________________
任务一:认识数据。
我们的数据包括中国主要城市的相关信息,格式为 CSV。运行第一、二段程
序,初步认识数据集,并填写下表:
运行结果分析
数据量 该数据集一共包含_______座城市
前两列 表示每座城市的__________________________________
后两列 表示每座城市的___________________________________
关键数据
回顾任务要求:“目前只需考虑中转站与全国主要城市之间的距离
远近”,所以我们需要使用的是第_________________________列;
任务二:K-Means理解
质心
概念
计算公式
K均值算
法流程图
任务三:模拟计算机进行 K均值运算
第一次聚类
质心 P1(2,4) Q1(3,4)
各点到质心
的距离
A
B
C
D
E
每一簇包含的点
新质心 P2( , ) Q2( , )
是否更新质心
第二次聚类
质心
各点到质心
的距离
A
B
C
D
E
新质心
是否更新质心
第三次聚类
质心
各点到质心
的距离
A
B
C
D
E
新质心
是否更新质心
任务四:K均值选址实战
小组合作,一半组员设置相同 K值但 random_state不同,另一半组员设置相
同 random_state但 K值不同。n_init统一设定为 10。记录每位成员的运行结果,
记录在以下表格。验证不同的初始质心和 K值是否会影响聚类结果?
站点数
random_
state
中转站坐标(保留 1位小数)
任务五:轮廓系数理解
(1)小组合作,计算活动 3的聚类结果的轮廓系数,填写下表
数据点 内聚度 分离度 单点轮廓系数 全体平均轮廓系数
A
B
C
D
E
(2)小组合作,每位成员使用以下程序计算自己的选址轮廓系数,完成下表
组员 random_state K n_init 轮廓系数 评价
课后作业
我的收获: