判断题完整的数据聚类过程一般包括选定特征,设定聚类准则,选择聚类算法和聚类结果评估。
您可能感兴趣的试卷
你可能感兴趣的试题
3.判断题聚类结果是“无遗漏”和“无重复”的。
6.多项选择题下列选项中属于常用聚类准则的是?()
A.紧致性准则
B.散布准则
C.误差平方和准则
D.分布形式准则
7.多项选择题下列选项中可以用于样本间相似度度量标准的是?()
A.最短距离
B.最长距离
C.重心距离
D.类平均距离
E.曼哈顿距离
F.欧几里得距离
G.明考夫斯基距离
H.切比雪夫距离
8.多项选择题下列选项中可以用于类间相似度度量标准的是?()
A.最短距离
B.最长距离
C.重心距离
D.类平均距离
E.曼哈顿距离
F.欧几里得距离
G.明考夫斯基距离
H.切比雪夫距离
9.多项选择题数据聚类具有以下哪些特点?()
A.聚类是对整个样本集的划分,而不是对单个样本的识别
B.聚类的依据是“样本间的相似程度”
C.聚类结果是“无遗漏”、“无重复”的
D.数据聚类是典型的的有监督学习
10.多项选择题数据聚类中特征的选定应该考虑以下哪些因素?()
A.聚类任务的需求
B.特征对聚类任务的有效性
C.维度和算法效率
D.判别函数的选取
最新试题
类间离散度矩阵代表了每一个类的重心到整个样本集的重心之间的距离。
题型:判断题
概率密度函数的估计的本质是根据训练数据来估计概率密度函数的形式和参数。
题型:判断题
在总的样本集不是很大的情况下,可以采用交叉验证法来较好的估计分类器性能。
题型:判断题
C均值聚类算法对噪声和孤立点不敏感。
题型:判断题
概率密度函数的参数估计需要一定数量的训练样本,样本越多,参数估计的结果越准确。
题型:判断题
ID3方法的目的是降低系统信息熵。
题型:判断题
在进行交叉验证时,一般让临时训练集较大,临时测试集较小,这样得到的错误率估计就更接近用全部样本作为训练样本时的错误率。
题型:判断题
下面关于交叉验证法的说法中正确的是()。
题型:多项选择题
理想的判据应该对特征具有单调性,加入新的特征不会使判据减小。
题型:判断题
顺序后退法(SBS)是从0个特征开始,每次从已经入选的特征中剔除一个特征,使得仍保留的特征组合所得到的J值最大,是一种特征选择的最优算法。
题型:判断题