A.梯度下降法
B.最小均方误差
C.最大均方误差
D.平均值法
您可能感兴趣的试卷
你可能感兴趣的试题
A.批量梯度下降法(BGD)每一次对模型参数的调整,都朝向代价函数值减小的方向
B.批量梯度下降法(BGD)每一次对模型参数的调整,都朝向代价函数值增加的方向
C.批量梯度下降法(BGD)每一次对模型参数的调整,都朝向代价函数值不变的方向
D.批量梯度下降法(BGD)每一次对模型参数的调整,都朝向代价函数值发生变化的方向
A.随机梯度下降法最终收敛的点不一定是全局最优
B.随机梯度下降法最终收敛的点一定是全局最优
C.无论随机梯度下降法存不存在最终收敛的点,一定可以找到最优解
D.无论随机梯度下降法存不存在最终收敛的点,一定不能找到最优解
A.不可以
B.可以
C.步长取值可以任意
D.其余三种说法都不对
A.存在不可识别区域较多的问题
B.多分类线性判别函数形式复杂
C.多分类线性判别函数的意义不明确
D.分类器的整体性能比较好
A.仅有一个判别函数值大于0
B.有两个判别函数值大于0
C.三个判别函数值都小于0
D.三个判别函数值都大于0
最新试题
ID3方法的目的是降低系统信息熵。
隐含层或输出层具有激活函数。
在进行交叉验证时,一般让临时训练集较大,临时测试集较小,这样得到的错误率估计就更接近用全部样本作为训练样本时的错误率。
动态顺序前进法(l-r)法是按照单步最优的原则从未入选的特征中选择l个特征,再从已入选的特征中剔除r个特征,使得仍保留的特征组合所得到的J值最大。
分级聚类又叫层次聚类,需要构建聚类树。
当各类的协方差矩阵不等时,决策面是超二次曲面。
下面关于贝叶斯分类器的说法中错误的是()。
概率密度函数的估计的本质是根据训练数据来估计概率密度函数的形式和参数。
在监督模式识别中,分类器的形式越复杂,对未知样本的分类精度就越高。
过拟合不会影响分类模型的泛化能力。