超星尔雅学习通《大数据算法(哈尔滨工业大学)》2023章节测试答案-6

A、调度

B、数据分布

C、将中间数据进行聚集、排序或洗牌

D、进行错误处理

正确答案:ABCD

4、理想的可扩展性有()。

A、数据加倍,运行时间减半

B、数据加倍,运行时间加倍

C、资源加倍,运行时间减半

D、资源加倍,运行时间加倍

正确答案:BC

5、Map()和Reduce()两个函数不能够并行运行。()

正确答案:X

7.2字数统计

1、在版本1的字数统计中,在Map里使用了一个数组H,其作用是为每一个出现的单词作()。

A、序列

B、基数

C、集合

正确答案:B

7.3平均数计算

1、大部分时候reducer不能用作combiner。()

正确答案:√

2、combiner的运行次数可能有多次。

正确答案:√

7.4单词共现矩阵的计算

1、关于单词共现矩阵的计算,说法正确的是()。

A、计算文本集合中词的共现矩阵

B、词的个数如果为N,输出为M*N的矩阵

C、是一种测量语义距离的方法

D、语义距离可用于许多语言处理任务

正确答案:ACD

2、用单词共现矩阵解决大规模计数问题的基本方法是()。

A、Mapper生成部分计数

B、Reducer生成部分计数

C、Reducer聚合部分计数

D、Mapper聚合部分计数

正确答案:AC

3、“条纹法”的优点有()。

A、易于实现

B、对key-value对的排序和洗牌少得多

C、潜在对象更大

D、能更好地利用combiner

正确答案:BD

4、在“词对法”中,每个mapper处理一个句子。()

正确答案:√

5、“词对法”的缺点是不易实现,排序和洗牌代价高。()

正确答案:X

6、f(B|A)词对法必须确定所有a被传递到同一个combiner。()

正确答案:X

8.1连接(join)算法

1、在repartitionjoin的改进中,说法错误的是()。

A、Map函数的输出键作为连接键

B、Map函数的输出键变化为连接键和表名的组合。

C、Partition函数中Hashcode仅从组合键的连接键计算

D、Grouping函数仅根据连接键分组纪录

正确答案:A

2、用MR进行多重集相似连接算法的常见计算包括()。

A、三角函数

B、单元函数

C、合取函数

D、析取函数

正确答案:BCD

3、自然连接是从两个关系的笛卡尔积中选取给定属性间满足一定条件的元组。()

正确答案:X

4、等值连接不必在结果中去掉重复的属性。()

正确答案:√

8.2图算法

1、在迭代MapReduce中,reduce的输出必须和map的输入兼容。()

正确答案:√

2、“推荐好友”是图算法在社交网络中的一种实际用例。()

你可能感兴趣的试题