大家好,现在宣布CDA数据分析师认证考试三级模拟试题时间到了 。今天,我们给大家带来模拟试题(1)中的第31-35题 。(选择题)
不过在出题之前,先公布一下《三级》最后一期第26-30题的答案,一起看看吧!
26、乙
27、A
28、C
29、A
30、乙
31、自然语言处理工作中,在自动构造关键词(非控制词汇)时,常用的方法是?
A.受控词汇
B.条款倒置(逐项)
C.反向文档频率
D.全文扫描
32、向量空间模型是一种信息检索技术,下面描述向量空间模型(VSM),错误是:
A.当文档用向量表示时,它们之间的夹角越小,相似度越高 。
B.文本特征词的向量权重可以通过TF-IDF实现,从而保留文本词序结构的信息
C.在向量空间模型中,当添加新文档时,需要重新计算特征词的权重
D.在基于向量的文本相似度计算中,除内积、Dice系数和夹角余弦外,还可以使用Jaccard方法
33.全文扫描、逐项倒排和签名文件是信息检索技术中的基本检索方法 。什么是信息检索技术中的签名文件?
A.计算点与点之间的距离,以查找类似于此查询的文档,并对它们进行排序以供输出
b.利用余弦相似度找出文件的相似度,按照相似度由大到小排序输出
c.将待搜索的字符串直接与原始字符串进行比较,进行快速字符串比较
D.签名文件使用重叠编码技术将文件转换为固定长度的签名,以加快字符串比较 。
34.中文自动分词是中文信息处理的重要基石 。困扰中文自动分词发展的原因有很多,歧义字段的消除是亟待解决的几个难题之一 。以下哪一项不属于多义词的经典歧义消除算法?
A.基于规则的算法
B.基于概率统计模型的算法
C.结合规则和统计的算法
D.基于协同过滤算法
35.Word2vec是一组用于生成单词向量的相关模型 。这些模型是浅层和双层神经网络,用于训练重建语言单词 。关于word2vec模型,以下说法不正确:
A.得到的词向量维数小,可以节省存储和计算资源
B.考虑全局语料库的信息
C.无法解决多义词的问题
d能表达单词之间的关系
仔细回答问题 。我们将在下期公布正确答案 。敬请期待 。
文章插图
报名方式登录官网进行CDA认证考试
报名费用一级:1200元
级:1700元
级:2000元
考试时间一级:用报告测试 。
二级:考试会跟报告 。
三级:一年四节(3月、6月、9月、12月最后一个周六),每节课的报名在考试前一个月截止 。
考试地点级:mainlandChina30个省市、70个市、250个考场 。考生可选择就近考场预约 。
【数据分析师报名入口,上海数据分析师培训机构推荐】三级:mainlandChina、北京/上海/天津/重庆/成都/深圳/广州/济南/南京/杭州/苏州/福州/太原/武汉/长沙/Xi安/贵阳/郑州/南宁/昆明/乌鲁木齐/沈阳/哈尔滨/合肥/石家庄/呼和浩特/南昌/长春/30个城市 。
- 澳大利亚议会修订隐私立法,企业泄露用户数据将重罚5000万澳元
- 大数据|你可能“涉黄”了?大数据“扫黄”将启动,符合以下特征要注意了
- 助理工程师报名条件,初级助理工程师报名时间厦门
- 数据仓库|华为P50 Pocket S 有哪些优点和不足?
- 土建施工员证报名 施工员要考什么证书
- 显卡|一文详解,数据仓库、数据库、数据中台、数据湖的区别
- 上海高级口译笔试,上海高级口译报名时间2021下半年
- 数据埋点设计实践案例解析
- 建筑企业大数据平台,建筑业企业资质证书怎么查
- 腾讯云NoSQL数据库产品2022再迎升级,多项技术细节首次公开