Skip to content

第 12 章 综合题库与答案

使用方式

先做题,再看答案。错题回到对应章节复习。

一、单项选择题

  1. 人工智能训练师的职业编码是:
    A. 4-04-05-05 B. 4-07-02-04 C. 2-02-10-09 D. 6-31-01-03

  2. 训练集的主要作用是:
    A. 学习模型参数 B. 最终评估模型 C. 发布模型 D. 存储日志

  3. 验证集的主要作用是:
    A. 调超参数和选模型 B. 替代训练集 C. 删除异常值 D. 加密数据

  4. Precision 主要衡量:
    A. 预测为正的样本中真正为正的比例 B. 真实正类被找回比例 C. 总样本数 D. 负类总数

  5. Recall 主要衡量:
    A. 真实正类被找回比例 B. 预测正类准确比例 C. 数据库大小 D. 网络延迟

  6. 类别极不平衡时,单看哪个指标最可能误导?
    A. Accuracy B. F1 C. PR-AUC D. Recall

  7. K-Means 属于:
    A. 无监督学习 B. 监督学习 C. 强化学习 D. 数据加密

  8. 逻辑回归通常用于:
    A. 分类 B. 文件压缩 C. 图像显示 D. 路由选择

  9. Transformer 的核心机制是:
    A. 自注意力 B. SQL 查询 C. 哈希索引 D. 冒泡排序

  10. BERT 通常更适合:
    A. 理解类任务 B. 数据库备份 C. 磁盘分区 D. 网络布线

  11. GPT 通常更适合:
    A. 生成类任务 B. 数据库事务 C. 操作系统调度 D. 路由转发

  12. LoRA 的主要特点是:
    A. 冻结主体模型,只训练低秩增量参数 B. 训练全部参数 C. 不需要数据 D. 只用于图像显示

  13. RAG 的主要作用是:
    A. 检索外部知识增强生成 B. 删除知识库 C. 替代权限管理 D. 压缩硬盘

  14. IoU 表示:
    A. 预测框与真实框交并比 B. 分类准确率 C. 训练轮数 D. 数据库连接数

  15. mAP 常用于评价:
    A. 目标检测 B. 事务隔离 C. 文本编码格式 D. 内存容量

  16. NMS 的作用是:
    A. 去除重复检测框 B. 增加重复框 C. 加密图片 D. 修改标签体系

  17. SQL 中分组用:
    A. GROUP BY B. ORDER BY C. LIMIT D. UPDATE

  18. 事务 ACID 中 D 表示:
    A. Durability B. Dropout C. DNS D. DataFrame

  19. HTTPS 相比 HTTP 增加了:
    A. TLS 安全保护 B. 图像分类能力 C. 数据标注能力 D. GPU 训练能力

  20. 匿名化的关键是:
    A. 无法识别且不能复原 B. 改文件名 C. 简单打码且可复原 D. 压缩文件

二、多项选择题

  1. 人工智能训练师工作可能包括:
    A. 数据库管理 B. 算法参数设置 C. 人机交互设计 D. 性能测试跟踪

  2. 数据清洗包括:
    A. 缺失值处理 B. 重复值处理 C. 异常值处理 D. 格式统一

  3. 数据质量维度包括:
    A. 准确性 B. 完整性 C. 一致性 D. 及时性

  4. 缓解过拟合的方法包括:
    A. 正则化 B. Dropout C. 数据增强 D. 早停

  5. 下列属于无监督学习的是:
    A. K-Means B. PCA C. DBSCAN D. 线性回归

  6. 深度学习常见优化器包括:
    A. SGD B. Adam C. AdamW D. DNS

  7. Transformer 组件包括:
    A. 自注意力 B. 多头注意力 C. 位置编码 D. 残差连接

  8. 参数高效微调方法包括:
    A. LoRA B. Adapter C. Prefix Tuning D. QLoRA

  9. RAG 系统通常包括:
    A. 文档切分 B. Embedding C. 向量检索 D. 生成回答

  10. 目标检测输出通常包括:
    A. 类别 B. 边界框 C. 置信度 D. 事务隔离级别

  11. 模型部署前应检查:
    A. 输入输出格式 B. 依赖版本 C. 训练推理预处理一致性 D. 监控回滚机制

  12. 数据安全措施包括:
    A. 加密 B. 脱敏 C. 最小权限 D. 日志审计

  13. 敏感个人信息包括:
    A. 生物识别 B. 医疗健康 C. 金融账户 D. 行踪轨迹

  14. AI 伦理原则包括:
    A. 公平 B. 透明 C. 安全 D. 可控

  15. 生成式 AI 风险包括:
    A. 幻觉 B. 隐私泄露 C. 版权侵权 D. 深度伪造

三、判断题

  1. 测试集可以反复用于调参。
  2. 数据标注规范应包含标签定义和边界规则。
  3. 类别不平衡时 Accuracy 可能虚高。
  4. Dropout 可以缓解过拟合。
  5. BERT 通常偏理解,GPT 通常偏生成。
  6. LoRA 需要训练全部模型参数。
  7. RAG 可以在不重新训练模型的情况下接入外部知识。
  8. 匿名化和去标识化完全相同。
  9. HTTPS 提供加密传输能力。
  10. 数据漂移指输入数据分布变化。
  11. 概念漂移指特征和标签关系变化。
  12. NMS 用于去除重复检测框。
  13. IoU 越高通常表示框重叠越好。
  14. SQL 的 HAVING 用于分组后过滤。
  15. 加密后就完全不需要权限控制。

答案

单选答案

  1. A
  2. A
  3. A
  4. A
  5. A
  6. A
  7. A
  8. A
  9. A
  10. A
  11. A
  12. A
  13. A
  14. A
  15. A
  16. A
  17. A
  18. A
  19. A
  20. A

多选答案

  1. ABCD
  2. ABCD
  3. ABCD
  4. ABCD
  5. ABC
  6. ABC
  7. ABCD
  8. ABCD
  9. ABCD
  10. ABC
  11. ABCD
  12. ABCD
  13. ABCD
  14. ABCD
  15. ABCD

判断答案

  1. 错误
  2. 正确
  3. 正确
  4. 正确
  5. 正确
  6. 错误
  7. 正确
  8. 错误
  9. 正确
  10. 正确
  11. 正确
  12. 正确
  13. 正确
  14. 正确
  15. 错误

易错解析

  1. 测试集只做最终评估,不能反复调参。
  2. Precision 防误报,Recall 防漏报。
  3. LoRA 是参数高效微调,不是全量微调。
  4. RAG 是检索增强生成,不改模型参数。
  5. 匿名化不可复原,去标识化可能复原。
  6. 数据漂移是输入变,概念漂移是规律变。
  7. 加密只是安全措施之一,还要权限、审计、备份、应急。