上 传  者 : 周官平
单      位 : 教育技术与创新部
上传时间 : 2025-05-07 01:39:17
你听我说——初识文本编码.pdf(549KB)
  • 浏览 : 0
  • 下载 : 0
第 1 页
第 2 页
第 3 页
第 4 页
第 5 页
第 6 页
第 7 页
第 8 页
0 0 类别 : 教案
《你听我说——初识文本编码》教学设计 课型 新授课 学时 1 授课 年级 八年级 课程指南 智能思维 理解文本的独热编码、词袋模型和 N 元 模型的概念 智能工具选择 体会独热编码、词袋模型和 N 元模型的 区别和应用场景 智能关键技术 体验独热编码、词袋模型和 N 元模型的 编码结果 内容分析 本课时将主要介绍文本的表示、编码与特征提取的基本原理,使学生能够理解 这些在自然语言处理中的重要方法。通过本课时的学习,学生将掌握独热编码、词 袋模型、N 元模型等几种常见的文本表示方法,了解它们在不同场景下的适用性和 生成方法。该节课是整个初中人工智能课程的基础部分,旨在让学生在掌握文本表 示方法的基础上,进一步理解人工智能的核心技术和应用。 学情分析 知识基础: 学生之前已经体验过基本的情绪识别,了解情绪识别的基本方法等,形成了初步的 逻辑思维能力,能够理解和分析问题,进行推理。而且学生对计算机和互联网有较 高的熟练度,这对于学习本堂课的内容非常有帮助。 认知特点: 学生逐渐发展出更强的抽象思维能力,能够理解更复杂、抽象的概念。青春期的学 生可能经历注意力波动,对感兴趣的事物可能表现出较高的注意力,而对其他事物 可能表现出较低的兴趣。与同龄人的关系对八年级学生来说很重要,他们更愿意在 小组中学习,分享想法,与同学一起解决问题。 学习风格: 学生更喜欢通过听、看、动手等多种方式来学习。不喜欢一味地讲授式教学。 对知识的实际应用感兴趣。将知识与实际生活情境相结合并且安排相应的实践体验 活动,能够激发他们的学习兴趣。与同学合作学习的对八年级学生而言是重要的, 小组讨论和合作可以促进他们的思考和学习。 教学目标 知识与技能 1. 理解文本的独热编码、词袋模型和 N 元模型的概念。 2. 掌握三种编码计算方式 过程与方法 能够分析三种编码方式的适用场景 情感态度与价值观 引导学生对文本编码和 NLP 的基本原理 有更深入的理解,激发学生进一步学习 兴趣。 教学重难点 教学重点 • 三种编码的计算方式 • 三种编码各自的特点 教学难点 编码后向量的计算 教学方法 讲授法、演示法、讨论法和问题驱动法 学习环境与 教学资源 ·学习环境 配备先进的多媒体教学设备的机房,如投影仪、电脑、音响系统等 拥有稳定的网络连接,以便访问在线资源 ·教学资源 课件、教案、读本、AI4K12平台 教学过程 教学环节 教师活动 学生活动 设计意图 介绍具体情 景(2分 钟) 1. 引入具体情景: 王叔叔在运营短视频帐号,想请我们分析 5000万条评论 的情绪倾向,对各类视频是否喜爱 2. 引入本课例子 本节课以“我喜欢这部电影”和“我喜欢我这条视频” 为例 认真聆听 通过真实情 境任务,引导 学生进行思 考,吸引学生 的注意力 实践引入 (5分钟) 3. 设置实践任务: 打开 AI4K12平台(http://ai4k12.cn/#/word2vec)。点 击文本向量,让学生输入一句话体验编码:“我很喜欢自然 语言处理,它又叫 NLP 技术”并点击下一步,在“选择算 法”步骤选择独热编码、词袋模型或 N-Gram,查看向量结果 1.问题情境、 围绕问题开 展讨论; 2.思考并回 让学生对于 文本编码建 立初步的认 识和理解。并 引入本节课 观察:观察三种编码方式的结果有什么直观的 不同? 答问题 的教学内容 分词介绍和 复习 (5分钟) 1.为什么要分词: 词语是能够表示具体含义的基本单位,相比起整个句 子更加灵活,相比起单个字更加准确 2.讲授分词的方法: 空格分割语言:对于英语这种天然由空格分割词语 的语言,计算机可以相对简单将句子拆分成单词,这 种语言的分词往往比中文简单。 中文:中文往往使用字典分词,将常见词汇放入字 典中,将句子中的内容放入字典匹配获得分词结果。 1.认真聆听 老师的讲解, 做好课堂笔 记; 2.认真听讲, 做好课堂记 录 通过老师的 讲解和学生 的思考帮助 学生了解分 词的原因。 通过老师的 讲解,初步知 道分词的方 法 讲解独热编 码过程(4 分钟) 1.讲授独热编码的工作过程: 举例:“我喜欢这部电影”和“我喜欢我这条视频” 工作过程: 首先将文本分词,获得具体词表,再依据词表构建与 词表长度一致的全 0向量。 如图所示: 1.认真听讲, 了解独热编 码的工作流 程以及文本 向量 通过观察教 师对独热编 码的详细讲 解,掌握独热 编码的工作 的基本流程; 思考老师提 出的问题,引 入接下来要 讲解的词袋 模型 将句子中的每个词语拿出来,将单词对应的位置的数 字变成 1代表这个单词的编码 使用每个单词的向量按顺序连接起来表示句子编码 思考:这样一个句子里多余的信息太多了,有很多 无用的 0,有没有其他方式压缩一下空间呢? 2.思考老师 提出的问题 讲解词袋模 型(5分 钟) 1.介绍词袋模型概念: 词袋模型就是将句子“打碎”成单词,再将单词 一边计数,一边“放入袋子中”。由于只对单词进行 了计数,我们只知道每个单词出现了多少次(词 频),而失去了单词和单词之间的顺序信息。 2.结合例子: 在上述的例子中,完成全 0向量构建后,将单词一个 个匹配向量,每匹配一个向量,就将全 0向量中对应 位置的数量加一。 认真学习词 袋模型的编 码方式,仔细 思考词袋模 型相比独热 编码有哪些 优势和缺陷 通过教师对 词袋模型的 讲解,以及通 过案例进一 步解释和说 明自词袋模 型编码流程 掌握它的功 能 将向量取出得到本句编码结果 讲解逆文本 频率(5分 钟) 1.引入情景: 2.引入逆文本频率: “我”在三个句子里都出现过,而“一般”一词只在 文本 2里出现过,且次数最多,所以是“一般”一词 更重要。而逆文本频率就是衡量某个词语是否在其他 句子中出现的数据。 3.体验逆文本频率: 回到 AI4K12平台,编码选择词袋模型,查看每个单 词的逆文本频率。 1. 跟随老师 的思路, 认真听老 师讲解逆 文本频率 概念 2. 体验逆文 本频率数 值变化 通过教师案 例的引入提 出问题,进一 步引入逆文 本频率,并对 逆文本频率 的作用初步 介绍。 体验词袋模 型编码流程 (5分钟) 1. 体验活动 同学们两两一组,两人分别在纸上写下一两个句子, 并将纸条按词语撕碎,进行分类计数。 将分类结果和全 0向量以及词表组间交换,尝试反推 出原文本。 思考:词袋模型相比独热编码有哪些缺陷? 1. 认真参与 体验活动,与 小组成员一 起,共同观察 输出结果并 讨论思考问 题 动手实操体 会词袋模型 编码流程 N元模型(5 分钟) 1.类比词袋模型讲解 N 元模型: 词表构建:类似词袋模型,其具体方式为将 n 个临近的单词组合在一起当作一个整体进行词袋编 码。例如 2元模型就是将 2个临近的单词组合在一 起。 编码:使用上述组合词语构建词表,其他过程 与词袋模型一致。 1.认真听老 师讲解,做好 课堂记录 通过老师的 讲解和学生 的思考帮助 学生学习 N 元模型的概 念和计算方 法。 。 思考:N元模型中,较大的 n相比较小的 n会有哪些 优势和不足? 体验词嵌入 算法(3分 钟) 1. 先前算法的优势和不足: 以上三种算法编码简单快速,易于学习和实现,然 而其编码结果仅代表词语位置和数量信息,往往不 具有实际含义,而词嵌入算法的编码结果具有一定 含义信息。 2. 体验词嵌入算法: 回到体验平台,在体验平台输入一串单词,例如“小 猫小狗西瓜榴莲茄子国王女王螃蟹”并选择词嵌入 算法进行编码,观察输出结果。 1.认真听讲 并思考三种 算法的特点 和优劣 2.回到体验 平台体验词 嵌入算法 通过对于词 嵌入的体验, 保持学生高 度学习兴趣, 加深对先前 算法编码总 体流程的印 象。 课堂总结(1 分钟) 1. 师生共同总结: 文本的表示、编码、特征提取: 独热编码 词袋模型 N 元模型 跟随老师思 路共同总结 本堂课所学 知识 通过总结归 纳进一步巩 固本堂课所 学内容 板书设计 教学反思 文本的表示、编码、特征提取 一、文本➡️向量 文本➡️向量➡️计算机 独热、词袋、N元
标签: 无
更多
预览本资源的用户最终下载了
资源足迹
  • 教育技术与创新部
    周官平 2025-05-07 01:39:17 上传