第238章 浇灌 (第1/4页)

星期二的清晨,阳光透过斑驳的树叶,洒在教室的课桌上,形成一片片光影。云清、许文馨、于芳和凌静四人结伴走进教室,她们轻声交谈着,脸上带着晨起的朝气。找到座位后,四人依次坐下,云清把书包放在桌上,开始有条不紊地整理着课本和笔记。

就在这时,教室门口传来一阵轻微的脚步声,众人抬头望去,只见祁阳背着书包走进了教室。祁阳身形挺拔,穿着一件简单的白色t恤和蓝色牛仔裤,整个人显得阳光干净。他平日里总是习惯坐在教室后座,可今天却径直朝着云清的方向走来。

祁阳走到云清的课桌旁,脸上带着温和的笑意,说道:“上次我给你补课,这次你得给我补课了,下课把你笔记给我看。”他的声音不大,却清晰地传入每个人的耳中。

云清微微一怔,随即抬起头,对上祁阳那双明亮的眼睛,毫不犹豫地点点头,“可以,你坐我旁边吧。”说着,她伸手把旁边课桌上的杂物往自己这边挪了挪,给祁阳腾出位置。

许文馨坐在云清的前面,此时她好奇地转过头,眼神在祁阳和云清之间来回打量,嘴角微微上扬,露出一抹意味深长的笑容。于芳和凌静也对视了一眼。

祁阳倒是没有在意周围人的目光,他大大方方地把书包放在桌上,坐了下来。坐定后,他微微侧身,看向云清,轻声说道:“谢谢。”那笑容里,带着几分亲近,仿佛他们之间有着旁人所不知的默契。云清回以一个淡淡的微笑,没有说话,继续整理着自己的东西。

上课铃很快响起,老师走进教室,开始了今天的授课。云清全神贯注地听着课,手中的笔不时在笔记本上记录着重点。祁阳也一改往日的慵懒,坐得笔直,眼睛紧紧盯着黑板,偶尔会偏头看向云清的笔记,眼神里透着专注与认真。而坐在周围的许文馨、于芳和凌静,心思却时不时地飘到这两人身上。

“同学们,经过之前对自然语言处理基本概念和简单工具的了解,今天我们要深入探讨自然语言处理中的词向量表示,这是让计算机理解人类语言的关键一步。”

王教授拿起一支粉笔,转身在黑板上写下“词向量”三个大字。“大家想想,我们日常使用的语言,像‘苹果’‘快乐’这些词汇,对于人类来说,它们有着明确的含义,我们可以轻易理解并运用。但计算机是如何理解这些词汇的呢?这就需要将词汇转化为计算机能够处理的数字形式,也就是词向量。” 为了让同学们有更直观的感受,王教授举了一个例子:“假设我们有一个简单的句子‘我喜欢苹果’,在计算机的世界里,它无法直接理解‘喜欢’和‘苹果’的意义。但如果我们把每个词都用一组数字来表示,情况就不一样了。”

接着,王教授详细讲解了词向量的生成方式,比如基于统计的方法。“通过统计大量文本中词汇的共现关系,我们可以构建一个词向量空间。在这个空间里,语义相近的词,它们的向量在空间中的位置也会比较接近。” 她一边说,一边在黑板上画了一个简单的二维向量空间示意图,上面标注了几个常见词汇的大致位置。“比如‘香蕉’和‘苹果’,它们都属于水果类,在这个向量空间里,它们的向量就会靠得很近;而‘苹果’和‘汽车’,由于语义相差较大,它们的向量位置就会相距很远。”

随后,王教授又介绍了更为先进的神经网络模型生成词向量的方法,如word2Vec。“word2Vec模型有两种主要的训练方式,cbow(continuous bag - of - words)和Skip - Gram。cbow是通过上下文词汇来预测目标词汇,而Skip - Gram则相反,是通过目标词汇来预测上下文词汇。” 她在黑板上画出了cbow和Skip - Gram的模型结构示意图,仔细地讲解每个

本章未完,点击下一页继续阅读。