MJJ论坛

 找回密码
 注册

QQ登录

只需一步,快速开始

12
返回列表 发新帖
楼主: qihu

[Windows VPS] 大佬们请教一个py脚本

[复制链接]
发表于 2020-8-10 18:33:40 | 显示全部楼层
本帖最后由 夕日 于 2020-8-10 18:38 编辑

这个实现起来很简单的

先用 jieba 分词,然后将每个句子转成词向量,最后计算余弦距离dist:
  1. sim = np.dot(emb, new_emb.T) / (np.linalg.norm(emb) * np.linalg.norm(new_emb))
  2. dist = 1 - sim
复制代码
您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|小黑屋|MJJ论坛

Copyright MJJ论坛 © 2022 All Rights Reserved.

快速回复 返回顶部 返回列表