开发语言:golang,php
适用语言:中文
golang三方库:sego中文分词(原始分词词库)
目的:新建专题需要推荐相关内容与推荐相关专题需求计算
API接口:http://www.zongk.com/myextend/mycos.php
请求方式:GET
请求参数:
worda:关键词1(字符串)
wordb:关键词2(字符串)
返回值:相似值(最大1,最小0)
余弦计算相似度:
余弦相似度算法是什么意思?以及他的教程,就不长篇累述了, 可以自己百度一下具体原理计算公式(我是看不懂,只能皮毛),这里推荐两篇文章:
2、还有一个自己百度的觉得不错,主要是实际计算公式那块《自己实现文本相似度算法(余弦定理)》
计算思想简述:
章节1中出现的字为:Z1c1,Z1c2,Z1c3,Z1c4……Z1cn;它们在章节中的个数为:Z1n1,Z1n2,Z1n3……Z1nm;
章节2中出现的字为:Z2c1,Z2c2,Z2c3,Z2c4……Z2cn;它们在章节中的个数为:Z2n1,Z2n2,Z2n3……Z2nm;
其中,Z1c1和Z2c1表示两个文本中同一个字,Z1n1和Z2n1是它们分别对应的个数,
计算公式:
TAGS:golang , 相似度 , 余弦