基于词林扩展版的词语相似度算法
- 最初采用了【词林相似度计算:实现了3种算法】 中的2016版代码(文献1),比另2种算法效果更好。
- 后来发现作者团队发表了更新、更优的算法——文献2。于是实现了其中算法,经验证论文结果属实。
- 再后来发现又有了新的算法——文献3。然后按论文思想,原封不动实现效果略逊色于论文数据。但经过调整策略,最终效果优于论文本身。
参考文献
- 同义词词林(第二版)
- 《基于知网与词林的词语语义相似度计算》朱新华,马润聪,孙柳,陈宏朝,2016年7月《中文信息学报》
- 《基于路径与深度的同义词词林词语相似度计算》陈宏朝, 李飞, 朱新华,马润聪. 2016年9月《中文信息学报》
- 《基于信息内容的词林词语相似度计算》彭琦, 朱新华, 陈意山,等.2018年2月《计算机应用研究》
算法对比
版本|MC30|RG35|RG65
-|-|-|-
V1|0.816|-|-
V2|0.856|-|-
V3|0.917|0.865|0.887