接触TransE算法也有半年多了,从一开始的一脸懵逼到现在满脸懵逼,也算是有点收获。。。
于是,,,献丑了~
关于算法的具体实现,网上有很多,也不过多赘述,推荐几篇比较好的(不保证是原创,因为同款文章太多了。。。抄袭严重,如有知道原创的盆友,烦请告知~)
TransE算法(Translating Embedding) 这篇文章以不同的作者名出现在众多平台,,,足以见其影响力~
下面以我的思路,说一下我对TransE的简单认识
此处只要知道,知识表示学习中,有能将语义信息表示为低维稠密的实体向量的思想(不知道表述的够不够准确T^T(踏踏太菜了))
当我们将人能看懂的“文字”信息转成机器能读懂的“向量”信息,就可以对文本进行进一步处理了(比如计算相似度,聚类等)
关于算法,上文提到了一篇文章,可以学习。
此处附上算法图,并对小白提一个比较友好的建议:知道单词啥意思~ 对算法有个简单了解,然后看代码具体如何实现,配套原论文一同食用,效果更佳~ 当然,简单方法就是看别人的博客分享~正如您现在~
得到向量,就可以对文本进行进一步分析啦,比如聚类分析啦(k-means算法,K-MEDOIDS算法,Clara算法等),计算相似度啦(欧氏距离,余弦距离,曼哈顿距离等),高维向量降到二维或者三维还可以进行可视化
①TransE论文:http://papers.nips.cc/paper/5071-translating-embeddings-for-modeling-multi-relational-data.pdf
②代码实现 a:https://github.com/Anery/transE
b:上述分享文章的作者对代码进行注释 https://github.com/wuxiyu/transE
貌似这两个transE算法的准确率都不高???!!!
③推荐博客:transE(Translating Embedding)详解+简单python实现
https://zhuanlan.zhihu.com/p/152257102
知识图谱怎样入门?
踏踏太菜了,就说这些吧。。。踏踏也还是只萌新~