文本相似度计算复盘 参考文献 数据集及其评价指标介绍:https://blog.csdn.net/xixiaoyaoww/article/details/105460175
模型评价指标:https://blog.csdn.net/u010420283/article/details/104994800
ROC曲线和AUC面积理解:https://blog.csdn.net/program_developer/article/details/79946787
语义相似度计算的各种指标:https://www.cnblogs.com/shona/p/11971310.html
BERT做相似度计算:https://www.cnblogs.com/shona/p/12021304.html
苏神:https://spaces.ac.cn/archives/8321 https://spaces.ac.cn/archives/8348
流程:
- 文本语义相似度怎样计算:一般对计算语义向量(embedding)进行操作
- 同一文本在不同预训练模型(BERT、Roberta、RoFormer)下的embedding不同,那么有哪些模型
- 这些模型的embedding都有相同问题:各向异性
- 各项异性介绍:bert-flow
- 各向异性改进bert-whiting、SimBERT、SimCSE
- 相似性度量有哪些指标?模型评价标准?
- 有哪些公开的相似性任务(比如STS),不同方法在其上最终表现如何?
- 用余弦计算相似度需要满足哪些性质?
任务定义(监督可以用分类做,那么无监督
|