Created
Aug 9, 2024 10:25 PM
Favorite
Favorite
Priority
备注
推荐
类型
模型测试
- 代理
- 回调
- 聊天引擎
- 食谱
- 定制
- 数据连接器
- 发现LlamaIndex
- 文档存储
- 嵌入
- 评估
- Tonic 验证评估器
- 嵌入相似度评估器
- BatchEvalRunner - 运行多个评估
- 在MT-Bench人工判断的LabelledPairwiseEvaluatorDataset上对LLM评估器进行基准测试
- 在Mini MT-Bench上对LLM评估器进行基准测试(单个评分)LabelledEvaluatorDataset
- 答案相关性和上下文相关性评估
- 使用 Prometheus 模型进行评估
- 诚实度评估器
- HotpotQADistractor演示
- 自我纠正的查询引擎 - 评估与重试
- 正确性评估器
- 如何使用UpTrain与LlamaIndex
- 问题生成
- 检索评估
- 评估多模态RAG
- BEIR领域外基准测试
- 相关性评估器
- 🚀 RAG/LLM 评估器 - DeepEval
- 指南评估器
- 一对一评估器
- 微调
- 摄取
- Llama数据集
- Llama集线器
- LLMs
- 低级
- 托管索引
- 元数据提取器
- 多模态
- 多租户
- 节点解析器与文本分割器
- 节点后处理器
- 对象存储
- 输出解析器
- 参数优化器
- 查询管道
- 提示
- 查询引擎
- 查询转换
- 响应合成器
- 检索器
- 工具
- 变换
- 用例
- 向量存储
Table of contents
这个笔记本展示了
SemanticSimilarityEvaluator
,它通过语义相似性评估问答系统的质量。具体来说,它计算生成的答案和参考答案的嵌入之间的相似性分数。
如果您在colab上打开这个笔记本,您可能需要安装LlamaIndex 🦙。
自定义
这个notebook提供了一些关于如何自定义你的Jupyter笔记本的提示和技巧。
我们在这里指出,高分并不意味着答案总是正确的。
嵌入相似性主要捕捉了“相关性”的概念。由于回答和参考文本都讨论了“天空”和颜色,它们在语义上是相似的。