Schema
TestsetSample
基类: BaseSample
表示测试集中的一个样本。
属性
名称 | 类型 | 描述 |
---|---|---|
eval_sample |
Union[SingleTurnSample, MultiTurnSample]
|
评估样本,可以是单轮或多轮样本。 |
synthesizer_name |
str
|
用于生成此样本的合成器名称。 |
TestsetPacket
基类: BaseModel
要上传到服务器的一批测试集样本。
Testset 数据类
Testset(samples: List[TestsetSample], run_id: str = lambda: str(uuid4())(), cost_cb: Optional[CostCallbackHandler] = None)
基类: RagasDataset[TestsetSample]
表示包含多个测试样本的测试集。
属性
名称 | 类型 | 描述 |
---|---|---|
样本 |
List[TestsetSample]
|
表示测试集中样本的TestsetSample对象列表。 |
to_evaluation_dataset
to_evaluation_dataset() -> EvaluationDataset
to_list
将Testset转换为字典列表。
源代码位于 src/ragas/testset/synthesizers/testset_schema.py
from_list 类方法
from_list(data: List[Dict]) -> Testset
将字典列表转换为Testset。
源代码位于 src/ragas/testset/synthesizers/testset_schema.py
total_tokens
计算评估中使用的总token数。
源代码位于 src/ragas/testset/synthesizers/testset_schema.py
total_cost
total_cost(cost_per_input_token: Optional[float] = None, cost_per_output_token: Optional[float] = None) -> float
计算评估的总成本。
源代码位于 src/ragas/testset/synthesizers/testset_schema.py
from_annotated 类方法
from_annotated(path: str) -> Testset
从 app.ragas.io 的标注JSON文件加载测试集。
源代码位于 src/ragas/testset/synthesizers/testset_schema.py
QueryLength
基类: str
, Enum
查询长度枚举。可用选项为: LONG, MEDIUM, SHORT
QueryStyle
基类: str
, Enum
查询风格枚举。可用选项为: MISSPELLED, PERFECT_GRAMMAR, POOR_GRAMMAR, WEB_SEARCH_LIKE
BaseScenario
基类: BaseModel
表示用于生成测试样本场景的基类。
属性
名称 | 类型 | 描述 |
---|---|---|
节点 |
List[Node]
|
场景中涉及的节点列表。 |
风格 |
QueryStyle
|
查询的风格。 |
长度 |
QueryLength
|
查询的长度。 |
角色 |
角色
|
与场景相关的角色。 |
SingleHopSpecificQuerySynthesizer 数据类
SingleHopSpecificQuerySynthesizer(name: str = 'single_hop_specifc_query_synthesizer', llm: BaseRagasLLM = llm_factory(), generate_query_reference_prompt: PydanticPrompt = QueryAnswerGenerationPrompt(), theme_persona_matching_prompt: PydanticPrompt = ThemesPersonasMatchingPrompt(), property_name: str = 'entities')
基类: SingleHopQuerySynthesizer
MultiHopSpecificQuerySynthesizer 数据类
MultiHopSpecificQuerySynthesizer(name: str = 'multi_hop_specific_query_synthesizer', llm: BaseRagasLLM = llm_factory(), generate_query_reference_prompt: PydanticPrompt = QueryAnswerGenerationPrompt(), relation_type: str = 'entities_overlap', property_name: str = 'entities', theme_persona_matching_prompt: PydanticPrompt = ThemesPersonasMatchingPrompt())
基类: MultiHopQuerySynthesizer
通过选择特定块并从中生成关键词,然后基于此生成查询,从而合成基于重叠的查询。
属性
名称 | 类型 | 描述 |
---|---|---|
generate_query_prompt |
PydanticPrompt
|
用于生成查询的提示词。 |