Skip to content

如何使用示例选择器

如果你有大量的示例,可能需要选择要包含在提示中的示例。示例选择器是负责执行此操作的类。 基本接口定义如下:

python
class BaseExampleSelector(ABC):
    """选择要包含在提示中的示例的接口。"""
    @abstractmethod
    def select_examples(self, input_variables: Dict[str, str]) -> List[dict]:
        """根据输入选择要使用的示例。"""
    @abstractmethod
    def add_example(self, example: Dict[str, str]) -> Any:
        """将新示例添加到存储中。"""

它需要定义的唯一方法是select_examples方法。该方法接收输入变量,然后返回一个示例列表。每个具体实现如何选择这些示例取决于具体实现。 LangChain有几种不同类型的示例选择器。有关所有这些类型的概述,请参见下表。 在本指南中,我们将介绍如何创建自定义示例选择器。

示例

为了使用示例选择器,我们需要创建一个示例列表。这些通常应该是示例输入和输出。为了演示目的,让我们想象我们正在选择如何将英语翻译成意大利语的示例。

python
examples = [
    {"input": "hi", "output": "ciao"},
    {"input": "bye", "output": "arrivaderci"},
    {"input": "soccer", "output": "calcio"},
]

自定义示例选择器

让我们编写一个示例选择器,根据单词长度选择要选择的示例。

python
from langchain_core.example_selectors.base import BaseExampleSelector
class CustomExampleSelector(BaseExampleSelector):
    def __init__(self, examples):
        self.examples = examples
    def add_example(self, example):
        self.examples.append(example)
    def select_examples(self, input_variables):
        # 这假设部分输入将是一个 'text' 键
        new_word = input_variables["input"]
        new_word_length = len(new_word)
        # 初始化变量以存储最佳匹配及其长度差异
        best_match = None
        smallest_diff = float("inf")
        # 遍历每个示例
        for example in self.examples:
            # 计算与示例的第一个单词的长度差异
            current_diff = abs(len(example["input"]) - new_word_length)
            # 如果当前示例在长度上更接近,则更新最佳匹配
            if current_diff < smallest_diff:
                smallest_diff = current_diff
                best_match = example
        return [best_match]
python
example_selector = CustomExampleSelector(examples)
python
example_selector.select_examples({"input": "okay"})
text
[{'input': 'bye', 'output': 'arrivaderci'}]
python
example_selector.add_example({"input": "hand", "output": "mano"})
python
example_selector.select_examples({"input": "okay"})
text
[{'input': 'hand', 'output': 'mano'}]

在提示中使用

现在我们可以在提示中使用这个示例选择器

python
from langchain_core.prompts.few_shot import FewShotPromptTemplate
from langchain_core.prompts.prompt import PromptTemplate
example_prompt = PromptTemplate.from_template("输入: {input} -> 输出: {output}")
python
prompt = FewShotPromptTemplate(
    example_selector=example_selector,
    example_prompt=example_prompt,
    suffix="输入: {input} -> 输出:",
    prefix="将以下单词从英语翻译成意大利语:",
    input_variables=["input"],
)
print(prompt.format(input="word"))
text
将以下单词从英语翻译成意大利语:
输入: hand -> 输出: mano
输入: word -> 输出:

示例选择器类型

名称描述
相似度使用输入和示例之间的语义相似性来决定选择哪些示例。
MMR使用输入和示例之间的最大边际相关性来决定选择哪些示例。
长度根据可以适应特定长度的示例数量来选择示例。
Ngram使用输入和示例之间的ngram重叠来决定选择哪些示例。

基于 MIT 许可发布 共建 共享 共管