OpenAI
让我们加载 OpenAI Embedding 类。
设置
首先我们安装 langchain-openai 并设置所需的环境变量
python
%pip install -qU langchain-openaipython
import getpass
import os
os.environ["OPENAI_API_KEY"] = getpass.getpass()python
from langchain_openai import OpenAIEmbeddingspython
embeddings = OpenAIEmbeddings(model="text-embedding-3-large")python
text = "This is a test document."用法
嵌入查询
python
query_result = embeddings.embed_query(text)text
警告:未找到模型。使用 cl100k_base 编码。python
query_result[:5]text
[-0.014380056377383358,
-0.027191711627651764,
-0.020042716111860304,
0.057301379620345545,
-0.022267658631828974]嵌入文档
python
doc_result = embeddings.embed_documents([text])text
警告:未找到模型。使用 cl100k_base 编码。python
doc_result[0][:5]text
[-0.014380056377383358,
-0.027191711627651764,
-0.020042716111860304,
0.057301379620345545,
-0.022267658631828974]指定维度
使用 text-embedding-3 类模型,您可以指定要返回的嵌入的大小。例如,默认情况下 text-embedding-3-large 返回维度为 3072 的嵌入:
python
len(doc_result[0])text
3072但是通过传入 dimensions=1024,我们可以将嵌入的大小减小到 1024:
python
embeddings_1024 = OpenAIEmbeddings(model="text-embedding-3-large", dimensions=1024)python
len(embeddings_1024.embed_documents([text])[0])text
警告:未找到模型。使用 cl100k_base 编码。text
1024