向量化与重排
基本介绍
向量化与重排是自然语言处理和信息检索领域的重要技术。它们通过将文本转 换为向量表示,帮助计算机理解和处理语言数据。这些技术在搜索引擎、推荐系统和语义分析等应用中发挥着关键作用。
福利提醒
模力方舟上已部署的向量化和重排模型 全部免费,全部免费,全部免费!!!
模型列表
以下是模力方舟上已部署的向量化和重排模型列表:
加载 Serverless API 服务列表...
向量化模型
向量化模型将文本数据转换为高维向量表示,使得相似的文本在向量空间中距离较近。这些模型通常使用深度学习技术,如 Transformer 架构,来捕捉文本的语义信息。
向量模型的最关键参数是维度,维度越高,模型的表达能力越强,但计算和存储成本也会增加,模力方舟上的向量化模型覆盖从 512 维到 4096 维,请根据实际需要选择。
示例代码:
python
from openai import OpenAI
client = OpenAI(
base_url="https://moark.com/v1",
api_key="XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX", # 替换为您的令牌
default_headers={"X-Failover-Enabled":"true"},
)
response = client.embeddings.create(
input="你好,我是模力方舟。",
model="Qwen3-Embedding-4B",
)
多模态向量化
模力方舟支持多模态向量化模型,可以处理文本、图片等多种输入类型。这些模型能够将不同模态的数据转换为统一的向量表示,便于进行跨模态检索和分析。
目前已部署的多模态向量化模型包括:
- jina-embeddings-v4 向量维度为 2048
- jina-clip-v1 向量维度为 768
- jina-clip-v2 向量维度为 1024
示例代码:
python
from openai import OpenAI
client = OpenAI(
base_url="https://moark.com/v1",
api_key="XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX", # 替换为您的令牌
)
response = client.embeddings.create(
input=[
{ "text": "a blue cat" },
{ "text": "a dog" },
{ "image": "https://example.com/image.jpg"}
],
model="jina-embeddings-v4",
)
重排模型
重排模型通过对搜索结果进行再排序,提高信息检索的准确性和相关性。这些模型通常基于用户的历史行为和偏好,结合向量化技术,来优化搜索结果的展示顺序。
示例代码:
python
import requests
API_URL = "https://moark.com/v1/rerank"
API_TOKEN = "XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX" # 替换为您的令牌
headers = {
"X-Failover-Enabled": "true",
"Authorization": f"Bearer {API_TOKEN}"
}
def query(payload):
response = requests.post(API_URL, headers=headers, json=payload)
return response.json()
output = query({
"query": "How to read a CSV file in Python?",
"documents": [
"Use pandas: `import pandas as pd; df = pd.read_csv('data.csv')`",
"You can read CSV files with numpy.loadtxt()",
"To write JSON files, use json.dump() in Python",
"CSV means Comma Separated Values. Python files can be opened using read() method."
],
"model": "Qwen3-Reranker-4B"
})
print(output)
应用场景
- 信息检索:通过向量化技术提高搜索引擎的检索效率和准确性。
- 推荐系统:利用向量化和重排技术为用户提供个性化的内容推荐。
- 语义分析:通过向量化文本数据,帮助理解文本的语义关系和上下文信息。
- 自然语言处理:在机器翻译、情感分析等任务中,向量化技术用于表示和处理语言数据。