conda create -n tutorial5 python=3.9
conda activate tutorial5
conda install pytorch torchvision torchaudio pytorch-cuda=12.1 -c pytorch -c nvidia
pip install notebook jupyterlab peft numpy==1.26.4 matplotlib==3.8.4 transformers==4.42.4

# 如果以下目录存在， 可以直接复制:
cp -r /lustre/public/tutorial/models/models--BAAI--bge-reranker-v2-m3/ ./

# 否则请自行下载：
export HF_ENDPOINT=https://hf-mirror.com
huggingface-cli download --resume-download BAAI/bge-reranker-v2-m3 --local-dir models--BAAI--bge-reranker-v2-m3

pip install -U FlagEmbedding

from FlagEmbedding import FlagReranker

# 填写模型路径
# VAR_PLACEHOLDER
reranker = FlagReranker('models--BAAI--bge-reranker-v2-m3', use_fp16=True) 

# 计算相似度
score = reranker.compute_score(['query', 'passage'], normalize=True)
print(score) # 0.003497010252573502

scores = reranker.compute_score(
    [['what is panda?', 'hi'],
     ['what is panda?',
      'The giant panda (Ailuropoda melanoleuca), sometimes called a panda'
       ' bear or simply panda, is a bear species endemic to China.']],
       normalize=True)
print(scores) # [0.00027803096387751553, 0.9948403768236574]

import torch
from transformers import AutoModelForSequenceClassification, AutoTokenizer

# 填写模型路径
# VAR_PLACEHOLDER
modle_path = 'models--BAAI--bge-reranker-v2-m3'

# 加载模型和分词器
tokenizer = AutoTokenizer.from_pretrained(modle_path)
model = AutoModelForSequenceClassification.from_pretrained(modle_path)
model.eval()

# 把模型移动到显卡
print(torch.cuda.is_available())
device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')
model.to(device)


# 计算相似度
pairs = [
    ['what is panda?', 'hi'],
    ['what is panda?',
     'The giant panda (Ailuropoda melanoleuca), sometimes called a panda'
      ' bear or simply panda, is a bear species endemic to China.']]
with torch.no_grad():
    inputs = tokenizer(
        pairs, padding=True, truncation=True,
        return_tensors='pt', max_length=512)
    
    # 将输入数据移动到GPU
    inputs = {key: value.to(device) for key, value in inputs.items()}
    
    scores = model(**inputs, return_dict=True).logits.view(-1, ).float()
    print(scores)

Tutorial5: bge-reranker-v2-m3¶

1. 环境安装与应用创建¶

2. 下载模型¶

3. 模型使用¶

3.1 通过 FlagEmbedding 运行¶

3.2 通过 Huggingface Transformer 运行¶