耐心是关键-优快云博客

原创 huggingface transformers，避免生成重复内容

【代码】huggingface transformers，避免生成重复内容。

2025-06-18 15:34:24 4

原创 llama-factory报错 No package metadata was found for deepspeed

【代码】llama-factory报错 No package metadata was found for deepspeed。

2025-06-16 11:08:17 64

原创通用embedding模型和通用reranker模型，观测调研

Embedding模型，query-question的匹配分数普遍高于 query-answer的匹配分数。比如对于10个query，检索结果里，9个排第一的结果是question。Reranker模型，query-answer的匹配分数普遍高于 query-question的匹配分数。比如对于10个query，检索结果里，9个排第一的结果是answer。现在有一个的问答库，包括150个QA-pair，用10个query去同时检索问答库的300个query+answer。

2025-06-15 15:46:50 28

原创多张GPU加载大模型推理

【代码】多张GPU加载大模型推理。

2025-06-13 16:18:44 82

原创【python】regex/正则，保留英文/空格/中文/数字

【代码】【python】regex/正则，保留英文/空格/中文/数字。

2025-06-10 16:07:42 86

原创 torch 生成式模型推理加速之torch_dtype=torch.float16,

【代码】torch 生成式模型推理加速之torch_dtype=torch.float16,

2025-06-09 09:42:17 31

原创调用qwen-vl-ocr模型

【代码】调用qwen-vl-ocr模型。

2025-06-08 10:42:36 101

原创 python调用Qwen3，输出＜think＞＜/think＞

【代码】python调用Qwen3，输出＜think＞

2025-06-04 14:52:17 72

原创 BERT推理加速

ALBERT推理速度是BERT的3倍左右，

2025-06-02 22:44:48 34

原创 torch 生成式模型推理加速之early_stopping=True

就是比如生成128长度，发现生成到40，后面就都是。了，就不继续decode了。

2025-05-28 09:45:11 34

原创 torch 生成式模型推理加速之padding=True

【代码】torch 生成式模型推理加速之padding=True。

2025-05-27 16:57:29 38

原创 huggingface padding=True 训练阶段报错：expected sequence of length 24 at dim 1 (got 20)

是seq2seq任务报错的,的tokenize还是。

2025-05-27 16:38:28 46

原创 pip安装指定python目录

【代码】pip安装，指定python目录。

2025-05-26 09:30:22 131

原创 T5 预训练模型

如果只有30-40w数据，训练出来有很多语句不通的case，从零训练一个T5-Base需要200-300W+数据，可以用预训练模型解决语句不通的问题。

2025-05-22 15:03:26 53

原创 huggingface transformers 加载预训练好的模型时，只加载部分层数

【代码】huggingface transformers 加载预训练好的模型时，只加载部分层数。

2025-05-22 11:59:22 36

原创 python OpenAI调用deepseek代码

【代码】python OpenAI调用deepseek代码。

2025-05-22 09:24:38 105

原创 Multi Query Attention 代码

【代码】Multi Query Attention 代码。

2025-05-19 14:31:27 36

原创 cudnn cuda nvidia驱动匹配关系

【代码】cudnn cuda nvidia驱动匹配关系。

2025-05-15 15:19:48 95

原创 python报错，A module that was compiled using NumPy 1.x cannot be run in NumPy 2.x as it may crash

解决方法，安装1.x版本的numpy。

2025-05-11 14:23:21 368

原创 python报错，ValueError: numpy.dtype size changed, may indicate binary incompatibility.

【代码】python报错，ValueError: numpy.dtype size changed, may indicate binary incompatibility.

2025-05-11 12:15:01 259

原创 python 正则，提取括号中的内容

'（测试内容）'

2025-05-09 15:14:18 120

原创 windows远程桌面作为客户端登录另一台windows

Step-3，在界面输入IP地址，用户名，密码。Step-1，快捷键。

2025-05-08 10:36:29 112

原创 python AzureOpenAI 代码实例

【代码】AzureOpenAI 代码实例。

2025-04-30 11:40:49 122

转载 RoPE源码实现

【代码】RoPE源码实现。

2025-04-24 14:28:21 41

原创 deepspeed的PPO算法实现和代码阅读

actor_loss计算代码，可见是新logits和旧的logits的距离计算之后，乘以advantage得到最终的loss。reward计算代码，可见通过计算ref-model的输出和actor-model的输出的距离得到reward。advantage计算代码，可见advantage是next-value减去value得到的。critic_loss计算代码，可见critic的逻辑是判断新value和旧value的距离。

2025-04-23 16:00:04 248