写在前面的话
我们会不会分开。这两天,蓟州之行,其中在旅店一天晚上的夜里,两个孩子都睡了。媳妇无来由的问我,我们俩将来会不会分开。我说:可能会吧,但不是我想要的结果。我们结婚九年,度过了七年之痒,其实所谓的七年八年之痒,只存在于高富帅的剧情里,真实的普通老百姓,整天在土里刨食,一结婚就是一辈子,简单快乐,我觉得挺好,也是我希望达到的效果。但现在随着生活水平的提高,女的有了更多的想法,我跟着你,不但要吃饱,而且要比别人好,这肯定会出问题。就拿媳妇来说,她有个同学,嫁的是开飞机的,一年上百万的净收入,买房子像买卫生纸一样简单,出去吃一餐好几千。但也有同学嫁的男的,负债百万,日子只能用熬来形容。我说,媳妇,咱们不和别人比,努力的过好自己的生活,咱们两个都努力拼搏不躺平,永不分开。我等媳妇回应,发现她早睡着了。
[239+100]-------底部有张生活照片(
头条号运营:大家想全托管上号的联系我哦,每天让你得个早餐钱,wx: qhz198607
)
【关键词】python、ragflow、本地模型、知识库搜索
一、本地模型替换测试(三级)
描述:现在本地模型替换掉了意图识别和分科,接下来进行测试,看看效果。
开工:
第一步:跑测试用例(四级)
20250328周五时间段:20:22-21:00
效果如下:
图3a-1
注:还可以。
第二步:代码上线(四级)
20250328周五时间段:20:28-21:00
上线看看效果,还可以。
二、知识库测试问题(三级)
描述:现在知识库测试时,有个接口调不通,需要处理一下。
开工:
第一步:问题复现(四级)
20250329周六时间段:00:31-01:00
错误截图如下:
图3a-2
注:olloma报错,导致超时,需要处理一下。ollama报错如下:
图3a-3
注:明天处理一下吧。
第二步:打断点处理问题(四级)
20250329周六时间段:10:31-11:00
测试数据:
http://localhost:9222/v1/chunk/retrieval_test
{
"similarity_threshold": 0.2,
"vector_similarity_weight": 0.30000000000000004,
"rerank_id": "BAAI/bge-reranker-v2-m3@BAAI",
"use_kg": true,
"question": "拉肚子",
"top_k": 1024,
"doc_ids": [],
"kb_id": "bf5b0a6eff1211ef94e1acde48001122",
"page": 1,
"size": 10
}
注:测试界面如下:
图3a-4
注:测试出的问题截图如下:
2025-03-29 10:46:26,511 | ERROR | llm_service.py:similarity:257 - LLMBundle.similarity can't update token usage for 7d19a176807611efb0f80242ac120006/RERANK used_tokens: 9407
注:看下相关代码,看下能不能把这个问题处理一下。相关程序如下:
def similarity(self, query: str, texts: list):
sim, used_tokens = self.mdl.similarity(query, texts)
if not TenantLLMService.increase_usage(
self.tenant_id, self.llm_type, used_tokens):
logging.error(
"LLMBundle.similarity can't update token usage for {}/RERANK used_tokens: {}".format(self.tenant_id, used_tokens))
return sim, used_tokens
注:这个主要是函数increase_usage报错出来的错,increase_usage函数如下:
@classmethod
@DB.connection_context()
def increase_usage(cls, tenant_id, llm_type, used_tokens, llm_name=None):
e, tenant = TenantService.get_by_id(tenant_id)
if not e:
raise LookupError("Tenant not found")
if llm_type == LLMType.EMBEDDING.value:
mdlnm = tenant.embd_id
elif llm_type == LLMType.SPEECH2TEXT.value:
mdlnm = tenant.asr_id
elif llm_type == LLMType.IMAGE2TEXT.value:
mdlnm = tenant.img2txt_id
elif llm_type == LLMType.CHAT.value:
mdlnm = tenant.llm_id if not llm_name else llm_name
elif llm_type == LLMType.RERANK:
mdlnm = tenant.rerank_id if not llm_name else llm_name
elif llm_type == LLMType.TTS:
mdlnm = tenant.tts_id if not llm_name else llm_name
else:
assert False, "LLM type error"
llm_name, llm_factory = TenantLLMService.split_model_name_and_factory(mdlnm)
num = 0
try:
if llm_factory:
tenant_llms = cls.query(tenant_id=tenant_id, llm_name=llm_name, llm_factory=llm_factory)
else:
tenant_llms = cls.query(tenant_id=tenant_id, llm_name=llm_name)
if not tenant_llms:
return num
else:
tenant_llm = tenant_llms[0]
num = cls.model.update(used_tokens=tenant_llm.used_tokens + used_tokens) \
.where(cls.model.tenant_id == tenant_id, cls.model.llm_factory == tenant_llm.llm_factory, cls.model.llm_name == llm_name) \
.execute()
except Exception:
logging.exception("TenantLLMService.increase_usage got exception")
return num
注:这个num返回0了,看下啥原因。
第三步:num=0(四级)
20250329周六时间段:11:42-12:00
20250329周六时间段:14:09-15:00
打断点看下,用本地的试试,本地的连下线上的es,可能会好一点。更改host文件如下:
图3a-5
注:再次运行,跑一下,看看es是不是变快了。
测试效果如下:
图3a-6
注:接下来,测下知识库。
第四步:测知识库(四级)
20250329周六时间段:14:20-15:00
现在除es01外,其它的都是测试服的,现在es运行很快,处理下知识库的问题,测试结果如下:
图3a-7
注:用同样的环境,在zero3上测测试试。排除下是不是环境原因导致的问题。
第五步:同样环境(四级)
20250329周六时间段:16:40-17:00
修改下zero3上的es配置文件,如下:
图3a-8
注:接下来,在zero3上测一下,看会不会报同样的错误,测试结果如下:
图3a-9
注:搜不出东西来,但不报错了,接下来看下为啥搜不出来东西。
三、知识库搜索(三级)
描述:现在知识库搜索不出东西,es慢的问题因为换了es也得到了解决,看下搜索不出东西的原因是什么,打断点看一下。
开工:
第一步:打断点(四级)
20250329周六时间段:17:06-18:00
先对图3a-9中标红的区域打断点,看下数据,暂时没找到原因,先暂停,有更重要的事做。
第二步:测试(四级)
测试还可以。
四、图片上传(三级)
描述:现在web端图片上传,后台能进行多模态解析,已实现基础效果,接下来,研究下里面的原理,封装个接口,小程序也实现相关功能。
开工:
第一步:研究过程(四级)
20250330周日时间段:00:22-01:00
web端上传的图片存哪里了?查了一下没找到,这个先不管,以后再说。
链接是这样的:
http://localhost:9222/v1/document/image/bf5b0a6eff1211ef94e1acde48001122-thumbnail_0acaa6c80cbc11f0b54600e003c42347.png
分析结果:
这个好弄,一个是图片上传接口,上传完生成一个doc_ids,一个是原有接口,多传一个doc_ids,这样传一下就可以了。
传的值如下:
图3a-10
注:明天写一下就可以。接下来,看下图片上传接口。
第二步:图片上传(四级)
20250330周日时间段:10:25-11:00
研究下图片上传,用postman实现一把,接口链接如下:
http://localhost:9222/v1/document/upload_and_parse
参数如下:
conversation_id: 3fb6856806db11f09ce300d861b4a833
file: (binary)
注:这个两个参数,一个是conversation_id,一个文件。由于测试用例没法搞文件,用postman试试。
这个上传成功,返回什么,如下:
图3a-11
注:用postman测试一把,效果如下:
图3a-12
注:测了一下还可以,主要有个用户id验证需要修改一下。
五、头条号战果汇报
昨日总播放:514.8万,总收入:233.91,累计收入:4084.76块,可提现:2040.57,软件截图如下:
图3e-1
注:想要全脱管运营头条号的联系我,你出账号,我来运营,收益四六分成(你六我四),你当甩手掌柜,每天都能得几块零花钱,财富wx: 17701328814
六、生活照片
拍摄于2025年10月3日,16:54:15,带大宝去盘锦玩,当时大宝七岁十个月。其实,两个人过生活,要相互包容与理解,只要两个人都走正道,积极努力的去拼搏奋斗,生活总会过的下去。但每个人的运气是不一样的,举个极端的例子:在一个村子里,天上掉下一块金砖,正好被张三抢到,自此他家的生活比别家高出一大截,那其她不是张三媳妇的女的,心里不平衡的,眼红的,都和丈夫离婚吗,难道是她们的丈夫不努力吗。所以,心态放平和,努力过生活就得了,其它的不要多想。
图3f-1
《本文完》