写在前面的话
守住底线。年后,通过和同事交流,寻思着做一些互联网方面的探索,看看机会。但发现花钱的地方不少,搞个小龙虾,整个coze工作流,都需要向大模型厂商付费调api接口,这时,我有个主意,要不要用抖哥的tokens,跟着抖哥干活,他几乎有每家厂商的tokens。但下一秒就打消了这个念头,自己探索互联网,收益的是自己,用人家花钱买的tokens太不道德了,尽管抖哥可能不知道,但自己做的不对,不能吃人家饭,砸人家碗,太不地道了。所以,还是决定先做免费的探索,如果找到机会,论证可行,就自己买tokens来用,这样,最起码能心安,再者来说,纸里包不住火,最终被人发现,不就尴尬了吗,即使不被人发现,良心也会痛的。诚实守信也是立世的一个利器,或者说是底线,靠耍小聪明,是走不远的,切记,切记。
[308]-------底部有张生活照片
【关键词】python、ragflow、es、测速度
一、chat_sev相关
1.运行ragflow报错
描述:运行ragflow报错,截图如下:
图5a-1
开工:
第一步:处理报错(三级)
20250107周二时间段:12:00-12:2020250107周二时间段:12:59-13:0020250107周二时间段:13:00-13:2020250107周二时间段:14:53-15:00
运行报错,说是messages不存在,应该是需要一个默认值。修改程序如下:
图5a-2
注:把验证去掉,试试。这个debug发现,是由于messages的组装顺序反了,最后一条必须是用户输入的,所以,修改代码如下:
图5a-3
注:发现用debug可以不用打日志了,因为打个断点,就能知道输出的什么数据。接下来,测速度。
第二步:本地测试(三级)
测试还可以
2.本地测全局(二级)
描述:接下来,本地测一下全局速度,看下还有哪里速度慢,优化一下。
开工:
第一步:本地聊天测试(三级)
20250107周二时间段:14:59-15:0020250107周二时间段:15:00-15:20
测试如下:
图5a-4
注:第二个completion2,以及completion慢。奇怪了,新建个会话试试。
新建会话如下:
tests\test_appapi.py json:{'code': 0, 'data': {'id': 'eab0232fccc611ef9b09f020ff63f4c4', 'dialog_id': '34bb8d02b30911ef9c3b0242ac120006', 'open_id': 'qhz1234567890', 'token': '', 'is_intent': None, 'intention': None, 'dispatch': None, 'name': '测试速度', 'message': [{'content': '你好! 我是专业宠物医生,有什么可以帮到你的吗?', 'role': 'assistant'}], 'reference': [], 'create_time': 1736234062221, 'create_date': '2025-01-07T15:14:22', 'update_time': 1736234062221, 'update_date': '2025-01-07T15:14:22'}, 'msg': 'success'}现在不本地不稳定,去线上试试。
第二步:线上全流程测试(三级)
20250107周二时间段:15:29-15:4020250107周二时间段:16:16-16:20
现在服务器有问题,可以先在本地测下,哪里还有优化的空间。可以先切下docker es试试。本地安装有docker es。
改了hosts中es的配置,如下:
图5a-5
注:测下试试,有没有问题。
第三步:测试本地es
20250107周二时间段:16:20-16:40
跑起来,测试结果如下:
{ "conversation_id": "6c0ca0f6c3f611ef94e1f020ff63f4c4", "question": "eab0232fccc611ef9b09f020ff63f4c4"}git拉代码报错,如下:
hint: You have divergent branches and need to specify how to reconcile them.hint: You can do so by running one of the following commands sometime beforehint: your next pull:hint: hint: git config pull.rebase false # mergehint: git config pull.rebase true # rebasehint: git config pull.ff only # fast-forward onlyhint: hint: You can replace "git config" with "git config --global" to set a defaulthint: preference for all repositories. You can also pass --rebase, --no-rebase,hint: or --ff-only on the command line to override the configured default perhint: invocation.fatal: Need to specify how to reconcile divergent branches.
处理如下:
git config pull.rebase false
注:现在在服务器上测。
3.zero3测速度(二级)
描述:现在用vscode连端口2227上的服务器。测一下速度。
开工:
第一步:测试(三级)
20250107周二时间段:22:33-22:4020250107周二时间段:22:40-23:00
测试出一个问题,应该是ollama的问题,截图如下:
图5a-6
注:用昨天学的debug到内部测一下,看能不能解决。打断点搞一下,找错误的位置。
第二步:改错误(三级)
20250107周二时间段:22:41-23:00
找不到原因啊,一直往里找,但找不到,不知怎么办,估计明天只能找龙哥看了。
想到一个办法,就是把报错的文件全打一遍断点,不成就拉倒,成了最好,报错如下:
'Traceback (most recent call last): 1File "/home/admin/python_projects/ragflow/api/apps/api_app.py", line 484, in stream for ans in res_res_chat: 2 File "/home/admin/python_projects/ragflow/api/db/services/dialog_service.py", line 406, in chat kbinfos = retr.retrieval(" ".join(questions), embd_mdl, dialog.tenant_id, dialog.kb_ids, 1, dialog.top_n, ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^ 3File "/home/admin/python_projects/ragflow/rag/nlp/search.py", line 407, in retrieval sres = self.search(req, index_name(tenant_id), embd_mdl, highlight) ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^ 4File "/home/admin/python_projects/ragflow/graphrag/search.py", line 78, in search s["knn"] = self._vector( ^^^^^^^^^^^^^ 5File "/home/admin/python_projects/ragflow/rag/nlp/search.py", line 68, in _vector qv, c = emb_mdl.encode_queries(txt) ^^^^^^^^^^^^^^^^^^^^^^^^^^^ 6File "/home/admin/python_projects/ragflow/api/db/services/llm_service.py", line 215, in encode_queries emd, used_tokens = self.mdl.encode_queries(query) ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^ 7File "/home/admin/python_projects/ragflow/rag/llm/embedding_model.py", line 232, in encode_queries res = self.client.embeddings(prompt=text, ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^ 8File "/home/admin/python_projects/ragflow/.venv/lib/python3.12/site-packages/ollama/_client.py", line 201, in embeddings return self._request( ^^^^^^^^^^^^^^ 9File "/home/admin/python_projects/ragflow/.venv/lib/python3.12/site-packages/ollama/_client.py", line 74, in _request raise ResponseError(e.response.text, e.response.status_code) from Noneollama._types.ResponseError'注:一个一个打断点。
a.第一个文件(四级)
20250108周三时间段:00:19-00:2020250108周三时间段:00:20-00:40
File "/home/admin/python_projects/ragflow/api/apps/api_app.py", line 484, for ans in res_res_chat:
注:找到这个文件,打下断点。先把断点撤消,干净的情况下再打。
b.第二个文件(四级)
20250108周三时间段:00:24-00:40
File "/home/admin/python_projects/ragflow/api/db/services/dialog_service.py", line 406, in chat kbinfos = retr.retrieval(" ".join(questions), embd_mdl, dialog.tenant_id, dialog.kb_ids, 1, dialog.top_n,注:找到这个文件,打下断点。
c.第三个文件(四级)
20250108周三时间段:00:27-00:40
3File "/home/admin/python_projects/ragflow/rag/nlp/search.py", line 407, in retrieval sres = self.search(req, index_name(tenant_id), embd_mdl, highlight)
注:找到这个文件,打下断点。
c.第四个文件(四级)
20250108周三时间段:00:29-00:40
4File "/home/admin/python_projects/ragflow/graphrag/search.py", line 78, in search s["knn"] = self._vector(
注:找到这个文件,打下断点。
e.第五个文件(四级)
20250108周三时间段:00:31-00:40
5File "/home/admin/python_projects/ragflow/rag/nlp/search.py", line 68, in _vector qv, c = emb_mdl.encode_queries(txt)
注:找到这个文件,打下断点。
f.第六个文件(四级)
20250108周三时间段:00:32-00:40
6File "/home/admin/python_projects/ragflow/api/db/services/llm_service.py", line 215, in encode_queries emd, used_tokens = self.mdl.encode_queries(query)
注:找到这个文件,打下断点。
g.第七个文件(四级)
20250108周三时间段:00:35-00:40
7File "/home/admin/python_projects/ragflow/rag/llm/embedding_model.py", line 232, in encode_queries res = self.client.embeddings(prompt=text,
注:找到这个文件,打下断点。
h.第八个文件(四级)
20250108周三时间段:00:37-00:4020250108周三时间段:00:40-01:00
8File "/home/admin/python_projects/ragflow/.venv/lib/python3.12/site-packages/ollama/_client.py", line 201, in embeddings return self._request(
注:找到这个文件,打下断点。
i.第九个文件(四级)
20250108周三时间段:00:42-01:00
9File "/home/admin/python_projects/ragflow/.venv/lib/python3.12/site-packages/ollama/_client.py", line 74, in _request raise ResponseError(e.response.text, e.response.status_code) from Noneollama._types.ResponseError
注:找到这个文件,打下断点。一共9个文件,打了9个断点,debug试试,看能不能找到问题。
二、生活照片
拍摄于2026年1月3日,13:13:17,老妈过生日,带老妈去外面吃饭时拍的,当时老妈七十岁。年前,和同事聊互联网如何变现,她的思路很活跃,说的点子我闻所未闻,长了很多见识,其中她讲道:跟着我干的90%都是六十多岁的老头老太太,没有经济压力,有的是时间,对互联网不太懂,他们打的金币,我完全可以拿过来换钱,他们也不知道,但我从来没有这样做,不能因为人家不懂就骗人家,那样,生意做不长久的。这一点,我非常认可,君子爱财,取之有道,同事做的很对,老头老太太跟着自己赚钱,该多少是多少,我不骗你,即使你子女来检查,账目很清楚,也说不出来啥,这样生意会越做越好的。
图5b-1
《本文完》