Wrong Model ID privided by ragflow when querying Model #5020

binxushy · 2025-02-17T03:05:45Z

binxushy
Feb 17, 2025

version. 0.15.0.full
we configured the embeddig model with uid:jina-embeddings-v3
why ragflow send the request to model:jina-embeddings-v3-1-0
This issue is not always happened, when we import one pdf in which there is one large table occupaning more than one pages, it might happen.

logs:
2025-02-14 15:02:50,784 INFO 21 set_progress(0bb1afeaea9f11efbed00242ac150003), progress: -1, progress_msg: Page(145~157): [ERROR]Generate embedding error:Error code: 400 - {'detail': '[address=0.0.0.0:54878, pid=140] Model not found, uid: jina-embeddings-v3-1-0'}
2025-02-14 15:02:50,797 ERROR 21 Generate embedding error:Error code: 400 - {'detail': '[address=0.0.0.0:54878, pid=140] Model not found, uid: jina-embeddings-v3-1-0'}
Traceback (most recent call last):
File "/ragflow/rag/svr/task_executor.py", line 461, in do_handle_task
token_count, vector_size = embedding(chunks, embedding_model, task_parser_config, progress_callback)
File "/ragflow/rag/svr/task_executor.py", line 319, in embedding
vts, c = mdl.encode(tts[i: i + batch_size])
File "<@beartype(api.db.services.llm_service.LLMBundle.encode) at 0x7f6f17462680>", line 31, in encode
File "/ragflow/api/db/services/llm_service.py", line 236, in encode
embeddings, used_tokens = self.mdl.encode(texts)
File "<@beartype(rag.llm.embedding_model.XinferenceEmbed.encode) at 0x7f6f1767d2d0>", line 31, in encode
File "/ragflow/rag/llm/embedding_model.py", line 297, in encode
res = self.client.embeddings.create(input=texts[i:i + batch_size], model=self.model_name)
File "/ragflow/.venv/lib/python3.10/site-packages/openai/resources/embeddings.py", line 125, in create
return self._post(
File "/ragflow/.venv/lib/python3.10/site-packages/openai/_base_client.py", line 1260, in post
return cast(ResponseT, self.request(cast_to, opts, stream=stream, stream_cls=stream_cls))
File "/ragflow/.venv/lib/python3.10/site-packages/openai/_base_client.py", line 937, in request
return self._request(
File "/ragflow/.venv/lib/python3.10/site-packages/openai/_base_client.py", line 1041, in _request
raise self._make_status_error_from_response(err.response) from None
openai.BadRequestError: Error code: 400 - {'detail': '[address=0.0.0.0:54878, pid=140] Model not found, uid: jina-embeddings-v3-1-0'}
2025-02-14 15:02:50,799 INFO 21 set_progress(0bb1afeaea9f11efbed00242ac150003), progress: -1, progress_msg: [ERROR]handle_task got exception, please check log
2025-02-14 15:02:50,802 ERROR 21 handle_task got exception for task {"id": "0bb1afeaea9f11efbed00242ac150003", "doc_id": "0830dcecea9f11ef86a60242ac150003", "from_page": 144, "to_page": 156, "retry_count": 0, "kb_id": "b8d7a210e9af11ef81ae0242ac150003", "parser_id": "naive", "parser_config": {"auto_keywords": 0, "auto_questions": 0, "raptor": {"use_raptor": false}, "chunk_token_num": 128, "delimiter": "\n!?;\u3002\uff1b\uff01\uff1f", "layout_recognize": true, "html4excel": false}, "name": "29510-gf0_clean.pdf", "type": "pdf", "location": "29510-gf0_clean.pdf", "size": 2964556, "tenant_id": "8844566eb8f111ef82890242ac150006", "language": "English", "embd_id": "jina-embeddings-v3@Xinference", "pagerank": 0, "img2txt_id": "qwen-vl-max@Tongyi-Qianwen", "asr_id": "paraformer-realtime-8k-v1@Tongyi-Qianwen", "llm_id": "qwen2.5-instruct@Xinference", "update_time": 173[515428883}](mailto:515428883%7d%0dTraceback%20(most%20)
[Traceback (most ](mailto:515428883%7d%0dTraceback%20(most%20)ecent call last):
File "/ragflow/rag/svr/task_executor.py", line 511, in handle_task
do_handle_task(task)
File "/ragflow/rag/svr/task_executor.py", line 461, in do_handle_task
token_count, vector_size = embedding(chunks, embedding_model, task_parser_config, progress_callback)
File "/ragflow/rag/svr/task_executor.py", line 319, in embedding
vts, c = mdl.encode(tts[i: i + batch_size])
File "<@beartype(api.db.services.llm_service.LLMBundle.encode) at 0x7f6f17462680>", line 31, in encode
File "/ragflow/api/db/services/llm_service.py", line 236, in encode
embeddings, used_tokens = self.mdl.encode(texts)
File "<@beartype(rag.llm.embedding_model.XinferenceEmbed.encode) at 0x7f6f1767d2d0>", line 31, in encode

KevinHuSh · 2025-02-17T05:32:45Z

KevinHuSh
Feb 17, 2025
Maintainer

Model not found, uid: jina-embeddings-v3-1-0' is from the embedding model service.
Could you paste the error log of the embedding model service here?

1 reply

binxushy Feb 18, 2025
Author

2025-02-13 23:25:03,575 xinference.core.supervisor 140 ERROR [request cebc2b46-eaa4-11ef-8549-0242ac110008] Leave get_model, error: [address=0.0.0.0:54878, pid=140] Model not found, uid: jina-embeddings-v3-1-0, elapsed time: 0 s
Traceback (most recent call last):
File "/usr/local/lib/python3.10/dist-packages/xinference/core/utils.py", line 78, in wrapped
ret = await func(*args, **kwargs)
File "/usr/local/lib/python3.10/dist-packages/xinference/core/supervisor.py", line 1148, in get_model
return await worker_ref.get_model(model_uid=replica_model_uid)
File "/usr/local/lib/python3.10/dist-packages/xoscar/backends/context.py", line 231, in send
return self._process_result_message(result)
File "/usr/local/lib/python3.10/dist-packages/xoscar/backends/context.py", line 102, in _process_result_message
raise message.as_instanceof_cause()
File "/usr/local/lib/python3.10/dist-packages/xoscar/backends/pool.py", line 659, in send
result = await self._run_coro(message.message_id, coro)
File "/usr/local/lib/python3.10/dist-packages/xoscar/backends/pool.py", line 370, in _run_coro
return await coro
File "/usr/local/lib/python3.10/dist-packages/xoscar/api.py", line 384, in on_receive
return await super().on_receive(message) # type: ignore
File "xoscar/core.pyx", line 558, in on_receive
raise ex
File "xoscar/core.pyx", line 520, in xoscar.core._BaseActor.on_receive
async with self._lock:
File "xoscar/core.pyx", line 521, in xoscar.core._BaseActor.on_receive
with debug_async_timeout('actor_lock_timeout',
File "xoscar/core.pyx", line 524, in xoscar.core._BaseActor.on_receive
result = func(*args, **kwargs)
File "/usr/local/lib/python3.10/dist-packages/xinference/core/utils.py", line 119, in wrapped
ret = func(*args, **kwargs)
File "/usr/local/lib/python3.10/dist-packages/xinference/core/worker.py", line 1014, in get_model
raise ValueError(f"Model not found, uid: {model_uid}")
ValueError: [address=0.0.0.0:54878, pid=140] Model not found, uid: jina-embeddings-v3-1-0
2025-02-13 23:25:03,578 xinference.api.restful_api 1 ERROR [address=0.0.0.0:54878, pid=140] Model not found, uid: jina-embeddings-v3-1-0
Traceback (most recent call last):
File "/usr/local/lib/python3.10/dist-packages/xinference/api/restful_api.py", line 1287, in create_embedding
model = await (await self._get_supervisor_ref()).get_model(model_uid)
File "/usr/local/lib/python3.10/dist-packages/xoscar/backends/context.py", line 231, in send
return self._process_result_message(result)
File "/usr/local/lib/python3.10/dist-packages/xoscar/backends/context.py", line 102, in _process_result_message
raise message.as_instanceof_cause()
File "/usr/local/lib/python3.10/dist-packages/xoscar/backends/pool.py", line 659, in send
result = await self._run_coro(message.message_id, coro)
File "/usr/local/lib/python3.10/dist-packages/xoscar/backends/pool.py", line 370, in _run_coro
return await coro
File "/usr/local/lib/python3.10/dist-packages/xoscar/api.py", line 384, in on_receive
return await super().on_receive(message) # type: ignore
File "xoscar/core.pyx", line 558, in on_receive
raise ex
File "xoscar/core.pyx", line 520, in xoscar.core._BaseActor.on_receive
async with self._lock:
File "xoscar/core.pyx", line 521, in xoscar.core._BaseActor.on_receive
with debug_async_timeout('actor_lock_timeout',
File "xoscar/core.pyx", line 526, in xoscar.core._BaseActor.on_receive
result = await result
File "/usr/local/lib/python3.10/dist-packages/xinference/core/utils.py", line 78, in wrapped
ret = await func(*args, **kwargs)
File "/usr/local/lib/python3.10/dist-packages/xinference/core/supervisor.py", line 1148, in get_model
return await worker_ref.get_model(model_uid=replica_model_uid)
File "/usr/local/lib/python3.10/dist-packages/xoscar/backends/context.py", line 231, in send
return self._process_result_message(result)
File "/usr/local/lib/python3.10/dist-packages/xoscar/backends/context.py", line 102, in _process_result_message
raise message.as_instanceof_cause()
File "/usr/local/lib/python3.10/dist-packages/xoscar/backends/pool.py", line 659, in send
result = await self._run_coro(message.message_id, coro)
File "/usr/local/lib/python3.10/dist-packages/xoscar/backends/pool.py", line 370, in _run_coro
return await coro
File "/usr/local/lib/python3.10/dist-packages/xoscar/api.py", line 384, in on_receive
return await super().on_receive(message) # type: ignore
File "xoscar/core.pyx", line 558, in on_receive
raise ex
File "xoscar/core.pyx", line 520, in xoscar.core._BaseActor.on_receive
async with self._lock:
File "xoscar/core.pyx", line 521, in xoscar.core._BaseActor.on_receive
with debug_async_timeout('actor_lock_timeout',
File "xoscar/core.pyx", line 524, in xoscar.core._BaseActor.on_receive
result = func(*args, **kwargs)
File "/usr/local/lib/python3.10/dist-packages/xinference/core/utils.py", line 119, in wrapped
ret = func(*args, **kwargs)
File "/usr/local/lib/python3.10/dist-packages/xinference/core/worker.py", line 1014, in get_model
raise ValueError(f"Model not found, uid: {model_uid}")

KevinHuSh · 2025-02-18T05:08:11Z

KevinHuSh
Feb 18, 2025
Maintainer

Please refer to this.
Load the model again, maybe.

0 replies

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

InfiniFlow

Wrong Model ID privided by ragflow when querying Model #5020

{{title}}

Replies: 2 comments 1 reply

{{title}}

{{editor}}'s edit

{{editor}}'s edit

{{title}}

{{title}}

Select a reply

InfiniFlow

Wrong Model ID privided by ragflow when querying Model #5020

binxushy Feb 17, 2025

Replies: 2 comments · 1 reply

KevinHuSh Feb 17, 2025 Maintainer

binxushy Feb 18, 2025 Author

KevinHuSh Feb 18, 2025 Maintainer

binxushy
Feb 17, 2025

Replies: 2 comments 1 reply

KevinHuSh
Feb 17, 2025
Maintainer

binxushy Feb 18, 2025
Author

KevinHuSh
Feb 18, 2025
Maintainer