Name		Name	Last commit message	Last commit date
parent directory ..
config		config
data		data
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
chatbot.py		chatbot.py
dingding_server.py		dingding_server.py
generate_config.py		generate_config.py
utils.py		utils.py

README.md

Hologres Chatbot

简单快速地用 Hologres 定制专属聊天机器人

简介

目前行业内有两种定制聊天机器人的方式：训练微调（Fine-tuning）与提示词微调（Prompt-tuning）。训练微调是指通过大量数据来训练已有模型，将数据更新体现在大语言模型内的权重中。这种训练耗时长、消耗资源大，并且训练过程充满未知。提供上下文的方法可以使用任意模型作为后端问答API来调用，只是在提问时让系统提供一些相关知识语料，运用大模型的阅读理解与整合能力，做出比语料更贴切的回答。上下文语料与大模型的结合是十分有力的，语料能提供模型没学到过的知识，大模型能给出比语料更加简短、针对问题重点的回答。

我们可以使用任意大模型，接下来要做的就是从海量语料库中提取出最合适的上下文语料。我们通常会使用向量Embedding + 最近邻搜索的方式，将对语料库建立语义索引，构建一个语料库语义搜索引擎。这样在用户提出问题时，就能根据语义找到最相关的上下文。

本代码样例使用Langchain调用Hologres与任意Langchain支持的大模型，快速用语料定制专家聊天机器人。

Hologres

Hologres 是行业领先的一站式实时数据仓库引擎，支持海量数据实时写入、实时更新、实时分析。其向量存储深度集成阿里达摩院的Proxima引擎，能够支持大量、高维向量数据的存储与搜索，提供高性能的向量查询服务。也能与Hologres其他数据类型与索引结合，支持复杂过滤条件的融合查询。

当语料库的规模很大时，建议使用Hologres等专业向量引擎，来降低开发部署成本。

安装依赖

首先安装 Anaconda 或其他Python虚拟环境。

conda create --name chatbot python=3.8
conda activate chatbot

pip install langchain psycopg2-binary torch transformers modelscope bottle

准备 Hologres 向量引擎

在这里快速部署一个Hologres实例。

然后，在控制台查看连接信息。

然后用下面的命令打开设置向导，填写连接信息（user, password, endpoint, dbname等）：

python generate_config.py

之后，你也可以手动修改 config/config.yaml 来更新密钥信息。

生成文字嵌入（text embeddings）

将用于定制的文档资料整理成csv格式（包含title和content两列），放入 data/ 目录中，例如 data/example_data.csv。

然后用下面的命令将数据转换为向量并上传到Hologres。

python chatbot.py -l

开始聊天

python chatbot.py

运行钉钉机器人服务器

python dingding_server.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

holo-chatbot

holo-chatbot

README.md

Hologres Chatbot

简介

Hologres

安装依赖

准备 Hologres 向量引擎

生成文字嵌入（text embeddings）

开始聊天

运行钉钉机器人服务器

更多命令

Files

holo-chatbot

Directory actions

More options

Directory actions

More options

Latest commit

History

holo-chatbot

Folders and files

parent directory

README.md

Hologres Chatbot

简介

Hologres

安装依赖

准备 Hologres 向量引擎

生成文字嵌入（text embeddings）

开始聊天

运行钉钉机器人服务器

更多命令