如果是采用client/
server模式启动的chroma
chroma run --path ./data
数据会持久化在data目录
首次使用添加完数据以后
chroma_client = chromadb.HttpClient(host="localhost", port=8000)
embedding_db = Chroma.from_documents(documents,
embedding_cls.get_embedding_fun(),
client=chroma_client,
collection_name="zhidu_db2",
)
第二次使用,直接输入集合名就可以获取(确保chroma服务启动状态)
import chromadb
from langchain_chroma import Chroma
chroma_client = chromadb.HttpClient(host="localhost", port=8000)
zhidu_db = Chroma("zhidu_db2",
embedding_cls.get_embedding_fun(),
client=chroma_client)
如果不采用cs模式,可以本地持久
embedding_db = Chroma.from_documents(documents,
embedding_cls.get_embedding_fun(),
persist_directory='./db',
collection_name="zhidu_db2",
)
第二次使用
zhidu_db = Chroma("zhidu_db2",
embedding_cls.get_embedding_fun(),
persist_directory='./db')