Installation

wget https://huggingface.co/TheBloke/Llama-2-7B-Chat-GGML/resolve/main/llama-2-7b-chat.ggmlv3.q4_0.bin

docker build -t gordon_ramsai .

docker run --gpus all --ipc=host --ulimit memlock=-1 --ulimit stack=67108864 --rm -it -v $HOME/data:/data -p 50031:50031/tcp gordon_ramsai

Step 3 must be run through a vscode terminal to use the proxy

Name		Name	Last commit message	Last commit date
Latest commit History 7 Commits
deploy-llm-project		deploy-llm-project
source_documents		source_documents
.gitignore		.gitignore
.pre-commit-config.yaml		.pre-commit-config.yaml
Dockerfile		Dockerfile
Document ingestion.png		Document ingestion.png
Flowchart.png		Flowchart.png
Flowchart2.png		Flowchart2.png
HuggingFacePipeline.png		HuggingFacePipeline.png
LICENSE		LICENSE
Langchain_Components.png		Langchain_Components.png
README.md		README.md
clone_huggingface_model.png		clone_huggingface_model.png
constants.py		constants.py
docker-compose.yml		docker-compose.yml
example.env		example.env
gpu_installer_cuda.bat		gpu_installer_cuda.bat
gpu_installer_cuda.sh		gpu_installer_cuda.sh
huggingface_phi_clone.png		huggingface_phi_clone.png
ingest.png		ingest.png
ingest.py		ingest.py
privateGPT.png		privateGPT.png
privateGPT.py		privateGPT.py
requirements.txt		requirements.txt
text_splitter.png		text_splitter.png

Provide feedback