Приглашаю в Телеграм общаться по это теме: https://t.me/AiExp01
RAG: Local LLM vs GPT-4
see original picture here: https://docs.aws.amazon.com/sagemaker/latest/dg/jumpstart-foundation-models-customize-rag.html
| Сервер | Embeddings | LLM |
|---|---|---|
| ChatGPT | OpenAIEmbeddings | GPT-4 |
| LM Studio | HuggingFaceEmbeddings с моделью 'intfloat/multilingual-e5-large' | IlyaGusev/saiga_mistral_7b_gguf/model-q8_0.gguf |
Notes:
- Подбор Embeddings: https://huggingface.co/spaces/mteb/leaderboard
- Подбор модели: https://huggingface.co/spaces/HuggingFaceH4/open_llm_leaderboard
см. результат в файле Doc\RAG.mhtml
или в файле Doc\output_01.txt output_01.txt
В качестве сервера с LLM (Large language model) используется продукт LM Studio: https://lmstudio.ai/
На текущий момент чтобы найти версию под Linux, нужно к ним на Discord зайти и дать согласие на beta, тогда в чате видна ветка linux-beta-2

Приглашаю в Телеграм общаться по это теме: https://t.me/AiExp01


