Getting Started

Install the dependencies and run the project


npm install
npm start

Creating embeddings
https://platform.openai.com/docs/api-reference/embeddings

Vector Databases

instead of looking for exact matches,
they use a similarity matches about the meaning of the words and phrases to find the vectors more similars

chroma pinecone supabase

Store vector embeddings / set up vector database

https://supabase.com/

postgres pgvector

enable pgvector extension in supabase
copy url postgres

https://supabase.com/blog/openai-embeddings-postgres-vector

create table documents (
  id bigserial primary key,
  content text,
  embedding vector(1536)
);

https://supabase.com/dashboard/project/enhchksytrfzdigyjodl/editor/17578

to run each js file node <name-js-file>.js

Semantic search

seaching by meaning and relationships

https://supabase.com/docs/guides/ai/vector-columns

create or replace function match_documents (
  query_embedding vector(384),
  match_threshold float,
  match_count int
)
returns table (
  id bigint,
  title text,
  body text,
  similarity float
)
language sql stable
as $$
select
  documents.id,
  documents.title,
  documents.body,
  1 - (documents.embedding <=> query_embedding) as similarity
from documents
where 1 - (documents.embedding <=> query_embedding) > match_threshold
order by (documents.embedding <=> query_embedding) asc
limit match_count;
$$;

Chunking text from documents

langchang

npm install @langchain/core @langchain/langgraph @langchain/openai @langchain/community

https://js.langchain.com/docs/introduction/

shorter chunks captures precise meanings but it might miss wider context longer chunks grasp more context but can produce too broad a scope of information

optimize for the smallest size without losing context

6 challenge

-- Create a table to store your documents

create table movies (
  id bigserial primary key,
  content text, -- corresponds to Document.pageContent
  metadata jsonb, -- corresponds to Document.metadata
  embedding vector(1536) -- 1536 works for OpenAI embeddings, change if needed
);

-- Create a function to search for documents

create or replace function match_movies (
  query_embedding vector(1536),
  match_threshold float,
  match_count int
)
returns table (
  id bigint,
  content text,
  similarity float
)
language sql stable
as $$
select
  movies.id,
  movies.content,
  1 - (movies.embedding <=> query_embedding) as similarity
from movies
where 1 - (movies.embedding <=> query_embedding) > match_threshold
order by similarity desc
limit match_count;
$$;

RAG

retrieval -> generation

Name		Name	Last commit message	Last commit date
Latest commit History 5 Commits
node_modules		node_modules
.DS_Store		.DS_Store
.gitignore		.gitignore
2storeVectorEmbeddings.js		2storeVectorEmbeddings.js
3Query-embeddings-using-similarity-search.js		3Query-embeddings-using-similarity-search.js
4Create-a-conversational-response-using-OpenAI.js		4Create-a-conversational-response-using-OpenAI.js
5langchainEx.js		5langchainEx.js
6challenge.js		6challenge.js
6movies.txt		6movies.txt
7Query_database_and_manage_multiple_matches.js		7Query_database_and_manage_multiple_matches.js
8AI_chatbot_proof_of_concept.js		8AI_chatbot_proof_of_concept.js
README.md		README.md
config.js		config.js
image-1.png		image-1.png
image-10.png		image-10.png
image-11.png		image-11.png
image-2.png		image-2.png
image-3.png		image-3.png
image-4.png		image-4.png
image-5.png		image-5.png
image-6.png		image-6.png
image-7.png		image-7.png
image-8.png		image-8.png
image-9.png		image-9.png
image.png		image.png
index.css		index.css
index.html		index.html
index.js		index.js
langchainpodcast.txt		langchainpodcast.txt
package-lock.json		package-lock.json
package.json		package.json
vite.config.js		vite.config.js

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Getting Started

Vector Databases

Store vector embeddings / set up vector database

Semantic search

Chunking text from documents

6 challenge

RAG

About

Uh oh!

Releases

Packages

Uh oh!

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

Getting Started

Vector Databases

Store vector embeddings / set up vector database

Semantic search

Chunking text from documents

6 challenge

RAG

About

Topics

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Uh oh!

Contributors

Uh oh!

Languages

Packages