Skip to content
Merged
Show file tree
Hide file tree
Changes from all commits
Commits
File filter

Filter by extension

Filter by extension

Conversations
Failed to load comments.
Loading
Jump to
Jump to file
Failed to load files.
Loading
Diff view
Diff view
144 changes: 72 additions & 72 deletions develop/dev-guide-sample-application-python-peewee.md

Large diffs are not rendered by default.

2 changes: 1 addition & 1 deletion latest_translation_commit.json
Original file line number Diff line number Diff line change
@@ -1 +1 @@
{"target":"release-8.5","sha":"0205ededf901476ea31dcd603f21ab9c9bed3f0d"}
{"target":"release-8.5","sha":"6b3c0fadec1d62f44690ecaafa0ac03d762a2ba9"}
36 changes: 18 additions & 18 deletions tidb-cloud/ai-feature-concepts.md
Original file line number Diff line number Diff line change
@@ -1,50 +1,50 @@
---
title: AI 功能
title: AI Features
summary: 了解 TiDB Cloud 的 AI 功能。
---

# AI 功能

TiDB Cloud 中的 AI 功能使你能够充分利用先进技术进行数据探索、搜索和集成。从自然语言驱动的 SQL 查询生成到高性能向量搜索,TiDB 将数据库功能与现代 AI 功能相结合,为创新应用提供动力。通过支持流行的 AI 框架、嵌入模型以及与 ORM 库的无缝集成,TiDB 为语义搜索和 AI 驱动的分析等用例提供了一个多功能平台
TiDB Cloud AI 功能让你能够充分利用先进技术进行数据探索、搜索和集成。从基于自然语言的 SQL 查询生成,到高性能的向量搜索,TiDB 将数据库能力与现代 AI 功能相结合,为创新应用提供强大动力。TiDB 支持主流 AI 框架、嵌入模型,并可与 ORM 库无缝集成,为语义搜索和 AI 驱动分析等场景提供了多样化的平台

本文档重点介绍这些 AI 功能以及它们如何增强 TiDB 体验
本文档将重点介绍这些 AI 功能,以及它们如何提升 TiDB 的使用体验

## Chat2Query(Beta)

Chat2Query 是集成在 SQL 编辑器中的 AI 驱动功能,可帮助用户使用自然语言指令生成、调试或重写 SQL 查询。更多信息,请参见[使用 AI 辅助的 SQL 编辑器探索数据](/tidb-cloud/explore-data-with-chat2query.md)。
Chat2Query 是集成在 SQL Editor 中的 AI 驱动功能,能够帮助用户通过自然语言指令生成、调试或重写 SQL 查询。更多信息,参见 [Explore your data with AI-assisted SQL Editor](/tidb-cloud/explore-data-with-chat2query.md)。

此外,TiDB Cloud 为 TiDB Cloud Serverless 集群提供 Chat2Query API。启用后,TiDB Cloud 将自动在数据服务中创建一个名为 Chat2Query 的系统数据应用和一个 Chat2Data 端点。你可以调用此端点,通过提供指令让 AI 生成并执行 SQL 语句。更多信息,请参见[开始使用 Chat2Query API](/tidb-cloud/use-chat2query-api.md)。
此外,TiDB Cloud 为 TiDB Cloud Serverless 集群提供了 Chat2Query API。启用后,TiDB Cloud 会自动创建一个名为 Chat2Query 的系统 Data App,以及一个 Data Service 中的 Chat2Data endpoint。你可以调用该 endpoint,通过提供指令让 AI 生成并执行 SQL 语句。更多信息,参见 [Get started with Chat2Query API](/tidb-cloud/use-chat2query-api.md)。

## 向量搜索(Beta)

向量搜索是一种优先考虑数据含义以提供相关结果的搜索方法
向量搜索是一种以数据语义为核心、提供相关性结果的搜索方式

与依赖精确关键词匹配和词频的传统全文搜索不同,向量搜索将各种数据类型(如文本、图像或音频)转换为高维向量,并基于这些向量之间的相似度进行查询。这种搜索方法捕捉数据的语义含义和上下文信息,从而更准确地理解用户意图。
与依赖精确关键词匹配和词频的传统全文搜索不同,向量搜索会将多种数据类型(如文本、图片或音频)转换为高维向量,并基于这些向量之间的相似度进行查询。这种搜索方式能够捕捉数据的语义含义和上下文信息,从而更准确地理解用户意图。

即使搜索词与数据库中的内容不完全匹配,向量搜索仍然可以通过分析数据的语义提供符合用户意图的结果。例如,对"会游泳的动物"进行全文搜索只会返回包含这些确切关键词的结果。相比之下,向量搜索可以返回其他会游泳的动物的结果,如鱼或鸭子,即使这些结果不包含确切的关键词
即使搜索词与数据库中的内容并不完全匹配,向量搜索也能通过分析数据的语义,返回符合用户意图的结果。例如,全文搜索 “a swimming animal” 只会返回包含这些精确关键词的结果。而向量搜索则可以返回其他游泳动物(如鱼或鸭子)的结果,即使这些结果中并不包含完全相同的关键词

更多信息,请参见[向量搜索(Beta)概述](/tidb-cloud/vector-search-overview.md)。
更多信息,参见 [Vector Search (Beta) Overview](/vector-search/vector-search-overview.md)。

## AI 集成

### AI 框架

TiDB 官方支持多个流行的 AI 框架,使你能够轻松地将基于这些框架开发的 AI 应用程序与 TiDB 向量搜索集成。
TiDB 官方支持多种主流 AI 框架,使你能够轻松将基于这些框架开发的 AI 应用与 TiDB 向量搜索集成。

有关支持的 AI 框架列表,请参见[向量搜索集成概述](/tidb-cloud/vector-search-integration-overview.md#ai-frameworks)。
支持的 AI 框架列表,参见 [Vector Search Integration Overview](/vector-search/vector-search-integration-overview.md#ai-frameworks)。

### 嵌入模型和服务
### 嵌入模型与服务

向量嵌入(也称为嵌入)是一个数字序列,用于在高维空间中表示现实世界的对象。它捕捉非结构化数据(如文档、图像、音频和视频)的含义和上下文
向量嵌入(embedding),也称为嵌入,是一组数字序列,用于在高维空间中表示现实世界的对象。它能够捕捉非结构化数据(如文档、图片、音频和视频)的语义和上下文信息

嵌入模型是将数据转换为[向量嵌入](/tidb-cloud/vector-search-overview.md#vector-embedding)的算法。选择合适的嵌入模型对于确保语义搜索结果的准确性和相关性至关重要。
嵌入模型是一类将数据转换为 [vector embeddings](/vector-search/vector-search-overview.md#vector-embedding) 的算法。选择合适的嵌入模型对于确保语义搜索结果的准确性和相关性至关重要。

TiDB 向量搜索支持存储最多 16383 维的向量,可以适应大多数嵌入模型。对于非结构化文本数据,你可以在 [Massive Text Embedding Benchmark (MTEB) 排行榜](https://huggingface.co/spaces/mteb/leaderboard)上找到性能最佳的文本嵌入模型
TiDB 向量搜索支持存储最多 16383 维的向量,能够满足大多数嵌入模型的需求。对于非结构化文本数据,你可以在 [Massive Text Embedding Benchmark (MTEB) Leaderboard](https://huggingface.co/spaces/mteb/leaderboard) 上找到表现最优的文本嵌入模型

### 对象关系映射(ORM)库

对象关系映射(ORM)库是一种工具,通过允许开发人员像处理编程语言中的对象一样处理数据库记录,从而促进应用程序和关系数据库之间的交互
对象关系映射(ORM)库是一类工具,能够让开发者以所选编程语言中的对象形式操作数据库记录,从而简化应用与关系型数据库之间的交互

TiDB 允许你将向量搜索与 ORM 库集成,以便与传统关系数据一起管理向量数据。这种集成对于需要存储和查询 AI 模型生成的向量嵌入的应用程序特别有用。通过使用 ORM 库,开发人员可以无缝地与存储在 TiDB 中的向量数据交互,利用数据库的功能执行最近邻搜索等复杂的向量操作
TiDB 支持将向量搜索与 ORM 库集成,实现对向量数据与传统关系数据的统一管理。这一集成对于需要存储和查询 AI 模型生成的向量嵌入的应用尤为有用。通过使用 ORM 库,开发者可以无缝操作存储在 TiDB 中的向量数据,利用数据库能力执行如最近邻搜索等复杂的向量操作

有关支持的 ORM 库列表,请参见[向量搜索集成概述](/tidb-cloud/vector-search-integration-overview.md#object-relational-mapping-orm-libraries)。
支持的 ORM 库列表,参见 [Vector Search Integration Overview](/vector-search/vector-search-integration-overview.md#object-relational-mapping-orm-libraries)。
66 changes: 33 additions & 33 deletions tidb-cloud/architecture-concepts.md
Original file line number Diff line number Diff line change
Expand Up @@ -5,100 +5,100 @@ summary: 了解 TiDB Cloud 的架构概念。

# 架构

TiDB Cloud 是一个全托管的数据库即服务(DBaaS),它将开源 HTAP(混合事务和分析处理)数据库 [TiDB](https://docs.pingcap.com/tidb/stable/overview) 的灵活性和强大功能带到了 AWS、Azure 和 Google Cloud 平台
TiDB Cloud 是一款全托管的数据库即服务(DBaaS),将开源 HTAP(混合事务与分析处理)数据库 [TiDB](https://docs.pingcap.com/tidb/stable/overview) 的灵活性与强大功能带到 AWS、Azure 和 Google Cloud。

TiDB 兼容 MySQL,这使得迁移和使用现有应用程序变得容易,同时提供无缝扩展能力,可以处理从小型工作负载到大规模高性能集群的各种场景。它在一个系统中同时支持事务处理(OLTP)和分析处理(OLAP)工作负载,简化了运维并实现了实时数据洞察
TiDB 兼容 MySQL,使得迁移和对接现有应用变得简单,同时具备无缝扩展能力,能够应对从小型负载到大规模高性能集群的各种需求。它在同一系统中同时支持事务型(OLTP)和分析型(OLAP)负载,简化运维并实现实时洞察

TiDB Cloud 提供两种部署选项:**TiDB Cloud Serverless**,用于自动扩展、成本效益高的工作负载,以及 **TiDB Cloud Dedicated**,用于具有专用资源和高级功能的企业级应用。TiDB Cloud 让你能够轻松扩展数据库、处理复杂的管理任务,并专注于开发可靠、高性能的应用程序
TiDB Cloud 提供两种部署选项:**TiDB Cloud** **Serverless**,适用于自动弹性伸缩、成本高效的负载,以及 **TiDB Cloud Dedicated**,为企业级应用提供专属资源和高级能力。TiDB Cloud 让你轻松扩展数据库,处理复杂的管理任务,专注于开发可靠且高性能的应用

## TiDB Cloud Serverless

TiDB Cloud Serverless 是一个全托管的无服务器解决方案,提供与传统 TiDB 类似的 HTAP 功能,同时提供自动扩展功能,以减轻用户在容量规划和管理复杂性方面的负担。它包含一个基础使用的免费层级,对超出免费限制的使用采用基于消费的计费方式。TiDB Cloud Serverless 提供两种高可用性选项以满足不同的运维需求
TiDB Cloud Serverless 是一款全托管的无服务器解决方案,提供与传统 TiDB 类似的 HTAP 能力,同时具备自动弹性伸缩,减轻用户在容量规划和管理复杂性方面的负担。它包含一个免费额度,超出免费额度的部分按用量计费。TiDB Cloud Serverless 提供两种高可用性类型,以满足不同的运维需求

默认情况下,使用可用区高可用性选项的集群将所有组件都部署在同一个可用区内,这样可以降低网络延迟
默认情况下,选择 Zonal High Availability 选项的集群,其所有组件都位于同一个可用区,从而带来更低的网络延迟

![TiDB Cloud Serverless 可用区高可用性](/media/tidb-cloud/serverless-zonal-high-avaliability-aws.png)
![TiDB Cloud Serverless zonal high availability](/media/tidb-cloud/serverless-zonal-high-avaliability-aws.png)

对于需要最大基础设施隔离和冗余的应用,区域高可用性选项会将节点分布在多个可用区中
对于需要最大基础设施隔离和冗余的应用,可以选择 Regional High Availability 选项,将节点分布在多个可用区

![TiDB Cloud Serverless 区域高可用性](/media/tidb-cloud/serverless-regional-high-avaliability-aws.png)
![TiDB Cloud Serverless regional high availability](/media/tidb-cloud/serverless-regional-high-avaliability-aws.png)

## TiDB Cloud Dedicated

TiDB Cloud Dedicated 专为关键业务而设计,提供跨多个可用区的高可用性、水平扩展和完整的 HTAP 功能
TiDB Cloud Dedicated 专为关键业务场景设计,提供跨多个可用区的高可用性、水平扩展能力以及完整的 HTAP 能力

它基于隔离的云资源构建,如 VPC、虚拟机、托管 Kubernetes 服务和云存储,充分利用主要云服务提供商的基础设施。TiDB Cloud Dedicated 集群支持完整的 TiDB 功能集,支持快速扩展、可靠备份、在特定 VPC 中部署以及地理级别的灾难恢复
它基于隔离的云资源(如 VPC、VM、托管 Kubernetes 服务和云存储)构建,充分利用主流云服务商的基础设施。TiDB Cloud Dedicated 集群支持完整的 TiDB 功能集,实现快速扩容、可靠备份、在指定 VPC 内部署以及地理级别的灾备能力

![TiDB Cloud Dedicated 架构](/media/tidb-cloud/tidb-cloud-dedicated-architecture.png)
![TiDB Cloud Dedicated Architecture](/media/tidb-cloud/tidb-cloud-dedicated-architecture.png)

## TiDB Cloud 控制台

[TiDB Cloud 控制台](https://tidbcloud.com/)是 TiDB Cloud Serverless 和 TiDB Cloud Dedicated 的基于 Web 的管理界面。它提供了管理集群、导入或迁移数据、监控性能指标、配置备份、设置安全控制以及与其他云服务集成的工具,所有这些都可以在一个用户友好的平台上完成
[TiDB Cloud 控制台](https://tidbcloud.com/) 是 TiDB Cloud Serverless 和 TiDB Cloud Dedicated Web 管理界面。你可以通过它管理集群、导入或迁移数据、监控性能指标、配置备份、设置安全控制,并与其他云服务集成,所有操作都在一个易用的平台上完成

## TiDB Cloud CLI(Beta)

TiDB Cloud CLI`ticloud`)允许你通过简单的命令直接从终端管理 TiDB Cloud Serverless 和 TiDB Cloud Dedicated。你可以执行以下任务
TiDB Cloud CLI,即 `ticloud`,允许你通过简单命令在终端直接管理 TiDB Cloud Serverless 和 TiDB Cloud Dedicated。你可以执行如下任务

- 创建、删除和列出集群。
- 向集群导入数据。
- 从集群导出数据。

更多信息,请参见 [TiDB Cloud CLI 参考](/tidb-cloud/cli-reference.md)。
更多信息,参见 [TiDB Cloud CLI Reference](/tidb-cloud/cli-reference.md)。

## TiDB Cloud API(Beta)

TiDB Cloud API 是一个基于 REST 的接口,提供了对 TiDB Cloud Serverless 和 TiDB Cloud Dedicated 资源进行编程访问的能力。它支持自动化和高效处理任务,如管理项目、集群、备份、恢复、数据导入、计费以及 [TiDB Cloud 数据服务](/tidb-cloud/data-service-overview.md)中的其他资源
TiDB Cloud API 是基于 REST 的接口,提供对 TiDB Cloud Serverless 和 TiDB Cloud Dedicated 资源的编程访问能力。它支持自动化、高效地处理项目、集群、备份、恢复、数据导入、计费以及 [TiDB Cloud Data Service](/tidb-cloud/data-service-overview.md) 中的其他资源管理任务

更多信息,请参见 [TiDB Cloud API 概述](/tidb-cloud/api-overview.md)。
更多信息,参见 [TiDB Cloud API Overview](/tidb-cloud/api-overview.md)。

## 节点

在 TiDB Cloud 中,每个集群由 TiDB、TiKV 和 TiFlash 节点组成。

- 在 TiDB Cloud Dedicated 集群中,你可以根据性能需求完全管理专用 TiDB、TiKV 和 TiFlash 节点的数量和大小。更多信息,请参见[可扩展性](/tidb-cloud/scalability-concepts.md)。
- 在 TiDB Cloud Serverless 集群中,TiDB、TiKV 和 TiFlash 节点的数量和大小是自动管理的。这确保了无缝扩展,无需用户处理节点配置或管理任务
- 在 TiDB Cloud Dedicated 集群中,你可以根据性能需求完全管理专属 TiDB、TiKV 和 TiFlash 节点的数量和规格。更多信息,参见 [Scalability](/tidb-cloud/scalability-concepts.md)。
- 在 TiDB Cloud Serverless 集群中,TiDB、TiKV 和 TiFlash 节点的数量和规格由系统自动管理,实现无缝扩展,无需用户手动配置或管理节点

### TiDB 节点

[TiDB 节点](/tidb-computing.md)是一个无状态的 SQL 层,使用 MySQL 兼容的端点连接应用程序。它处理 SQL 查询的解析、优化和创建分布式执行计划等任务
[TiDB 节点](/tidb-computing.md) 是无状态的 SQL 层,通过兼容 MySQL 的端点与应用连接。它负责解析、优化 SQL 查询,并生成分布式执行计划

你可以部署多个 TiDB 节点以实现水平扩展并管理更高的工作负载。这些节点与负载均衡器(如 TiProxy 或 HAProxy)配合使用,提供无缝接口。TiDB 节点本身不存储数据——它们将数据请求转发到 TiKV 节点进行行式存储或 TiFlash 节点进行列式存储
你可以部署多个 TiDB 节点以实现水平扩展,满足更高的负载需求。这些节点通常与负载均衡器(如 TiProxy 或 HAProxy)配合,提供无缝的访问接口。TiDB 节点本身不存储数据——它们会将数据请求转发给 TiKV 节点(行存储)或 TiFlash 节点(列存储)

### TiKV 节点

[TiKV 节点](/tikv-overview.md)是 TiDB 架构中数据存储的核心,作为分布式事务性键值存储引擎,提供可靠性、可扩展性和高可用性。
[TiKV 节点](/tikv-overview.md) 是 TiDB 架构中数据存储的核心,作为分布式事务型键值存储引擎,具备高可靠性、可扩展性和高可用性。

**主要特性:**

- **基于 Region 的数据存储**

- 数据被划分为多个 [Region](https://docs.pingcap.com/tidb/dev/glossary#regionpeerraft-group),每个 Region 覆盖特定的键范围(左闭右开区间:`StartKey` 到 `EndKey`)。
- 每个 TiKV 节点中共存多个 Region,确保高效的数据分布
- 数据被划分为多个 [Region](https://docs.pingcap.com/tidb/dev/glossary#regionpeerraft-group),每个 Region 覆盖特定的 Key Range(左闭右开区间:`StartKey` 到 `EndKey`)。
- 每个 TiKV 节点内可包含多个 Region,实现高效的数据分布

- **事务支持**

- TiKV 节点在键值层面提供原生分布式事务支持,默认隔离级别为快照隔离。
- TiDB 节点将 SQL 执行计划转换为对 TiKV 节点 API 的调用,实现无缝的 SQL 级事务支持。
- TiKV 节点在键值层面原生支持分布式事务,默认隔离级别为快照隔离(Snapshot Isolation)
- TiDB 节点会将 SQL 执行计划转化为对 TiKV 节点 API 的调用,从而实现无缝的 SQL 级事务支持。

- **高可用性**

- TiKV 节点中的所有数据都会被复制(默认三副本)以确保持久性
- TiKV 确保原生高可用性并支持自动故障转移,防止节点故障
- TiKV 节点中的所有数据都会被复制(默认三副本),以保证数据持久性
- TiKV 原生支持高可用和自动故障转移,保障节点故障时的数据安全

- **可扩展性和可靠性**
- **可扩展性与可靠性**

- TiKV 节点设计用于处理不断扩大的数据集,同时保持分布式一致性和容错性
- TiKV 节点设计用于应对不断扩展的数据集,同时保持分布式一致性和容错能力

### TiFlash 节点

[TiFlash 节点](/tiflash/tiflash-overview.md)是 TiDB 架构中的一种专门存储节点。与普通的 TiKV 节点不同,TiFlash 采用列式存储模型,专为分析加速而设计
[TiFlash 节点](/tiflash/tiflash-overview.md) 是 TiDB 架构中的一种专用存储节点。与普通 TiKV 节点不同,TiFlash 采用列式存储模型,专为分析加速设计

**主要特性:**

- **列式存储**

TiFlash 节点以列式格式存储数据,这使其针对分析查询进行了优化,显著提高了读密集型工作负载的性能
TiFlash 节点以列式格式存储数据,针对分析型查询进行了优化,大幅提升了读密集型负载的性能

- **向量搜索索引支持**
- **向量检索索引支持**

向量搜索索引功能使用表的 TiFlash 副本,支持高级搜索功能,提高复杂分析场景的效率
向量检索索引功能利用表的 TiFlash 副本,实现高级检索能力,并提升复杂分析场景下的效率
Loading