diff --git a/4th/4th_ai_powered_ops/task_1.md b/4th/4th_ai_powered_ops/task_1.md new file mode 100644 index 0000000..a6202b2 --- /dev/null +++ b/4th/4th_ai_powered_ops/task_1.md @@ -0,0 +1,22 @@ +# 第一次任务 (发布于 2025-07-17) + +## 个人任务 +1. 本地开发环境的搭建 + - 产出:开发第一个demo程序,并可运行。 +2. 熟悉1个运营场景的问题定位链路 + - 了解运维场景的调研路径,了解Prometheus、Superset平台、实例机器登陆日志查询 + - 产出:运营场景分析链路记录。 + +## 团队任务 +1. 深度调研如何用好AI编程工具 + - 参考文档: + - https://yuanchuangai.com/#/tips/cursor/promote + - https://news.qq.com/rain/a/20250624A023IF00 + - 产出: + - AI编程工具使用说明文档 +2. 数据平台拉取小程序 + - 产出: + - 拉取Prometheus、Superset平台数据的demo程序 +3. 运维场景深入调研 + - 产出: + - 2个典型应用场景的分析链路说明 \ No newline at end of file diff --git a/4th/4th_ai_powered_ops/task_2.md b/4th/4th_ai_powered_ops/task_2.md new file mode 100644 index 0000000..6fde1d0 --- /dev/null +++ b/4th/4th_ai_powered_ops/task_2.md @@ -0,0 +1,18 @@ +# 第二次任务 + +## 团队任务 +1. MCP数据拉取 + 1. 实现prometheus和superset的数据抓取功能,并封装为mcp服务 + 2. 和算法同学对齐数据格式 + 3. 学习现有的较完善mcp协议代码,重构自身代码,提高可读性和可扩展性 + 4. 跟进其他方向成员的方向,了解业务需求,提出初步的接口设计方案 +2. 数据预处理 + 1. 算法调研与选型。收集时间序列数据异常值检测算法,需要涵盖统计模型、机器学习、深度学习。标注每类算法适用的异常类型与场景,最后给出3种可能最适合的算法。 + 2. 数据工程与特征分析。从Prometheus或Superset拉取历史数据,例如CPU、内存、磁盘IO等关键指标,至少包含2个业务周期。 +3. Agent框架 + 1. 调研agent框架,了解各agent框架的特征,给出适应性场景与思考 + 2. 根据运维场景,初步构建demo版本的agent框架设计,进行框架搭建并测试 +4. 知识库构建 + 1. 深入调研当前知识库搭建的主流技术、主流模式,了解它的应用场景,并记录自己的思考,产出调研文档 + 1. 对知识图谱基本作用、数据结构、使用方式等进行详细深入了解,记录进调研文档。需要进一步打开思路,完整的调研主流技术 + 2. 了解运维场景,初步形成知识库的构成部分、确定适合运维场景的知识库搭建模式 \ No newline at end of file diff --git a/4th/4th_ai_powered_ops/topic.md b/4th/4th_ai_powered_ops/topic.md new file mode 100644 index 0000000..f116f24 --- /dev/null +++ b/4th/4th_ai_powered_ops/topic.md @@ -0,0 +1,16 @@ +智能运维 - 利用大模型实现智能监控与告警根因分析 + +### 目标 + +利用最新的AI大模型能力开发智能运维系统,实现: +- 指标巡检与指标异常辨识 +- 线上问题下钻分析、 +- 定期生成指标数据报表 + +实现及时发现潜在问题,更快定位运维问题根因 + +### 阶段任务 + +查看本目录下的 `task_*.md` + +### 相关信息 \ No newline at end of file